Мы видим, что на рис. 62 карачаевцы уходят далеко от всех. Самих данных в публикациях нет, число обследованных человек неизвестно, в таблицах в работе, где приведен этот график, карачаевцы вообще не упомянуты. Как объясняет автор это резкое отклонение? Вы не поверите, но вероятным происхождением от алан. Цитата:
Смотрим в таблицы. Аланы есть (Дмитровская, Подонье), есть частота бугорка Карабелли (43.7 %), есть «1 компонент» (0.2), есть «2 компонент» (-0.6), но нет карачаевцев и осетин[197]
. А там где есть карачаевцы и осетины (см. рис. 62), нет алан, сравнить невозможно. И сами значения «компонент» на каждой диаграмме разные, на рис. 62 осетины имеют координаты «1 компонент» (-0.2), «2 компонент» (1.6), а на рис. 63 они имеют «1 компонент» (1.2), «2 компонент» (0.2). И пояснений нет, почему так. Но на рис. 63 (см. ниже) мы видим, что осетины вовсе не стоят особняком, они в группе с таджиками, азербайджанцами, греками, рачинцами Грузии. На рис. 64 ситуация опять поменялась, осетины все еще с азербайджанцами и рачинцами, но греки и таджики ушли далеко. То есть «похожесть» при таком подходе величина переменная. Это, конечно, не способствует надежности анализа, поскольку при случайной суперпозиции факторов в «компонентах» можно получить на диаграмме что угодно.Поясню. Похожесть есть похожесть, если использовать это как основной критерий. Она должна быть воспроизводимой, иначе это не похожесть. Если, например, у алан частота бугорка Карабелли совпадает с таковой у некой кавказской популяции, но у алан полно промежутков между зубами, а у той кавказской популяции зубы превосходные, то при одной комбинации факторов они с этой популяцией похожи, при другой комбинации они расходятся. Ясно, что с прямым происхождением этой популяции от алан уже проблемы. Иначе говоря, совпадение ряда признаков может быть случайным, а мы ищем системную похожесть. Не может быть так, чтобы при построении в одной диаграмме две популяции похожи, а в другой диаграмме эти две популяции разные, а мы все равно считаем их системно «похожими». А что если бы первую диаграмму не построили? Или не построили бы вторую? Или построили бы одну третью? Во всяком случае, это должно обсуждаться и оговариваться, и выдвигаться в виде альтернативных предположений и гипотез. Именно потому метод PCA, или «метод главных компонент» критикуется многими специалистами, и рассматривается по аналогии со сравнением средних температур по больницам.
Рис. 63. Положение изученных популяций Евразии в пространстве первой и второй главных компонент (Автореферат дисс. докт. биологических наук В.Ф. Кашибадзе). Примечание: горизонтальная ось (1 компонента) из источника не копируется. Диапазон значений там от -4 (слева)до +4 (справа).
Рис. 64. Положение изученных популяций Евразии в пространстве первой и третьей главных компонент (Автореферат дисс. докт. биологических наук В.Ф. Кашибадзе). Примечание: горизонтальная ось (1 компонента) из источника не копируется. Диапазон значений там от -4 (слева)до +4 (справа).
Александр Николаевич Петров , Маркус Чаун , Мелисса Вест , Тея Лав , Юлия Ганская
Любовное фэнтези, любовно-фантастические романы / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научная литература / Самиздат, сетевая литература / Любовно-фантастические романы