Классические маркёры, корреляция которых с картами 1, 2 или 3 главных компонент превышает 0.4 (г>0.4)
Первая главная компонента описывает 22 % общей изменчивости классических маркёров, вторая — 15 %, третья — 14 %. Таким образом, первые три главных компоненты описывают половину всей общей изменчивости всех 35 исходных признаков классических маркёров. Первые пять главных компонент отражают уже две трети (67 %) общей дисперсии (четвёртая компонента — 10 %, пятая — 7 %). Первые десять главных компонент отражают 90 % общей дисперсии. Первые пятнадцать главных компонент описывают уже практически всю общую дисперсию — 98 %. Столь резкий перепад между вкладами первых компонент и отражение ими основной дисперсии всех изученных признаков указывает на высокую эффективность метода главных компонент при изучении карт классических маркёров.
При анализе антропологических данных на долю первой компоненты нередко приходится до 60 % и более общей дисперсии, что определяется высокой корреляцией между самими признаками [Дерябин, 2001]. Но при анализе большой совокупности нескорре-лированных генетических маркёров 20 % изменчивости, падающей на первую компоненту, является достаточно высоким показателем, указывающим на информативность применения компонентного анализа [Cavalli-Sforza et al., 1994]. Дело в том, что большинство антропологических признаков связаны между собой внутригрупповой корреляцией (понятно — большой рост и длинные ноги). Для классических маркёров (несцепленных локусов) подобные связи не существуют. Надо только отличать внутригруппповые корреляции от межгрупповых. Примером межгрупповой корреляции может быть связь между курчавыми волосами и темной кожей: единственное, что связывает эти признаки — это то, что они оба они встречаются в популяциях негроидов. Межгрупповые корреляции создаются не физиологией, не анатомией, а историей или экологией, и поэтому могут быть выявлены между любыми признаками, связанными исторической судьбой.
Малость ареала, в котором изображены главные компоненты (
Однако если эти три локуса изучены в среднем по 120 русским популяциям, то остальные локусы — в среднем лишь по 21 популяции, и ареал, по которому они разбросаны, намного уже. Если бы мы включили в анализ главных компонент всю территорию, мы бы опирались на ненадежный картографический прогноз, а это опасно. Поэтому при добавлении каждого нового гена «средняя» карта надёжности, как шагреневая кожа, сокращалась в размере, пока не приобрела тот небольшой ареал, который мы видим на
ПЕРВЫЙ СЦЕНАРИЙ.
Классические маркёры (
Рис. 5.3.2. Карта первой главной компоненты изменчивости русского генофонда по классическим маркерам.
Самый главный сценарий изменчивости русских популяций представлен картой первой главной компоненты. Он отражает изменчивость наибольшего числа карт отдельных маркёров (22 % общей дисперсии) и потому является главным сценарием русского генофонда. В отличие от сложного рельефа карт отдельных маркёров, мы видим простую и четкую закономерность: значения постепенно изменяются от северных к южным русским популяциям. Таким образом, для русского генофонда оказывается характерна в первую очередь широтная изменчивость по оси «юг-север».
Напомним, что ось «юг-север» указывает только на ось и ничего не говорит о направлении изменчивости: с тем же правом мы можем дать этой оси имя «север-юг». Это связано с тем, что главные компоненты — это новые синтетические признаки, и меняются они от «минус бесконечности» до «плюс бесконечности», а их средняя равна нулю. К тому же ещё и каждый из этих «полюсов бесконечности» с равным правом может быть обозначен как «плюс» или «минус». Поэтому понятие минимальных или максимальных значений для главных компонент является чистой условностью. Сами главные компоненты ничего не могут сказать и о направлении миграций — для этого надо привлекать данные других наук, а также смотреть, с какими признаками каждая из главных компонент более всего связана (см.