Читаем Русский генофонд на Русской равнине полностью

Поясним ещё одним примером — реальным. Авторитетный исследователь[79] изучил один из коренных народов Сибири, и получил величину различий между популяциями этого народа FST(данного этноса)≈9. Много это или мало? Чтобы ответить на этот вопрос, он сравнил с величиной изменчивости популяций Сибири FST(Сибири)≈11. И сделал вывод, что различия популяций этого этноса несколько меньше, чем это принято в Сибири, но, в общем-то, такие же, как для других сибирских народов. Но вся беда в том, что та величина, с которой он сравнивал свой единственный этнос, FST(Сибири)≈11, охватывает популяции не одного этноса, а все популяции всех этносов Сибири! Иными словами, в эту величину (FST(Сибири)≈11) уже вошли не только различия между популяциями усредненного сибирского этноса, но и различия между всеми народами всей Сибири. На рисунке рис. 4.1. мы видим, что средняя гетерогенность сибирского этноса (различия между популяциями одного «усредненного» народа Сибири) составляет треть от FST(Сибири)≈11, то есть примерно FST(среднего этноса)≈3. Это означает, что народ, изученный этим исследователем, обладает уникально огромными различиями между популяциями — в три раза большими, чем для среднего этноса Сибири! Что требует специальных исследований и объяснений. Налицо совершенно неверный вывод — гетерогенность этого сибирского этноса (на изучение которого было потрачено столько сил!) вовсе не меньше среднего по Сибири (как заключил автор), а в три раза больше «нормы»! И столь ошибочный вывод был сделан лишь потому, что автор забыл об уровнях популяционной иерархии.

Ошибка FST, заданная неправильной организацией материала, столь велика, что сопоставление генофондов теряет всякий смысл: FST зависит уже не от свойств генофонда, а лишь от соотношения этносов и локальных популяций в выборке. Если наиболее изученные регионы (или гены) исследованы на уровне локальных популяций, а менее изученные — на уровне этносов, то оценки FST(i) — только за счет выборки популяций — для наиболее изученных объектов будут на треть-две трети больше, чем для слабо изученных. В этом случае сравнение регионов (или генов) будет отражать только ошибку в организации данных, а не особенности генофонда. Сравнительное изучение дифференциации региональных генофондов или разных генов в этом случае проблематично: оценки абсолютно ненадёжны, независимо от того, каковы статистические оценки их достоверности.

Поэтому, сравнивая дифференциацию разных генов FST(i) при анализе одного и того же генофонда, мы должны включать в анализ популяции одного и того же иерархического уровня. Когда мы переходим к сравнению генофондов разных регионов, то здесь добавляется ещё одно требование: иерархические уровни самих регионов, самих тотальных популяций должны быть идентичны.

Например, корректно сравнивать по величине дифференциации (FST) генофонды таких регионов, как Европа, Сибирь и Америка — они находятся на одном иерархическом уровне. Можно сравнивать субрегионы — генофонды Средней Сибири и Северной Европы — они также находятся на одном иерархическом уровне (субрегионов). Но нельзя сравнивать субрегион с регионом — например, Среднюю Сибирь с Европой в целом, считая их равноценными партнерами сравнения, забывая об их иерархии. Это наглядно видно из сравнения рис. 4.1. и 4.2. — легко рассчитать, что дифференциация FST Сибири в два раза больше, чем дифференциация её субрегионов. Значит, сравнивая Среднюю Сибирь и Европу, мы сравниваем «половинку» с «целым», приравниваем их. Что же сказать о таких сравнениях, как дифференциация отдельного этноса и региона в целом? В этом случае малая часть (треть или даже четверть) как бы приравнивается к целому! Выводы таких сравнений — а их немало в популяционных публикациях — содержат столь крупную методическую ошибку, что она сводит на нет все усилия авторов. Иными словами, сравнение популяций разных иерархических уровней содержит в себе очень серьёзную ошибку и приводит к заведомо неверным результатам, если при интерпретации мы забываем о разном «ранге» сравниваемых популяций.

ТРЕБОВАНИЕ ВТОРОЕ: ПОЛИМОРФИЗМ ГЕНЕТИЧЕСКИХ МАРКЕРОВ

Это требование налагает запрет на включение в анализ редких аллелей.

Надёжность эмпирических оценок FST(i) зависит от уровня полиморфизма изучаемых генов. Эта важно учитывать при оценке селективных сил, поскольку при низком уровне полиморфизма (то есть если частота аллеля близка к 0 или 1) динамика частот генов «будет независима не только от далекого прошлого, но, возможно, и от недавней истории процесса отбора» [Левонтин, 1978].

Перейти на страницу:

Похожие книги