Поясним ещё одним примером — реальным. Авторитетный исследователь[79]
изучил один из коренных народов Сибири, и получил величину различий между популяциями этого народа FST(данного этноса)≈9. Много это или мало? Чтобы ответить на этот вопрос, он сравнил с величиной изменчивости популяций Сибири FST(Сибири)≈11. И сделал вывод, что различия популяций этого этноса несколько меньше, чем это принято в Сибири, но, в общем-то, такие же, как для других сибирских народов. Но вся беда в том, что та величина, с которой он сравнивал свой единственный этнос, FST(Сибири)≈11, охватывает популяции не одного этноса, а все популяции всех этносов Сибири! Иными словами, в эту величину (FST(Сибири)≈11) уже вошли не только различия между популяциями усредненного сибирского этноса, но и различия между всеми народами всей Сибири. На рисункеОшибка FST
, заданная неправильной организацией материала, столь велика, что сопоставление генофондов теряет всякий смысл: FST зависит уже не от свойств генофонда, а лишь от соотношения этносов и локальных популяций в выборке. Если наиболее изученные регионы (или гены) исследованы на уровне локальных популяций, а менее изученные — на уровне этносов, то оценки FST(i) — только за счет выборки популяций — для наиболее изученных объектов будут на треть-две трети больше, чем для слабо изученных. В этом случае сравнение регионов (или генов) будет отражать только ошибку в организации данных, а не особенности генофонда. Сравнительное изучение дифференциации региональных генофондов или разных генов в этом случае проблематично: оценки абсолютно ненадёжны, независимо от того, каковы статистические оценки их достоверности.Поэтому, сравнивая дифференциацию разных генов FST(i)
при анализе одного и того же генофонда, мы должны включать в анализ популяции одного и того же иерархического уровня. Когда мы переходим к сравнению генофондов разных регионов, то здесь добавляется ещё одно требование: иерархические уровни самих регионов, самих тотальных популяций должны быть идентичны.Например, корректно сравнивать по величине дифференциации (FST
) генофонды таких регионов, как Европа, Сибирь и Америка — они находятся на одном иерархическом уровне. Можно сравнивать субрегионы — генофонды Средней Сибири и Северной Европы — они также находятся на одном иерархическом уровне (субрегионов). Но нельзя сравнивать субрегион с регионом — например, Среднюю Сибирь с Европой в целом, считая их равноценными партнерами сравнения, забывая об их иерархии. Это наглядно видно из сравненияТРЕБОВАНИЕ ВТОРОЕ: ПОЛИМОРФИЗМ ГЕНЕТИЧЕСКИХ МАРКЕРОВ
Это требование налагает запрет на включение в анализ редких аллелей.
Надёжность эмпирических оценок FST(i)
зависит от уровня полиморфизма изучаемых генов. Эта важно учитывать при оценке селективных сил, поскольку при низком уровне полиморфизма (то есть если частота аллеля близка к 0 или 1) динамика частот генов «