Но тут обычно рождается вопрос. Мы сказали, что для расчёта региональной частоты нужно усреднить этнические частоты. Но разве нельзя усреднить частоты в локальных популяциях? Разве нельзя получить среднюю частоту региона Восточная Европа как среднюю частоту по всем изученным локальным популяциям этого региона? Рассчитаем её: суммируем 0.1 (Хмельницкая область) + 0.2 (Львовская) + 0.1 (Ивано-Франковская) + 0.3 (Полтавская) + 0.3 (Черкасская) + 0.6 (аукшайты) + 0.4 (жемяйты) + 0.6 (ненцы) + 0.8 (ненцы) и разделим на число популяций (9). Мы видим, что полученная величина — частота 0.38 — заметно отличается от первой оценки (0.47). Какая же оценка правильней? Конечно же, первая — рассчитанная по этническим частотам. Почему?
Подробно этот вопрос разбирается в
Итак, рассчитывая среднюю частоту на каждом последующем уровне, мы усредняем частоты в популяциях предыдущего уровня. Средняя частота по Восточной Европе — это средняя по этническим частотам (а не по локальным популяциям), средняя по Северной Евразии — это средняя по региональным частотам (а не по этническим) и так далее.
ОТ МЕНЬШЕЙ МАТРЁШКИ — К БОЛЬШЕЙ: РАСЧЕТ ДИСПЕРСИИ
Для региона мы также должны рассчитать не только среднюю, но и показатель межпопуляционной изменчивости. И тут мы сталкиваемся с чрезвычайно полезным аддитивным свойством GST
: изменчивость, рассчитанную для разных уровней, можно суммировать! Рассмотрим получившуюся систему.В нашем примере Восточная Европа состоит из украинцев, литовцев и ненцев. Но украинцы, в свою очередь, состоят из пяти популяций, со своей величиной внутри-украинской изменчивости между этими пятью популяциями; литовцы состоят из двух популяций, со своей внутри-литовской изменчивостью, ненцы состоят из двух популяций, со своей внутри-ненецкой изменчивостью. Усреднив эти три показателя внутриэтнической изменчивости, мы получим среднюю величину изменчивости — внутри «среднего» восточноевропейского народа. Теперь суммируем эту величину (изменчивость на внутриэтническом уровне) и изменчивость межэтническую (между средними частотами у украинцев, литовцев, и ненцев) и получим общую изменчивость Восточной Европы.
Важно лишь всегда отслеживать, по каким частотам рассчитана изменчивость региона. И если она рассчитана по этническим частотам, то необходимо понимать, что мы имеем лишь часть (межэтническую часть) региональной изменчивости (
ЕСЛИ НАРОД ИЗУЧЕН ТОЛЬКО ПО ОДНОЙ ПОПУЛЯЦИИ
В нашем примере у нас было по несколько изученных популяций на каждый народ. Но бывает, что таких подробных данных нет. Допустим, в дополнение к имеющимся, появились данные по одной популяции удмуртов (частота q=0.6). Тогда среднеэтническая для удмуртов, очевидно, останется той же — 0.6. Но как быть с дисперсией? Формально, мы должны приписать удмуртам нулевую внутриэтническую изменчивость. Хотя понятно, что как только появятся данные по ещё одной популяции удмуртов, у них появится ненулевая внутриэтническая изменчивость (обнаружатся генетические различия между этими популяциями). Но пока таких данных нет, изменчивость удмуртов остается «условно-нулевой», и если мы теперь учтем удмуртов при расчёте средней внутриэтнической изменчивости, мы занизим эту величину за счёт «условно-нулевых» удмуртов. И если в наших данных многие народы будут изучены лишь по одной популяции, эта особенность данных сильно исказит результат. Поэтому мы пользуемся правилом — популяции, представленные единственной субпопуляцией, не учитываются при анализе GST
.ПРЫГАЯ ЧЕРЕЗ ОДНУ «МАТРЁШКУ»