Это совершенно ненаучная постановка вопроса, опять «по понятиям», по «мнениям», ни на чем не основанным. На это можно задать встречный вопрос, который уже был задан выше в настоящей книге – чтобы понять, что море соленое, нужно ли пробовать воду из всех бухточек? А как же химики делают анализ растворов, беря пробу всего лишь в долю миллилитра из ведра, цистерны, озера? Когда делают анализ крови, что, всю кровь из вас выкачивают? Нет. Значит, вопрос о размере пробы поставлен некорректно. Вопрос на самом деле сводится не к каким-то с потолка взятым числам, а к к тому, равномерно ли перемешана система, чтобы по малой пробе, или выборке, судить о всей системе. Этот вопрос в ДНК-генеалогии давно проработан, и результаты сопоставительных исследований показаны, например, в следующей таблице:
Таблица. История определений времени до общего предка гаплогруппы R1a на «пост-советском пространстве» по разным сериям гаплотипов.
[52]Из таблицы видно, что при последовательном переходе от серии из 26 гаплотипов до 2000 гаплотипов, и при увеличении числа мутаций в них в двести с лишним раз расчетное время до общего предка этих гаплотипов, в данном случае проживавшего на Русской равнине около пяти тысяч лет назад, получается практически одинаковым, в пределах погрешности расчетов. Это значит, что гаплотипы гаплогруппы R1a на пост-советском пространстве перемешаны достаточно хорошо, и все выборки вполне репрезентативны.
Конечно, могут быть и другие ситуации. Например, в горах в каждой долине состав гаплотипов (и гаплогрупп/субкладов) может заметно различаться, в отличие от того, что может наблюдаться на равнине, где гаплотипы более перемешаны за тысячелетия. Но в любом случае расчеты и выводы по гаплотипам относятся только к той конкретной выборке, которая рассматривалась, и только сопоставление разных выборок может показать, насколько система «перемешана», и решить вопрос об обобщении результатов расчетов и выводов на всю популяцию региона, или только ее конкретную часть. Но пока репрезентативность разных выборок наблюдается и в горах. Например, разные выборки осетин и карачаево-балкарцев дают воспроизводимые результаты для каждого из этих этносов. Перемешивание между ними обнаружено, но очень незначительное, практически не влияющее на результаты расчетов.
В большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они устойчивы к статистическим вариациям, если популяция достаточно перемешана и выборка произведена неупорядочено. Размер выборки увеличивает точность, и то только до определенных пределов. Это, повторяем, относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.
Вопрос 41: Что такое «деревья гаплотипов» в ДНК-генеалогии?
По ходу изложения мы будем показывать деревья гаплотипов, которые отражают ДНК-картину этносов, родов, племен. Это вовсе не значит, что гаплотипы определяют этнос. Но они его в определенной степени описывают, каждый этнос по-разному. Человеку непривычному эти деревья представляются некими абстрактными образованиями, но в них на самом деле заключен большой смысл и в их графическом виде дается большой объем информации. Для того чтобы сделать деревья в этой книге более понятными и осмысленными, приведем несколько вводных, «модельных» примеров.
Рис. 7. Дерево, состоящее из 68 гаплотипов гаплогруппы R1a в их 6-маркерном формате. Базовый гаплотип здесь 13 25 15 11 12 11 (в системе DYS 393, 390, 19, 391, 388, 392). Базовые гаплотипы образуют «гребенку» на дереве.
На рисунке выше приведено дерево реальной выборки из 68 гаплотипов гаплогруппы R1a. Гаплотипы простенькие, 6-маркерные, общий предок всех жил всего 625 лет назад, так что мутаций в гаплотипах набежало мало. Можно даже заранее посчитать, сколько. Это дерево гаплотипов потомков Джона, Лорда Британских островов, который жил в 14-м веке и умер в 1386 году. Его потомки – известный шотландский клан Мак-Доналдов (один из Мак-Доналдов был маршалом у Наполеона). Константа скорости мутации для 6-маркерных гаплотипов равна 0.0074 мутаций на гаплотип на условное поколение в 25 лет. Тогда за 625 лет (25 условных поколений) в каждом гаплотипе набежит 0.0074х25 = 0.185 мутаций, и на все 68 гаплотипов будет 0.185х68 = 13±4 мутаций. Погрешность рассчитывается по обычным правилам математической статистики.
Александр Николаевич Петров , Маркус Чаун , Мелисса Вест , Тея Лав , Юлия Ганская
Любовное фэнтези, любовно-фантастические романы / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научная литература / Самиздат, сетевая литература / Любовно-фантастические романы