Поскольку число маркерах в гаплотипах достигает – для обычно используемых гаплотипов в ДНК-генеалогии – 111, то в каждом маркере за определенное число лет от общего предка накапливается определенное среднее количество мутаций. Например, в серии из 968 гаплотипов гаплогруппы I1 за 3690±370 лет, прошедшие от общего предка современных носителей гаплогруппы, в маркере DYS19 накопилось 263 мутации. При известной константе скорости мутации для маркера DYS19, полученной независимым путем и усредненной по всем выборкам и по всем гаплогруппам, и равной 0.00179 мутаций на маркер за условное поколение, получаем, что общий предок жил примерно 263/968/0.00179 = 152 условных поколений назад, или примерно 152x25 = 3800 лет назад. Как видим, это в пределах погрешности измерений, поскольку величина 3690±370 лет, показанная выше, была рассчитана по всем 968 гаплотипам в 111-маркерном формате. Мы постоянно пишем «примерно», потому все такие расчеты носят статистический характер. Даже 263 мутации, полученные прямым путем, все равно «примерные», и по законам статистики имеют погрешность ±6.2 %, что дает 263±16 мутаций, и это при щадящей достоверности в одну «сигма», то есть с надежностью 68 %. При надежности в 95 % это было бы 263±32 мутации. Далее, при расчетах по всем гаплотипам поправка на возвратные мутации вводилась, а при расчетах по одному маркеру она для простоты не вводилась. Наконец, величина константы скорости мутации (0.00179 мутаций на маркер за условное поколение) тоже определена с определенной погрешностью. Все это заставляет для корректности писать «примерно».
Еще пример, для особенно древнего общего предка, на этот раз гаплогруппы I2, который жил 9575±960 лет назад. В маркере DYS426 в серии из 244 гаплотипов накопилось всего 8 мутаций, поскольку это один из самых «медленных» маркеров, его константа скорости мутации равна 0.00009 мутаций на маркер за условное поколение. Получаем, что общий предок жил примерно 8/244/0.00009 = 364 условных поколений назад, или примерно 364х25 = 9100 лет назад. Это опять в пределах погрешности измерений, поскольку величина 9575±960 лет, показанная выше, была рассчитана по всем 244 гаплотипам в 111-маркерном формате.
Надо добавить, что величины констант скоростей мутаций определяли при изучении многих тысяч гаплотипов. В первой обширной статье по этой теме[54]
, опубликованной в 2011 году, и подводящей итоги четырехлетних исследований, рассматривали 3160 гаплотипов, из них 2488 гаплотипов в 67-маркерном формате, а в недавней статье[55] рассматривалисьь уже 11850 гаплотипов в 111-маркерном формате.Вопрос 54: Как рассчитывают погрешности в ДНК-генеалогии?
ОБЩАЯ ОТНОСИТЕЛЬНАЯ ПОГРЕШНОСТЬ
, важная величина, указывающая на доверительный интервал, или надежность определения расстояния до времени жизни общего предка рассматриваемой популяции. По правилам математической статистики, расчет погрешности обычно производится для «одной сигма» или «двух сигма», что соответствует 68 % и 95 % доверительному интервалу, соответственно. Для одной сигма берется обратная величина квадратного корня из общего числа мутаций в серии гаплотипов, возводится в квадрат, к ней прибавляется 0.01 (это квадрат средней погрешности величины константы скорости мутации, при принимаемой ее погрешности ±10 %, то есть 0.1), и из полученной суммы извлекается квадратный корень.Например, при 100 мутациях (от базового гаплотипа) в серии гаплотипов получаем:
Таким образом, погрешность расчетов для 100 мутаций в серии равна ±14.14 %, или, округленно, 14 %. Это – для доверительного интервала 68 % (одна сигма).
Для доверительного интервала 95 % (два сигма) полученная величина удваивается, то есть погрешность расчетов составляет ±28 %. Но опыт показывает, что для расчетов реальных, документированных генеалогий, задавание доверительного интервала в одну сигма является реалистичным. Дело в том, что требование 95 %-ной точности нереально для ограниченных серий гаплотипов. Более того, после рассмотрения многих сотен экспериментальных серий гаплотипов выяснилось, что закладываемая погрешность для констант скоростей мутаций ±10 % является завышенной, на практике она не превышает ±2.5 %. Поэтому при 100 мутациях в серии гаплотипов погрешность при одной сигме составляет не ±14.14 %, а ±10.31 %.
Тем не менее, мы рекомендуем (и делаем это сами) давать результаты расчетов при завышенной погрешности, как описано выше. Лучше так, чем быть обвиненными в завышении «точности расчетов».
Александр Николаевич Петров , Маркус Чаун , Мелисса Вест , Тея Лав , Юлия Ганская
Любовное фэнтези, любовно-фантастические романы / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научная литература / Самиздат, сетевая литература / Любовно-фантастические романы