Вообще при обсуждении вопроса в понятиях «точны» или «неточны», надо сначала определиться, «точны» для чего, для какой задачи, которая должна ставиться. Если задача ставится вычислить время рождения или смерти общего предка с точностью до года, то никакие статистические методы для этого в принципе не подходят, включая ДНК-генеалогию. Не подходят и задачи, в которых требуются проводить расчеты с точностью до десятилетий. ДНК-генеалогия решает задачи в первую очередь концептуальные, на уровне открытий, пересмотров старых концепций, и создания концепций новых. Никто же не требует в астрофизике расчета времени «большого взрыва» Вселенной с точностью до сотен лет, и тем более до года, там оценки идут на сотни миллионов и миллиарды лет, и не в сотне лет точности была важность новой концепции.
Например, когда 20 лет назад популяционными генетиками было сообщено, что носители гаплогруппы R1b жили в Европе 30 тысяч лет назад, во времена неандертальцев, то расчетов вообще никаких не делалось, это было предложено «по понятиям», подхвачено, и устоялось в науке. Потребовалось больших трудов убедить научную общественность, что R1b появились в Европе всего лишь около 5000 лет назад, как показали расчеты ДНК-генеалогии[58]
, и это имело концептуальную значимость. В той ситуации было неважно, это 5000±3000 лет назад, 5000±1000 лет назад, или 4800±400 лет назад (последняя величина была показана в расчетах). Таких примеров можно привести много, и каждый раз это был фактический прорыв в науке, прорыв разного масштаба.Обычно расчеты общих предков выборок в ДНК-генеалогии проводятся с точностью 10–15 %, и причина этого довольно проста – мы постулируем, что величина константы скорости мутации определяется с точностью ±10 %, и тогда точность расчетов по определению не может быть лучше, чем ±10 %. На самом деле сотни и тысячи расчетов показали, что точность определения констант скоростей мутаций составляет примерно 2.5–3.0 %, но для расчетов мы оставляем те же 10 %. Лучше пусть доверительный интервал расчетов будет больше, чем претендовать, что наши расчеты точны, и время от времени подвергаться обвинениям, что другие данные показывают несколько отличающуюся величину. Не все знают, что расчеты погрешностей дело весьма условное, и зависит от закладываемых параметров доверительности. Если мы хотим результаты с доверительностью 95 %, или 99 %, то погрешности при тех же исходных величинах будут уже другими. В ДНК-генеалогии неразумно считать с требуемой доверительностью 95 % или 99 %, потому что тогда мы выходим уже не на концептуальность, а на точность, которой в обычно используемых сериях гаплотипах нет и быть не может. Даже если выборки будут состоять из десятков и сотен тысяч протяженных гаплотипов, в них непременно окажутся «примесные» гаплотипы, из других субкладов, из несимметричных ДНК-линий, да и просто ошибки типирования, которые неизбежны в больших сериях.
Поэтому реальность показывает, что погрешности расчетов ±10 %-15 % это то, из чего надо исходить и соответственно формулировать требования и задачи исследования.
В качестве примеров осложняющих факторов рассмотрим приведенные выше распределения мутаций в маркерах DYS393 и DYS390 в серии из 3466 гаплотипов субклада R1b-L21. Как мы видели, в обоих случаях мутации дают несимметричную картину. В DYS393 – в одну сторону, на понижение аллелей, произошло 85 одношаговых мутаций, в другую, на повышение, произошло 147 мутаций. На самом деле это не мутации несимметричные, а несимметричное распределение потомков по мутациям. Например, среди тех 3466 человек рассматриваемой серии оказалось больше потомков с DYS393 = 14, чем с DYS393 = 12. Причин к такому несимметричному распределению мутаций много. Например, среди всей серии из 3466 гаплотипов могло оказаться непропорционально много потомков того, у кого много веков назад произошла мутация DYS393 = 13 → 14. Далее, в число этих 3466 человек могли попасть обладатели подчиненных (или вообще других) субкладов, с преобладанием базовой аллели, DYS393 = 14. Если в данную серию попали носители других субкладов с другой базовой аллелью, то такая несимметричность несколько искажает результаты расчетов, как мы покажем ниже на нескольких характерных примерах, и потому результаты расчетов времени до общего предка всегда должны даваться с определенной погрешностью, которая перекрывает искажения. Если это «свои» потомки, то результаты расчетов обычно не искажаются. Этот вопрос пока недостаточно проработан в ДНК-генеалогии с теоретической точки зрения.
Александр Николаевич Петров , Маркус Чаун , Мелисса Вест , Тея Лав , Юлия Ганская
Любовное фэнтези, любовно-фантастические романы / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научная литература / Самиздат, сетевая литература / Любовно-фантастические романы