Читаем Русский генофонд на Русской равнине полностью

«Нет в мире совершенства» — справедливо считал Лис [Сент-Экзюпери, «Маленький принц»]. Наверное, и у классических маркёров есть изъяны? Надо сразу сказать, что основной упрёк классическим маркёрам

— смещение оценок разнообразия относительно всего генофонда — оказался несправедливым. Этот упрёк основывался на том, что классические маркёры тестируются по их белковым продуктам, которые обычно подпадают под действие естественного отбора. А ДНК маркёры тестируются прямо по нуклеотидным последовательностям, которые могут быть не подвержены отбору. И предполагалось, что из-за действия отбора различия между популяциями, рассчитанные по классическим маркёрам, искажены. Поэтому на заре «ДНК эры» широко распространилось мнение, что пора отрешиться от анализа генофонда по классическим маркёрам!

Оказалось, что этот шаг поспешен и неверен — классические маркёры точно и правильно оценивают разнообразие генофонда. В действительности, предположение, что классические маркёры дают искажённую оценку, неверно даже теоретически: ещё до появления первых оценок по ДНК маркёрам нами теоретически было показано, что среднее разнообразие популяций GST должно быть одинаково и по ДНК, и по классическим маркёрам [Рычков, Балановская, 1987, 19906]. Самая первая работа по межпопуляционной изменчивости ДНК маркёров, осуществленная коллективом L. L. Cavalli-Sforza ([Bowcock et al., 1987], см. подробно Приложение) подтвердила этот прогноз. И с тех пор все корректно проведённые сравнительные исследования давали тот же результат (см. Приложение и главу 8): полное соответствие межпопуляционной изменчивости, рассчитанной по классическим и по ауто-сомным ДНК маркёрам.

Уж скоро минет пятнадцать лет, как с классических маркёров было полностью «снято обвинение» в смещённости оценок [Bowcock et al., 1987; 1991а; Bowcock, Cavalli-Sforza, 1991; Cavalli-Sforza, Piazza, 1993]. И, тем не менее, до сих пор из диссертации в диссертацию кочует поверье, что по классическим маркёрам разнообразие не определишь. Научные мифы живучи. И эхо необдуманных предсказаний может десятилетиями тормозить развитие науки. До сих пор многие учёные, работающие с ДНК маркёрами, из-за этого поверья считают себя вправе не знать всё, что было получено по классическим маркёрам их предшественниками. Образовавшийся разрыв в преемственности науки создаёт ту свободу от прошлого, которая рождает легковесность и необязательность утверждений: «Свобода веток от ствола и корня, свобода плеч от тяжкой головы…».[27]

§ 2. Зачем нужны карты?

НЕРАВНОМЕРНОСТЬ ИЗУЧЕННОСТИ

Итак, упрёк в смещённости оценок разнообразия оказался неоправданным. Однако у классических маркёров всё же есть существенный изъян, хотя совсем иной — это крайняя неравномерность их изученности. Антропологические маркёры, как мы видели в главе 4, исследованы в большинстве популяций по единой программе — это обеспечивает полную сопоставимость популяций по всему набору признаков. По панелям однородительских ДНК маркёров также многие популяции изучены идентично. А по классическим маркёрам и аутосомным ДНК маркёрам программа исследований не была стандартизирована: в одних популяциях изучались одни маркёры, в других популяциях — другие маркёры. Если составить сводную таблицу, то мы увидим, что для каждой популяции изучен свой набор маркёров, а для каждого из маркёров изучен свой набор популяций. Это делает популяционную информацию по классическим маркёрам плохо сопоставимой.

Например, наше геногеографическое изучение генофонда Восточной Европы (глава 8) опирается на данные по 100 аллелям (34 локусов) в 1586 популяциях. Но ни одна из полутора тысяч популяций не изучена по всем 34 генам. Поэтому напрямую провести статистический анализ невозможно: в матрице 1586x100 большинство ячеек пустуют.

Эта проблема несопоставимости данных по разным популяциям постоянно возникает при анализе классических маркёров и затрудняет использование методов многомерного статистического анализа — главных компонент, генетических расстояний и так далее.

ГОРДИЕВ УЗЕЛ

Обычный выход из этой ситуации — резкое сокращение числа анализируемых популяций и числа анализируемых генов. В результате в анализ включаются лишь немногие подробно изученные популяции и немногие общепринятые маркёры

Например, из матрицы 1586x100 останутся в лучшем случае только 20x8, но зато все ячейки будут заполнены — каждая из 20 оставшихся популяций изучена по каждому из 8 аллелей.

Перейти на страницу:

Похожие книги