Вспомним, что продвинутый аллель появляется как мутация у отдельного индивида — что по определению делает продвинутый аллель редкостью. Если рассматривать геном в целом, то примерно 35 процентов индивидуальных различий в нуклеотидных позициях приходится на продвинутые аллели, а 65 — на предковые. Эд догадался вот о чем: такое распределение означает, что если во фрагменте неандертальской ДНК присутствует продвинутый аллель, то от соответствующего фрагмента человеческого генома он будет отличаться в 65 процентах случаев и совпадать только в 35 процентах. Таким образом, получается, что фрагмент неандертальской ДНК скорее совпадет с человеческим, если присутствует предковый аллель! Кроме того, Эд понял, что компьютерная программа картирования часто не распознает короткие фрагменты, не совпадающие с человеческими аналогами. А длинные, наоборот, узнает: они естественным образом имеют больше совпадений по позициям, и потому программа их засчитывает, даже если в них имеется отличие-другое. В результате программа чаще отсеивает короткие фрагменты с продвинутыми (более редкими) аллеями, чем длинные, и на выходе получается, что в коротких фрагментах меньше продвинутых аллелей, чем в длинных. Эду пришлось несколько раз втолковывать мне всю эту логику, пока я не уразумел. И даже тогда я не до конца верил собственному чутью, все надеялся, что Эд сумеет отыскать более наглядное доказательство.
В конце концов Эд изобрел-таки хитроумный способ — что угодно, только бы не видеть, как я рыдаю на собрании в пятницу. Он просто взял из выборки длинные фрагменты ДНК и разрезал их пополам — естественно, виртуально, в компьютере, — получив таким образом фрагменты вдвое короче. Затем он прогнал эти короткие фрагменты через программу картирования. И, как по волшебству, частота появления продвинутых аллелей снизилась по сравнению с частотой продвинутых аллелей в длинных фрагментах. А ведь из них-то и были нарезаны короткие фрагменты. А недостача продвинутых аллелей получалась как раз из-за того, что короткие фрагменты с такими аллелями “вызывали подозрение” у компьютерной программы и она их отсеивала. Ну наконец-то, вот оно, объяснение, и вовсе это не загрязнения! Хотя казалось очевидным, что дело в них. По крайней мере, теперь мы имели возможность выявить картину загрязнений в том первом, пробном анализе материала из
Работа Эда еще раз убедила меня в том, как необходим прямой количественный анализ загрязнений. Каждую пятницу мы заново обсуждали способы оценки уровня загрязнений ядерной ДНК. Но теперь, когда об этом заходила речь, я оставался спокоен. Я знал, что мы на верном пути.
Глава 15
От костей к генам
К 2008 году команда
Эд Грин принялся просеивать 39 миллионов прочтенных фрагментов ДНК; он решил сложить вместе кусочки, напоминавшие последовательности мт-генома современных людей. Затем нужно было сравнить их и, обнаружив перекрывающиеся участки, наложить друг на друга. И так шаг за шагом выстраивалась неандертальская последовательность. Затем он снова прошерстил 39 миллионов фрагментов, но уже ориентируясь на проступающую неандертальскую цепочку. Этот новый поиск выявил фрагменты, упущенные на первом этапе. Ему удалось идентифицировать 8341 митохондриальный фрагмент неандертальца, в среднем длиной в 69 нуклеотидов. Из них получилась полная цепочка молекулы мтДНК в 16 565 нуклеотидов — самая длинная из когда бы то ни было реконструированных мтДНК.