После этого мы несколько раз бывали в 454 Life Sciences, но тогда приехали впервые. Вживую Джонатан Ротберг производил такое же впечатление, как и по телефону: напористый, с массой авантюрных научных идей. И тут же, как будто для равновесия, присутствовал датчанин Майкл Эгхольм, приземленно-практичный и каждое дело доводивший до конца. За время нашей совместной деятельности оба они заслужили мое глубочайшее уважение. Вместе они составляли потрясающую пару: Джонатан давал общее направление и напор, а Майкл претворял дело в жизнь. В тот день мы обсуждали главное — что потребуется, чтобы прочитать неандертальский геном. Мы собирались применить технику шотган, или, по-другому, метод дробовика: ее ввел в обиход Крейг Вентер в своей компании Celera, когда работал над прочтением человеческого генома. Этот подход заключался в том, что сначала секвенируют фрагменты ДНК вразбивку, случайным образом, а потом с помощью компьютерных программ составляют из них длинные цепочки, ориентируясь на наложение одинаковых кусочков, то есть раскладывают кусочки внахлест. Главная трудность такой техники — распознать нуклеотидные повторы; в геноме человека и обезьяны такие повторы составляют примерно половину всего объема. Большинство повторов имеют длину сотни или даже тысячи нуклеотидов, многие повторы встречаются в геноме в сотнях или тысячах копий. Поэтому при использовании метода дробовика нужно ориентироваться не только на короткие, а скорее на длинные фрагменты, захватывающие “мостики” между повторами. Тогда повтор можно заякорить с двух сторон штучными (неповторяющимися) фрагментами и, таким образом, получить представление, между чем и чем этот повтор протягивается. Но наша древняя ДНК уже сама разбилась на короткие фрагменты. Так что мы собирались построить неандертальский геном, приняв в качестве матрицы эталонный человеческий геном (эталонный — то есть первый составленный геном человека). Понятно, что таким способом определяется набор фрагментов, представленных одной копией в геноме, повторы же мы и не надеялись выстроить. Но по-моему, жертва эта не слишком серьезная: штучные или уникальные последовательности составляют самую интересную часть генома, ту, которая содержит значительную долю генов с известными функциями.
Еще нам предстояло решить, какую часть генома мы возьмем в оборот. До приезда в 454 я держал в голове цифру в 3 миллиарда неандертальских нуклеотидов. Эта цифра диктовалась, во-первых, тем, что я считал в принципе достижимой целью, и, во-вторых, примерным размером человеческого генома. Из-за фрагментации древней ДНК мы вынуждены будем иметь дело с такой ситуацией, когда множество кусочков прочитаются только один раз, другие прочитаются дважды, некоторые трижды и т. д. А какие-то участки генома не попадут в наш список совсем, просто потому, что не окажутся ни в одном из прочитанных фрагментов. Согласно статистике, около двух третей всех нуклеотидов должно хотя бы один раз найтись в наших прочтениях, а одна треть так и не объявится. Генетики называют это “однократной глубиной покрытия”, так как каждый нуклеотид имеет вероятность высветиться один раз. Я считал, что с однократной глубиной покрытия прочтение в нашем случае вполне достижимо и вдобавок даст неплохую прикидку неандертальского генома. И еще важно помнить, что этот геном станет определенным этапом исследований. Пусть потом другие секвенируют неандертальские кости, появятся прочтения новых геномов, их можно будет наложить на наш, увеличивая глубину покрытия еще и еще, пока неандертальский геном не предстанет в полном объеме, почти полном, пусть и без повторов.
Конечно, задача, которую я поставил перед нашей группой, была несколько расплывчатой, да и смотрелась жалковато на фоне других современных геномов, которые читались с двадцатикратной глубиной покрытия. Но с другой стороны, до чего же это была монументальная задача! В самых лучших из наших образцов мы выявляли примерно 4 процента неандертальской ДНК. Я рассчитывал найти еще такие образцы, а может, нам попадутся и получше, с чуточку большей долей сохранившейся ДНК. Если взять среднее для них в 4 процента, то для составления генома в 3 миллиарда нуклеотидов потребуется прочитать порядка 75 миллиардов нуклеотидов. Так как наши фрагменты очень коротенькие, всего по 40–60 нуклеотидов, для прочтения такого объема новым секвенаторам потребуется примерно от 3000 до 4000 перезагрузок. Получается, что компании 454 придется отставить в сторону все остальные задачи и заниматься только неандертальцами в течение нескольких месяцев — и если все это будет оплачиваться по обычным расценкам, то о таких суммах я даже не решался заикнуться.