И вот я говорю с Джонатаном и с Майклом Эгхольмом, датским ученым, менеджером 454, по трехсторонней электронной связи, — и волнуюсь. Да, Джонатан энергичен и напорист, как и следовало ожидать от предпринимателя такого масштаба, но его явно интересует только одно — прочитать геном динозавра! Как же мне быть и как себя вести? Ведь я всегда во всеуслышание заявлял, что секвенировать ДНК динозавра невозможно ни сейчас, ни в будущем. Я попытался как-то помягче, чтобы Джонатан не занес меня сразу в черный список, еще раз пройтись на эту тему и одновременно намекнуть на существование других презанятных геномов, особенно — продолжал намекать я — неандертальского. К счастью, Джонатана сразу же заинтриговала идея выяснить с помощью его аппарата, что делает человека человеком. Мне даже удалось убедить их с Эгхольмом, что начинать нужно с пещерных медведей и мамонтов.
И уже через неделю почта доставила экстракты мамонтовой и медвежьей кости в 454 Life Sciences. В это же время к нам в лабораторию поступил на работу трудолюбивый и талантливый молодой специалист — биоинформатик Ричард Эд Грин. Он только что защитил диссертацию в Калифорнийском университете в Беркли. Эд выиграл очень престижную и к тому же щедро финансируемую стипендию от Национального научного фонда США: он должен был выполнить проект по сравнению РНК-сплайсинга у человека и обезьян. Сплайсинг — это процесс, при котором из копий РНК, считанных с ДНК, вырезаются ненужные кусочки, разрезанные концы соединяются и превращаются в зрелую матричную (или, по-другому, информационную) РНК, и она уже непосредственно используется в белковом синтезе. По предположениям Эда, разница в схемах соединения разрезанных концов РНК могла объяснить многие человеческие и обезьяньи особенности. Он как раз этим занимался, когда пришли первые результаты из 454.
Команда из 454 составила сотни тысяч последовательностей ДНК из костей мамонта и пещерного медведя. Я поручил Эду разобраться с первоочередной проблемой: разделить медвежьи цепочки нуклеотидов и те, что принадлежали занесенным бактериям и другим организмам. Задача была не из простых. Он сравнивал последовательности геномов мамонта и пещерного медведя с геномами собаки и слона, то есть с самыми близкими из их живущих ныне родичей. Но цепочки палео-ДНК были короткими и к тому же с большой вероятностью химически видоизменились за прошедшие тысячелетия. Плюс к этому плесень и бактерии на костях определялись не слишком хорошо. Эда так захватила эта задача — распознать эндогенные последовательности, — что он совсем забросил свой сплайсинг. В конце концов он написал письмо в администрацию Национального научного фонда, ведавшую его стипендией. Он честно сообщил, что задачи его проекта изменились и теперь его интересует другое. К сожалению, в фонде мыслили недостаточно широко, чтобы понять, какие прекрасные возможности для информационной биологии открывает проект по неандертальскому геному, и попросту закрыли финансирование Эда. Хорошо, что наш бюджет позволял оставить его с нами.
Тем временем Эд подсчитал, что 2,9 процента ДНК, выделенных из костей мамонта, и 3,1 процента из костей пещерного медведя — эндогенные, то есть их собственные, а не привнесенные извне. Это значило, что результаты нашей работы с Эдди Рубином, когда клонирование ДНК в бактериях показало 5 процентов эндогенных ДНК от пещерного медведя, в действительности очень хороши. На первый взгляд 3 или даже 5 процентов не слишком впечатляют, но в абсолютных цифрах это 73 172 разных фрагментов ДНК мамонта и 61 667 фрагментов ДНК пещерного медведя. То есть всего лишь один эксперимент по новой методике 454, в котором участвовала только часть экстракта, выдал в десять раз больше информации, чем мы получили от бактериального клонирования в лаборатории Беркли. Казалось бы, вот он, настоящий прорыв, но я видел проблемы, сопряженные с новым методом. Наш обычный путь ПЦР позволял повторить эксперимент много раз и, таким образом, проверить результат и выявить возможные ошибки. Новый же метод показывал определенную последовательность только один раз: так как геномы — и мамонта, и медведя — были очень большими, то вероятность поймать один и тот же сегмент второй раз сводилась к минимуму. И в результате мы лишались возможности определить, какие отклонения могут появиться в результате химических модификаций молекул, неизбежных из-за долгого “хранения”, а также выявить ошибки собственно секвенирования.