Первые пробные секвенаторы этого типа поступили в технологические центры в 2006 году. С их помощью можно было отсеквенировать фрагменты длиной в 25 нуклеотидов, а кроме того, как я слышал, они все время ломались. Но в принципе их потенциал был исключительно высок, потому что они обещали одновременное чтение не сотен или тысяч отдельных нитей, как в 454,
а сразу нескольких миллионов. А в перспективе, когда технология будет отлажена, даже больше. Вскоре длина читаемых фрагментов увеличилась до 30 нуклеотидов, и пошли разговоры о некоем усовершенствовании, которое позволит читать нить сразу с двух сторон, так что общая длина может достигнуть 60 нуклеотидов. Это уже звучало интереснее для нас, исследователей древних ДНК. И другие стали обращать внимание на эти секвенаторы. В ноябре 2006-го биотехнологическая компания Illumina с базой в США перекупила Solexa, и Дэвид Бентли стал в этой обновленной компании заведующим по науке и вице-президентом.На конференции в Колд-Спринг-Харбор я обсуждал с Дэвидом наш проект. Мы договорились, что я пошлю ему наши материалы с мамонтовыми или неандертальскими ДНК и он на них протестирует работу машин Illumina.
Вообще-то мы даже уже начали потихоньку такое тестирование. В феврале 2007 года мы послали один из лучших экстрактов мамонтовой ДНК Джейн Роджерс в Институт Сэнгера, в Кембридж, а она как раз отвечала там за секвенаторы Solexa. Но к тому моменту она еще не откликнулась, поэтому, вернувшись с конференции, я принялся нетерпеливо забрасывать коллег из Сэнгера запросами. И вот в начале июня пришли результаты, которые нас несколько разочаровали. Эти технологии явно генерировали много ошибок. Компания изо всех сил работала над усовершенствованием технологий, но, кроме того, я понял, что большое число ошибок можно скомпенсировать огромным числом прочтенных фрагментов. В принципе можно попросту каждый фрагмент из библиотеки прочитать много раз, и тогда ошибки секвенирования будут хорошо видны, и их можно будет не учитывать при интерпретации. У Illumina, к сожалению, не было своего центра по секвенированию, поэтому нам пришлось покупать собственную машину. Из-за высокой востребованности этой технологии мы смогли получить ее только полгода спустя. Теперь машина могла читать уже 70 нуклеотидов, правда, все с тем же количеством ошибок. Их число возрастало по мере удлинения читаемой последовательности. В 2008 году новые поколения машин позволяли секвенировать с обоих концов цепочки каждый фрагмент из наших библиотек. Считая, что в древней ДНК фрагменты состоят примерно из 55 нуклеотидов, каждый фрагмент можно прочесть дважды, с одной и с другой стороны. А значит, практически для каждого фрагмента мы получим надежную последовательность.В эту работу включился Мартин Кирхер, пришедший в 2007 году еще студентом-дипломником в группу биоинформатиков Дженет Келсо. Ему предстояло проанализировать данные, выданные Illumina.
Его обманчиво широкая мальчишеская улыбка скрывала, как я чувствовал, излишнюю самоуверенность, граничащую с высокомерием, — наверное, с легкой руки его негласного наставника Удо. Сначала меня это ужасно раздражало, но потом я мало-помалу стал понимать, что парень часто оказывается прав. Я научился уважать его способность мгновенно ухватывать суть технической проблемы и организовывать непрерывный поток данных от секвенаторов к компьютерам, превращая решения в четко поставленные технические задания лаборантам. Да и работал он невероятно много. Мы все, и я, и Дженет, все больше и больше полагались на его хозяйское отношение к Illumina и на организованную им компьютерную обработку иллюминовских данных.К 2008 году стало ясно, что если мы хотим закончить проект в обозримые сроки, то с технологией 454
нужно прощаться. Сильной стороной 454 считалась возможность считывать длинные фрагменты, но так как в наших материалах таких не было, это преимущество не играло на нас. Нам требовалось, наоборот, прочитать много коротких фрагментов, и как можно быстрее. В этом случае у Illumina было решительное преимущество перед 454. Но так сразу уйти от 454 мы не могли, потому что все наши программы, разработанные Эдом Грином и остальными, были адаптированы для обработки данных по 454. Нужны были существенные преобразования в процедуре обработки данных и возможность слияния различных наборов отсеквенированных прочтений. Ведь все эти технологии едва появились, так что просто взять и загрузить готовый софт было неоткуда. Все приходилось разрабатывать самим.