Вся эта масса секвенирования была крайне важна для того, что Крейг собирался сделать с микробами Саргассова моря - то, что еще никогда не пытались сделать в таком масштабе. Речь шла о том, чтобы с помощью дробного секвенирования выйти за рамки секвенирования ДНК одного вида или организма, что было нормой, в том числе для проекта "Геном человека".
Вместо этого Крейг предлагал установить последовательность и собрать воедино тысячи отдельных организмов и видов, содержащихся в разнородных образцах из Саргассова моря, - идея, которую многие ученые считали провальной. Это означало, что нужно было заново изобрести и пересмотреть каждый этап процесса секвенирования, начиная с того, как лаборанты вскрывали и выделяли ДНК из множества образцов отдельных организмов одновременно. Проблема заключалась в том, как создать библиотеки секвенирования, в которые можно было бы одновременно поместить большое количество различных микробов, сохранив при этом случайность последовательностей. "В то время, - говорит Крейг, преуменьшая, - это была нелегкая задача".
Чтобы подготовить необработанные образцы к секвенированию, Хоффман обратился к Синди Пфаннкоч, лаборантке из JCVI, которая ранее работала над подготовкой ДНК к секвенированию в рамках проекта "Геном человека", а теперь была направлена во временную лабораторию в Роквилле. "Именно там мы начали работать над Саргассовым морем, - вспоминал Пфаннкоч, - и там мы разработали, как будем фильтровать. У нас было две или три лаборатории, я думаю, они напоминали NIH в пятидесятые годы. Такой декор. Черные скамейки из формики, мрачные зеленые стены, сбоку пара маленьких скамеечек, похожих на столы".
Получив образование почвенного микробиолога, Хоффман адаптировал методы выделения ДНК, которые он освоил в пустынях Аризоны во время защиты докторской диссертации. "Это были довольно стандартные методы, - говорит он, - хотя я никогда не использовал их для микробов из океана". Хоффман, Пфаннкох и небольшая команда из института начали с того, что взяли замороженные фильтры, содержащие микробы, привезенные с Бермудских островов, и разрезали их на крошечные кусочки. Затем они использовали специальные ферменты, предназначенные для вскрытия клеток и извлечения ДНК. "Оказалось, что океанские микробы вскрываются довольно легко, - говорит Джефф, - по сравнению с микробами пустынной почвы, у которых более толстые мембраны". Полный процесс извлечения занял около трех дней.
"Отчасти мы полагались на опыт Джеффа", - вспоминает Крейг. "Нужно было уметь вскрыть все клетки. Поэтому они попробовали несколько различных экспериментальных протоколов, чтобы извлечь всю ДНК.
У микробиологов команды был опыт вскрытия клеток, а у Джеффа - опыт работы с микробами пустынной почвы. Некоторые клетки из почвы очень трудно вскрыть, потому что они образуют маленькие микрокапсулы. Каждый член команды предлагал различные протоколы, которые позволяли вскрыть все клетки и получить наибольшее количество ДНК".
Следующие шаги заключались в создании нескольких копий ДНК в образцах, а затем в буквальном смысле разбиении ДНК на фрагменты размером от пятисот до двух тысяч пар оснований с помощью аппарата, называемого распылителем. Затем фрагменты пропускались через один из секвенаторов Applied Biosystems, который отмечал и идентифицировал каждую генетическую букву.
После завершения секвенирования и компьютерной обработки файлов команда вычислительных биологов из института взяла цифровые последовательности и принялась за работу, пытаясь собрать эти фрагменты кода в естественные хромосомы организма. Для этого команда искала совпадения в коде разных фрагментов. Подробное описание того, как это делается, представлено Национальным центром биотехнологической информации в его справочнике NCBI.1 Но для простоты предположим, что после того, как распылитель произвел взрыв, в оставленных им фрагментах были следующие три:
Фрагмент 1: -----TCATGCTTGAC-----TACAGC
Фрагмент 2: TGCATCATGC-----GCTATACAGC
Фрагмент 3: -----TTGACGCGGCTATAC---.
Компьютер быстро определяет перекрывающиеся части этих фрагментов и способен собрать всю последовательность, которую они покрывают:
TGCATCATGCTTGACGCGGCTATACAGC
Этот процесс может работать, когда несколько копий генома данного организма собраны и раздроблены, чтобы получить различные фрагменты. Чем больше копий, тем больше шансов, что будут найдены участки с идентичными последовательностями ДНК и что случайные фрагменты могут быть скомпилированы компьютерами в контиги.
Еще проще представить себе, что кто-то распечатал несколько копий, скажем, статьи из New York Times и нарезал их по-разному, получив множество изо-лированных строк символов. Эти фрагменты не имеют смысла, пока вы не начнете находить в разных вырезках последовательности, которые точно совпадают. Возьмем, к примеру, первое предложение статьи о проекте "Геном человека", написанной в 2001 году Николасом Уэйдом.2 Вот несколько возможных фрагментов из нее:
/ е давно устоявшиеся представления о биологии человека. / Публикация первой интерпретации