После этих коротких материалов вышла статья Дага Раша, Аарона Халперна и тридцати шести соавторов, включая Крейга в качестве второго автора, - большой обзор того, что экспедиция обнаружила в первых сорока одном образце. Это было непросто, в том числе потому, что объем собранных данных был беспрецедентным. "Мы начали с тонны информации", - говорит Халперн. "Но что все это значило? Никто толком не знал. Когда мы начинали, мы даже не были уверены, какие вопросы хотим задать".
"Это было чудовище, которое нужно было собрать воедино", - говорит Раш, отчасти потому, что длинные строки генетического кода, созданные в процессе селекции и сборки дробовика, не были собраны для проверки определенной гипотезы или ответа на конкретные вопросы. "Все, что у нас было, - это весь этот код, который был в природе, и который нам нужно было попытаться осмыслить, чтобы попытаться задать вопросы об экологии и эволюции из разных мест".
С этой проблемой они столкнулись и при работе с данными по Саргассо, но теперь она стала еще более серьезной: "поразительное разнообразие видов, содержащихся в образцах". Действительно, это было разнообразие, разнообразие, разнообразие. Это главное, что всегда всплывало при работе с этими данными".
Все это разнообразие затрудняло сборку полных генов и геномов, а также сборку всех мелких случайных фрагментов, которые получались в результате "взрыва" геномов и последующего использования известных последовательностей из библиотек ДНК и других алгоритмических инструментов для их повторной сборки. Эта задача усложняется тем, что микробы изменяют гены не в процессе размножения, а путем горизонтального переноса генов. "В природе микробы ведут борьбу за ресурсы в различных и меняющихся условиях, - говорит Йосеф, - а это значит, что они постоянно мутируют и вносят тонкие изменения в свой код, чтобы лучше приспособиться, поэтому еще сложнее понять, как их собрать".
Некоторые подсказки для сборки ДНК из дробовика были получены из мест, которые Крейг и сотрудничающие с ним ученые выбрали для взятия образцов. "Различные популяции микробов были связаны с различными параметрами окружающей среды, - говорит Раш, - будь то температура, соленость или расстояние от побережья. Уровень питательных веществ в воде также был важным фактором".
"Один из важных выводов, - добавил Халперн, - состоял в том, что, хотя многие образцы содержали одинаковые или похожие организмы, они различались между собой по тонким признакам: подтипы внутри подтипов специй указывали на функциональные различия даже ниже уровня подтипов". Это позволило предположить наличие почти бесконечного числа крошечных эволюционных флуктуаций. "Мы смогли использовать метагеномику для поиска намеков на субразнообразие, разработав множество способов взглянуть на почти совершенно новый тип данных, большая часть которых была не тривиальна и не очевидна. Но мы только поцарапали поверхность, и раздел обсуждения статьи полон предположений, а не окончательных выводов".
Ученые увидели такое разнообразие в исследованных ими мирах микроорганизмов, что стандартная таксономия царств, филумов и видов не смогла отразить этого богатства. "Разговор о подтипах был попыткой объяснить, что существует разнообразие ниже видового уровня", - говорит Халперн. "Оно было структурировано, но правила, управляющие этой структурой, было трудно определить".
"Подтипы показывают, что существует стабильное разнообразие, которое находится ниже уровня слияния и расщепления, которое обычно происходит, - говорит Раш, - но мы не знали, насколько разнообразны большинство этих подтипов, или же каждая отдельная клетка представляет собой буквально мо-заику Франкенштейна из разных частей, или что-то среднее между ними".
Мы обсуждали, являются ли виды "облаком" организмов, но это, вероятно, не лучшая аналогия", - добавил Халперн. "Например, у дерева жизни есть большие ветви, которые видны издалека, и они разветвляются на множество веточек. А на концах веток - большие пушистые хохолки, как на иве весной, каждый хохолок пушистый, с множеством волосков". Множество "волосков" в образе Хэлп-Эрна означало все разнообразие внутри подтипов.
"В этой аналогии подтип - это хохолок", - продолжил он. "Мы показали, что даже внутри подтипа существует огромное разнообразие в плане различий между последовательностями любого гена. С другой стороны, мы обнаружили, что, несмотря на это разнообразие, подтипы относительно стабильны в плане содержания генов. Возможно, от 80 до 90 процентов генов были общими для всех подтипов. А для тех генов, которые они разделяли, количество, на которое они различались на уровне последовательности, коррелировало".