Созданное Дарвином дерево жизни постепенно дополнялось и совершенствовалось благодаря новым данным палеонтологии и возможностям радиоизотопного анализа. Новые методы позволяют измерить возраст костей и, следовательно, более точно определить родственные отношения между видами. По мере развития микробиологических методов анализа организмы стали разделять на одноклеточные и многоклеточные, а позднее на две большие категории: организмы с клеточным ядром стали называть эукариотами, а организмы без ядра – прокариотами. В конечном итоге все живые существа разделили на пять царств: животные, растения, грибы, одноклеточные эукариоты и прокариоты. Однако данных относительно двух последних царств было недостаточно. Палеонтологические летописи о самых многочисленных, простых и, по-видимому, самых древних видах были невероятно скудными, и положение микробов на дереве жизни оставалось неоднозначным.
Карл Вёзе решил прояснить ситуацию. В 1969 г. он написал Френсису Крику удивительное письмо – своего рода план того, что Вёзе собирался сделать в последующие 20 лет и что он надеялся получить (и в конечном итоге получил). Вёзе писал Крику, что планировал использовать ДНК для выявления, как он выразился, «внутренних палеонтологических летописей», указывающих на истинные родственные связи между организмами. «Выявляя предковые последовательности генов, можно надеяться увидеть следы эволюции клеток». Он осознал возможность использовать генетический код для заполнения пробелов в наших знаниях о ранних этапах эволюции, которые не удается заполнить с помощью палеонтологических данных. Он планировал секвенировать ген (то есть определить его полную нуклеотидную последовательность), являющийся общим практически для всех живых существ, а затем на основании его вариаций воссоздать историю эволюции.
К началу 1960-х гг. процесс секвенирования белков (определения последовательности аминокислот в молекуле белка) превратился в рутинный анализ. Эмиль Цукеркандль и Лайнус Полинг выделяли белки из современных организмов, которые можно было разместить на филогенетическом дереве. Они показали, что степень различия белковых последовательностей зависела от того, насколько давно разошлись соответствующие виды организмов в соответствии с палеонтологическими данными. Измеряя различия между белковыми последовательностями из разных источников, можно рассчитать, как давно организмы разошлись от общего предка (ученые называют это принципом «молекулярных часов»).
Однако не все белки встречаются во всех организмах. Вёзе нужно было найти что-то, что содержалось в клетках
К моменту начала работы по секвенированию Вёзе ушел из лаборатории General Electric и оказался в Иллинойском университете в Урбана-Шампейне по приглашению молекулярного биолога Сола Шпигельмана, который когда-то присутствовал на лекции Вёзе в Институте Пастера в Париже. В Иллинойсе Вёзе руководил небольшой группой исследователей, самым талантливым из которых был Джордж Фокс, принимавший активное участие во всех самых важных открытиях научной группы. Вместе они начали сложный процесс секвенирования генов 16S рРНК.
Все анализы приходилось делать вручную – автоматические секвенаторы появились лишь спустя несколько десятилетий. Вёзе с сотрудниками выбрали метод, предложенный в 1965 г. британским биохимиком Фредериком Сенгером – одним из немногих ученых, дважды удостоенных Нобелевской премии. Процедура предполагала ферментативное разделение генов РНК на небольшие фрагменты, с которыми проще было работать. Потом фрагменты подвергали секвенированию, а затем восстанавливали всю молекулу и определяли полную нуклеотидную последовательность. Процедура была дорогой, и Вёзе обратился за финансовой поддержкой в программу НАСА по астробиологии. Работа была чрезвычайно медленной и кропотливой. Поначалу на секвенирование одного гена 16S рРНК уходили месяцы. Большинству ученых такая работа показалась бы невероятно занудной, но Вёзе она нравилась – это было похоже на сборку гигантского пазла.