На то, чтобы полностью (более или менее точно) расшифровать человеческий геном с его 3 миллиардами пар нуклеотидных оснований ушло 13 лет, и на всю эту гигантскую работу затратили почти 4 миллиарда долларов. Сегодня производители обычных ДНК-секвенсоров предлагают устройства, проделывающие ту же работу за один день и всего за тысячу долларов.
Основное продвижение на этом пути приходится на сравнительно недавнее время. В американском Национальном институте исследований человеческого генома построили логарифмический график, отражающий зависимость стоимости ДНК-секвенирования от времени, и сравнили его с аналогичным графиком для закона Мура. Уменьшающаяся стоимость процессора отражается на таком графике прямой линией с небольшим отклонением от горизонтали. Стоимость же ДНК-анализа начинает падать быстрее, чем муровская стоимость, уже в 2007 году, а затем ее скорость падения все больше растет (это продолжается до сих пор). Исходная расшифровка мегабазы (1 миллиона оснований) ДНК-последовательности стоила чуть меньше 10 тысяч долларов в 2001 году, нырнула под тысячедолларовую планку в 2004 году, а в 2014 году обходится… всего в полцента.
Быстрое, дешевое, надежное секвенирование – технология, коренным образом меняющая положение в науке. Количество архивируемой информации, которую получают из цепочек ДНК, растет с невообразимой скоростью. Хороший современный секвенсор, продающийся уже полностью подготовленным для работы в лаборатории, при идеальных условиях способен выявлять до 100 миллиардов пар нуклеотидных оснований в сутки. По оценкам специалистов, за 2013 год лабораториям всего мира удалось расшифровать 15 петабаз, то есть тысячу миллионов миллионов букв ДНК[23].
Что ж, ДНК-секвенирование стало весьма доступным методом. И все равно в каждом конкретном исследовании встречаются трудности, вынуждающие ученых идти на те или иные компромиссы.
Секвенирование отдельного генома в наши дни – рутинная работа, успех которой зависит главным образом от тщательности подготовки образцов, которые закладываются в секвенсор. ДНК должна быть чистой, то есть происходить от одного организма.
Если речь идет о ваших собственных клетках, особых проблем не возникает, достаточно поскрести пальцем внутри щеки. В проекте «Геном человека» у добровольцев брали пробы крови. Человеческая ДНК обладает сравнительно крупными размерами, поэтому ее после извлечения расщепляли с помощью ферментов на более «удобоваримые» куски (примерно по сотне тысяч нуклеотидных пар в каждом), а затем их «клонировали» – воспроизводили при помощи послушных лабораторных бактерий, которые, благодаря своему быстрому росту, давали большое количество искусственной бактериальной хромосомы (ИБХ) ДНК. Затем эти ИБХ извлекались из бактерий для секвенирования.
Геномы бактерий меньше, но их труднее получить в чистом виде. С теми бактериями, которые удается выращивать в виде культуры, можно разобраться достаточно легко. Прочие же так и остаются в виде непонятной смеси, содержащей неизвестно сколько различных организмов, каждый из которых добавляет в общую сумму очень небольшое количество ДНК.
Эту трудность можно обойти, прибегнув к так называемому
Появление геномики, действующей в промышленных масштабах, предоставляет ученым доступ к постоянно расширяющейся базе данных ДНК-последовательностей. А поскольку вся эта информация хранится в электронной форме (а не только в самой ДНК), компьютеры могут легко анализировать ее, сравнивая новые образцы ДНК с теми, что уже имеются в хранилище данных. Порой они находят ряд тех же букв, следующих в том же порядке; иными словами, выявляется полное совпадение данных. Иногда это часть гена, чья функция нам уже известна (зачастую она состоит в том, чтобы руководить синтезом определенного белка). Иногда этот фрагмент чуть отличается от какого-то существующего гена. Иногда он похож на ген, но содержит неизвестный компонент. Так, фрагменты ДНК, отвечающие за кодирование белков, заключают в себе особые сигналы, показывающие, где клеточная аппаратура для чтения ДНК должна прекращать работу, а где должна снова ее начинать. При тщательно продуманной интерпретации такое секвенирование «всего, что попало в ведро» способно многое поведать о населении ведра.