Пиросеквенирование работает следующим образом. Как и в методе Сэнгера, все начинается с множественного копирования фрагментов ДНК и их разделения на одиночные цепи нагреванием. И снова ДНК-полимераза строит вторую, комплементарную цепь по матрице одиночной. Представьте, что у нас в реакционной лунке закреплена единственная одноцепочечная молекула ДНК. Ученый наливает в эту лунку раствор, содержащий люциферазу и другие ингредиенты, но из четырех типов нуклеотидов там есть только один – скажем, А. Если за этим следует световой импульс, значит, ДНК-полимераза встроила А в растущую цепь, то есть он оказался подходящим, комплементарным первому неспаренному нуклеотиду матрицы. Если вспышки нет, А не подошел и нужно пробовать другие нуклеотиды. Ученый выливает из лунки раствор с A и трижды повторяет процесс – с Ц, Г и T. Лишь в одном случае из четырех он видит вспышку света. Теперь очередная буква известна. Повторяя процесс снова, он по излучению кванта света узнает следующую букву, затем еще одну и так далее. То есть ДНК читается по мере синтеза ее комплемента.
Я не объяснил, как можно распараллелить процесс. Помимо этой задачи у метода крайне высоки требования к чувствительности: высвобождение единственного пирофосфата должно неизбежно вести к тому, чтобы единственная люцифераза испустила одиночный, очень слабый световой импульс, который мы во что бы то ни стало обязаны засечь. Если на любом из этапов произойдет сбой, мы пропустим букву. Обе задачи, параллелизм и надежность, решаются с помощью одной физической тактики – объединения идентичных фрагментов ДНК в массивы.
Как и в секвенировании по Сэнгеру, геномную ДНК дробят на случайные фрагменты длиной до тысячи оснований, к их концам пришивают короткие универсальные адаптеры с известными нуклеотидными последовательностями. Затем плавлением разделяют все фрагменты на отдельные цепи (см. главу 1) и смешивают в растворе с микроскопическими шариками, к поверхности которых привязаны маленькие «якоря», комплементарные одному из ДНК-адаптеров. Пропорции смеси продумывают так, чтобы шариков оказалось значительно больше, чем ДНК, и вероятность заякоривания на каждом шарике сразу нескольких фрагментов ДНК стремилась к нулю.
Шарики и ДНК плавают в водном растворе. Если смешать его с маслом, при взбалтывании или в потоке образуются окруженные маслом капли раствора, заключающие в себе не более одного шарика и размером не сильно его превосходящие.
Те самые «якоря» на поверхности шариков служат праймерами для инициации синтеза цепи ДНК, комплементарной взаимодействующему с якорем фрагменту. В каждой капле раствора содержится все необходимое для ПЦР[52]
: ДНК-полимераза, нуклеотиды и праймеры для последующих раундов репликации. Так в капле можно создать около миллиона копий исходного фрагмента. По окончании репликации капли собирают вместе и добавляют к ним мыло или спирт, чтобы уменьшить силу поверхностного натяжения, благодаря которой каждая капля в масле оставалась изолированной (см. главу 11). Капли сливаются, и раствор течет по плашке с крошечными лунками диаметром чуть больше шарика. В результате в каждую лунку попадает по одной сфере, покрытой множеством одинаковых двуцепочечных ДНК; одна из цепей каждого дуплекса удерживается на шарике якорными праймерами. Когда мы плавим эту ДНК и смываем высвобожденные нити, у нас остается множество распределенных по лункам сфер, каждая из которых покрыта своим типом леса из идентичных однонитевых ДНК.Теперь можно приступать к пиросеквенированию и фиксировать в каждой лунке вспышки света. Они возникают то и дело по мере синтеза цепей ДНК, комплементарных миллиону связанных с шариком матриц. Соответственно, вспышки эти в миллион раз ярче, чем при испускании света одной молекулой ДНК. Если в последовательности ДНК несколько раз подряд повторяется одна и та же буква, яркость вспышки растет пропорционально числу повторов (до некоторого предела): двойная А, например, дает вспышку вдвое ярче. Ученые, а точнее их аппараты, фиксируют последовательность и интенсивность световых сигналов и таким образом читают ДНК.
Эта сложная схема действительно работает и благодаря приемлемой надежности стала первым коммерциализированным методом секвенирования нового поколения: в 2005 году его вывела на рынок компания 454