Но дело в том, что в ДНК нуклеотиды расположены не случайно, и это является проблемой для восстановления последовательности из перекрывания отрезков. Если две последовательности из 1000 нуклеотидов перекрываются на 20 нуклеотидов или сто — это еще ничего не значит, так как весь этот фрагмент из 1000 нуклеотидов может быть несколько раз повторен в геноме. Поэтому нужно было сначала расставить вдоль генома фрагменты, а уже потом выявлять их перекрывание на основе сиквенса. Таков был путь мирового сообщества при секвенировании генома человека (секвенированием в русскоязычной литературе называют процесс определения последовательности нуклеотидов. Этот термин также является калькой с английского названия).
Как это можно было сделать? Нужно было поставить какие-нибудь «буйки» в геноме человека, какой участок стоит за каким. Последовательность таких участков и составляет карту генома. Первой такой картой стала карта генетическая. Она показана на рисунке слева.
Рядом показана окрашенная хромосома, на которой видны поперечные полоски. Поперечная окрашенность индивидуальна для каждой хромосомы, каждая полоска имеет собственный номер, который представляет собой "адрес" данного участка на хромосоме. Ясно, что в каждом таком участке миллионы пар нуклеотидов, последовательность которых мы должны определить. Были получены полиморфные маркеры, то есть найдены такие участки хромосомы, которые у разных людей (или на разных хромосомах одного человека) содержат неидентичные последовательности нуклеотидов. В прошлой лекции упоминалось, что для генетической карты с интервалом в 10 % рекомбинации нужно 300 равноудаленных маркеров. Эти маркеры нужны для различения одной хромосомы от другой в данном локусе.
В основе детекции ДНК маркеров лежит метод амплификации (размножения) фрагментов ДНК in vitro с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Методом ПЦР можно синтезировать фрагмент ДНК in vitro (в пробирке) и получить его как химически чистое вещество. Для синтеза используются короткие синтетические отрезки ДНК, называемые праймерами (затравка для синтеза). С 3'-конца праймера начинается синтез фрагмента ДНК по матричной нити, на которую он отжигается (прилипает при комплементарном взаимодействии между нуклеотидами праймера и матрицы). За один цикл достройки ДНК из двух нитей ДНК получили 4. В следующем цикле из 4 нитей получится уже 8 и т. д. Каждый цикл занимает несколько минут. За 30 циклов ПЦР целевой фрагмент размножится в 1 миллиард раз, что позволяет наблюдать фрагмент (после окраски). Время проведения каждого этапа ПЦР в будущем сократится на 2–3 порядка, таким образом, что каждый цикл будет проводиться за секунды.
Для различения папиной и маминой хромосом использовали так называемые STR-маркеры (Short Tandem Repeat), состоящие из одинаковых звеньев, чаще всего звено состояло из пары нуклеотидов ЦА. То есть нашли места в геноме, где повторялись эти вкрапленные звенья. Допустим в папиной хромосоме в фрагменте из 100 пар нуклеотидов была вставка из 20 звеньев, а в таком же месте маминой хромосомы было вставлено 22 звена. Этот фрагмент ДНК размножили in vitro, с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Длина этих фрагментов будет у папы 100 + 20*2 = 140, а у мамы — 100 + 22*2 = 144. При фракционировании образованных фрагментов в геле под действием постоянного тока (электрофорез) мы можем провести разделение фрагментов по размеру. Чем тяжелее фрагмент, тем меньше его электрофоретическая подвижность и тем ближе к старту он будет находиться. Если у родителей ребенка длины фрагментов составляли (как указано в примере выше) 140 и 144 п.н., то и у ребенка будут эти полоски присутствовать.
Описанный подход применяется не только в фундаментальных исследованиях, но и в практике идентификации личности при судебно-медицинской экспертизе. Допустим данный локус в хромосоме может находиться в одном из 10 альтернативных состояний. (Эти состояния, аллели, различимы по их электрофоретической подвижности). Эти состояния различают 10 хромосом или людей с такими хромосомами. Если мы возьмем в анализ еще один локус (на другой хромосоме) с такими же характеристиками, то по этому локусу мы тоже различим 10 хромосом или людей. А по сочетанию состояний в этих двух локусах различимы 10 x 10 = 102 хромосом. Пять таких локусов позволят различить 105
хромосом. А поскольку хромосом у каждого из нас по паре, то сочетания аллелей этих пяти локусов дают 105 х 105 = 1010 вариантов. Это число вариантов больше, чем число людей на земле. На практике при идентификации используют набор аллелей из 13 локусов, хотя и пяти как мы видим, может быть волне достаточно.Генетическая карта была первой картой генома человека, на основе которой строилась дальнейшая работа по картированию. Эту карту соотнесли с физической картой, показывающей порядок следования клонированных фрагментов ДНК вдоль генома (см. рисунок 1 справа).