Тем не менее на момент объявления о секвенировании генома в 2000 г. был получен хороший предварительный результат{8}
— и, строго говоря, именно об этом тогда и сообщили, то есть о завершении предварительной расшифровки. В большинстве случаев исследователи могли обратиться к этим данным, рассчитывая получить подробную информацию об интересующем их участке ДНК. Это было захватывающее время, и все же те из нас, кто занимался клинической медициной, по-прежнему не вполне понимали, для чего нам может пригодиться расшифровка генома.В один прекрасный день на исходе 2001 г. нам на кафедру пришел пакет, который наглядно это подтвердил. В нем был диск с расшифровкой человеческого генома, присланный нам в подарок компанией Celera. Мы с воодушевлением вскрыли конверт, вставили диск в компьютер и принялись исследовать его содержимое. Однако тут же впали в ступор. Мы понятия не имели, как читать полученную информацию и как соотнести ее с данными наших пациентов. Как позже выяснилось, понадобилось еще больше десятка лет, чтобы работа с геномными данными стала обычной составляющей в практике клинической и лабораторно-диагностической генетики. Теперь я каждый рабочий день пользуюсь браузером геномов, разработанным в Калифорнийском университете Санта-Крус (UCSC Genome Browser){9}
. В моей работе эта программа незаменима.Так что же там, в геноме? Что именно я могу найти благодаря UCSC?[12]
Белое клейкое вещество, которое вы извлекли из клубники, состоит из четырех видов химических «кирпичиков» — нуклеотидов, важными составными частями которых являются азотистые основания: аденин, цитозин, гуанин и тимин[13]
. Они обозначаются начальными буквами А, Ц, Г и Т (или A, C, G, T соответственно). В человеческом геноме примерно 3 млрд азотистых оснований. Обычно они объединены в пары, поскольку ДНК существует в форме двойной спирали. Эта двойная спираль состоит из двух отдельных нитей, комплементарных друг к другу. А (аденин) на одной нити соединяется водородными связями с Т (тимином) на другой нити, а Ц (цитозин) — с Г (гуанином), поэтому двойная спираль выглядит так:* Gattaca («Гаттака») — название фильма-антиутопии 1997 г. о будущем генетических технологий, составленное исключительно из начальных букв азотистых оснований ДНК. —
Две нити направлены в противоположные стороны — у ДНК есть направление, связанное с порядком ее копирования (транскрипции) и трансляции при синтезе белков. Поэтому последовательность, комплементарная последовательности ГАТТАЦА, будет прочитана клеточным механизмом как ТГТААТЦ, а не ЦТААТГТ.
Три миллиарда оснований ДНК — это ужасно много. Для наглядности — вот фрагмент генетического кода человека:
Это один из моих любимых участков генома — кусочек гена
Так что же является ключом? И что скрывается в геноме? Как выясняется, ключ тут не один, здесь нужен скорее целый набор ключей. ДНК способна поведать много историй, если уметь их читать.
Мы уже говорили в предыдущей главе, что наши хромосомы образуют пары[14]
просто потому, что половину генетической информации вы получаете от мамы, а половину — от папы. В свою очередь вы передаете каждому из детей также половину своих хромосом. Таким образом, одна копия первой хромосомы получена от мамы, другая — от папы, и так со всеми хромосомами. Первая хромосома самая крупная. Она состоит примерно из 250 млн нуклеотидов, и на ней располагается свыше 2000 генов. Самая маленькая, 21-я, хромосома состоит менее чем из 50 млн нуклеотидов и содержит только пару сотен генов. Скромная Y-хромосома лишь немногим длиннее, чем 21-я, но в ней всего около 50 генов.Кроме того, в клетке вне клеточного ядра тоже есть ДНК: у нас имеется второй геном, совсем крошечный (всего 16 569 нуклеотидов и 37 генов). Он находится в структурах под названием
Что касается генов, то о них вы, без сомнения, слышали, ведь это самые известные компоненты генома. Как уже говорилось, они играют роль инструкции, по которой клетка синтезирует белки, которые, в свою очередь, выполняют множество сложных задач, необходимых клетке, чтобы выжить и принести пользу вашему организму. Однако те участки генов, которые транслируются для синтеза белков, составляют лишь около 1–2 % генома.