Еще один актуальный вопрос: насколько последовательности ДНК различаются между живыми организмами? Насколько похожи гены человека и шимпанзе? Гены человека и банана? Степень сходства (доля совпадающих нуклеотидов) будет варьировать в зависимости от выбранного участка ДНК. Ниже показаны сравнения (нуклеотидные выравнивания) генов, кодирующих белок гистон H1 человека и шимпанзе, а также человека и банана (звездочками помечены совпадающие нуклеотиды; знаками «—» – отсутствующие). Гистоны – это белки, на которые «наматывается» ДНК, чтобы компактно упаковаться в ядре. Это очень древние белки, возникшие на заре эволюции, необходимые для жизни всем эукариотам. Поэтому степень сходства между организмами по генам этого белка выше среднего – мутации в этих генах чаще всего вредны.
Можно заметить, что ген человека и ген шимпанзе почти идентичны: всего 5 отличий на 660 нуклеотидов! В среднем у человека с шимпанзе последовательности ДНК совпадают на 98,76 %[88] (чуть ниже, чем получилось для приведенного сравнения), а вот геномы двух людей совпадают примерно на 99,9 %. Мы также видим, что ген гистона банана совпадает с геном человека лишь где-то на 50 %. Для сравнения, если мы возьмем две совершенно случайные последовательности ДНК, между ними будет около 25 % сходства. Шимпанзе ближе к человеку, чем к банану, не только по степени сходства генов, но и по набору генов в геноме. У банана будет много генов, которых нет у приматов (например, связанных с фотосинтезом), а у приматов будут гены, которых нет у растений (например, связанные с развитием нервной системы).
Полезно представлять, насколько маленьким может быть геном живого организма. Геном паразитической бактерии
Типичный геном вируса иммунодефицита человека (ВИЧ) составляет 9749 нуклеотидов[90]. Бывают и на удивление крупные вирусы с очень богатым генетическим материалом, например, геномы пандоравирусов могут достигать размера в 2,5 миллиона нуклеотидов[91], а живут они в амебах – одноклеточных эукариотах. Также в амебах живет и другая группа крупных вирусов с милым названием мимивирусы, геномы которых достигают миллиона нуклеотидов, что для вирусов тоже очень много[92].
ВИЧ – это ретровирус, но не подумайте, что это вирус шестидесятых (впервые вызываемый им синдром приобретенного иммунодефицита – СПИД – был диагностирован в 1981 году). Он называется ретровирусом потому, что его геном сделан не из ДНК, как у большинства вирусов и живых организмов, а из РНК. У ретровирусов есть белок «обратная транскриптаза», который умеет делать транскрипцию наоборот, то есть синтезирует ДНК, комплементарную молекуле РНК. С помощью этого белка ВИЧ создает ДНК-версию своего генома и встраивает ее в геном человеческой клетки. Дальше инфицированная клетка начинает сама производить вирусный генетический материал и его белки. Синтезированные компоненты собираются в новые вирусные частицы и выходят из клетки.
Генетические последовательности можно записывать в виде текста и работать с ними как с последовательностью букв. Так их удобно анализировать: исследовать распространенность тех или иных мутаций в популяции, изучать закономерности эволюции, находить определенные гены и так далее. Ниже приведена последовательность гена, который кодирует обратную транскриптазу ВИЧ.
А вот аминокислотная последовательность обратной транскриптазы ВИЧ в стандартном однобуквенном коде.
Обратите внимание, что теперь мы должны использовать не 4 символа, а 20 – для обозначения аминокислот, а не нуклеотидов, и количество символов уменьшилось в три раза, ведь тройке нуклеотидов отвечает одна аминокислота. Мы досконально знаем, как устроен геном ВИЧ с точностью до нуклеотидов, а точнее, мы знаем последовательности геномов сотен разных его штаммов, причем все они выложены в свободный доступ. И вот странный факт: есть целое движение людей, отрицающих существование этого вируса!