DYS расшифровывается как «ДНК Y Сегмент», по-английски DNA Y Segment. Y – это та самая мужская половая хромосома, о которой речь шла выше. Мою ДНК анализировали по 67 маркерам, первые двенадцать из которых приведены в начале статьи. Я мог бы привести и все 67 цифр, но всему свое время.
А что такое «анализировали»? – спросит любознательный читатель. А вот что. Сама хромосома Y относительно невелика по сравнению с другими хромосомами человека. Все 46 хромосом, 23 пары, в совокупности состоят из трех миллиардов нуклеотидов, и в их составе примерно 30 тысяч генов. Стало быть, в среднем по 65 миллионов нуклеотидов и по 652 гена на хромосому. Хромосома Y состоит из 50 миллионов нуклеотидов, и в ней всего 27 генов. Остальная часть – некодирующая, «никчемная». Оказалось, в этой «никчемной» части имеются некие загадочные повторы нуклеотидов. Например, шестнадцать раз повторяется квадруплет ТАГА (тимин – аденин – гуанин – аденин). Вот так:
ТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГАТАГА-
ТАГАТАГАТАГА
Или одиннадцать раз триплет ТАТ (тимин – аденин – тимин). Ну, суть ясна. Оказалось, что эти повторы могут служить генеалогическими маркерами. Потому что эти повторы одинаковы у меня и моего отца. И моего дедушки. И дедушки его дедушки. И так далее, в ту самую глубину веков. А у другого человека, не моего прямого родственника, число этих повторов уже другое, хотя сам маркер тот же.
На самом деле, если пройти в глубь веков, число повторов будет немного различаться, и именно это делает возможной ДНК-генеалогию. Потому что если бы у всех было одинаково, то и у любого другого человека было бы то же самое. И тогда не было бы ДНК-генеалогии. Но в жизни абсолютного постоянства нет. Об этом немного позже.
Число повторов в генетике называют аллелями, но не будем насыщать этот рассказ научными терминами. Пусть будут повторы.
Квадруплетный маркер ТАГА (в повторах) носит номер DYS#19. Все мужчины на Земле имеют этот маркер, но в повторах от 11 до 19 раз подряд (их называют «тандемные повторы»). У меня этот маркер повторяется 16 раз подряд. А, скажем, у Томаса Джефферсона, третьего президента США, – 15 раз. То есть по этому одному маркеру мы с Джефферсоном удалены генеалогически на один шаг. По другому маркеру, DYS#392, повторяющемуся триплету ТАТ, у меня 11 повторов подряд. У Джефферсона, раз уж мы взяли его за сравнение, – 15 раз. То есть дистанция выросла до пяти шагов только по двум маркерам. Из этого уже можно сразу сказать, что он не мой близкий родственник. В смысле, что наш с Джефферсоном общий предок жил много тысяч лет назад, и ближе по времени общих предков у меня с ним уже не было. Потому что для «научных» наборов из шести маркеров дистанция в один шаг – это уже в среднем три тысячи лет до общего предка. А тут на двух маркерах пять шагов – десятки тысяч лет разницы.
Так вот, генеалогический анализ хромосомы Y – это и есть определение числа повторов в каждом маркере. Результатом является гаплотип конкретного человека, например, в том виде, который записан в самом начале этого рассказа. Обычно анализ проводят или по 12 маркерам (это сейчас стоит 150 долларов), по 37 маркерам (260 долларов) или по 67 маркерам (350 долларов), но для того чтобы платить такие ощутимые деньги, нужно понимать, что эти анализы могут дать и зачем они нужны.
Итак, подводим промежуточный итог. «Мужской» генеалогический анализ, или определение гаплотипа, можно проводить по определенному набору маркеров. Чем набор больше, тем точнее, но и дороже. Результат даст вам возможность найти своих родственников, имеющих одного общего предка, и оценить, насколько этот наш общий предок удален во времени. Масштаб удаления – сотни лет, тысячи, десятки тысяч лет, в зависимости от «генеалогической дистанции».
А почему число повторов в маркерах разное, и какое это имеет отношение к удаленности общего предка? А то, что чем дальше предок во времени, тем большее количество мутаций произошло в его хромосомах и, в частности, в тех самых маркерах. Фермент, считывающий число повторов в зоне маркеров, работает исключительно точно. Представляете: пилит фермент вдоль квадруплетного повтора ТАГА, каждая из идентичных четверок повторяется, скажем, шестнадцать раз (DYS#19 = 16), в сумме 64 однообразных остатка, и наш фермент ни разу не ошибается, воспроизводя – реплицируя – эту тандемную цепочку. То есть не ошибается пятнадцать поколений, около четырехсот лет. И вдруг бац – ошибся. Напутал. Повторил не 16 раз, как завещали предки, а 15 или 17 раз. Мутация. Shit happens.