Исследование этих объектов вроде бы подтверждало прежнюю истину («один ген — один белок»). Правда, нашлись и исключения. Некоторые белки складывались из нескольких полипептидных цепей и кодировались, соответственно, несколькими генами. Другие гены кодировали не белки, а нужные для работы клетки нуклеиновые кислоты — РНК рибосомные и транспортные. Но это все было мелочью, и до сих пор многие полагают, что гены — это та ДНК, которая кодирует белки, а если она их не кодирует, то это не гены. А что же это тогда? Какую функцию выполняет ДНК, не находящая отражения в аминокислотных последовательностях белков?
Пока изучали простейшие объекты, от этой ДНК можно было отмахнуться. Геномы бактерий и фагов построены очень экономно. Там действительно почти каждая нуклеотидная последовательность находит отражение в аминокислотной последовательности белка. Более того, экономия генетического материала у вирусов доходит до того, что один ген может кодировать два, а то и три белка. Как это может получиться? Возьмем для примера кусочек последовательности информационной РНК, кодирующий всего три аминокислотных остатка:
Это соответствует последовательности в белке:
То есть, серин-треонин-аспарагиновая кислота. Тот же ген может быть прочитан со сдвигом на один нуклеотид вправо. Тогда получится совсем другой белок, в нашем примере эта часть будет означать про-арг-иле (пролин-аргинин-изолейцин). Код вирусов перекрывается, одна последовательность нуклеотидов читается по-разному в зависимости от начала считывания. У некоторых фагов отмечено даже тройное перекрытие. Гены высших организмов так экономно не построены, достоверных данных о перекрытии в них нет. Впрочем, геномы ретровирусов, к которым относится печально известный вирус СПИДа, способны к перекрыванию, а во многих геномах высших организмов имеются очень похожие на них последовательности.
Но это все-таки исключение из правила. В целом уже первые исследования показали, что наши геномы построены, по крайней мере на первый взгляд, чрезвычайно неэкономично. Как говорят, у них низкая плотность кодирования генетической информации. Образно выражаясь, геном вируса — речь спешащего спартанца, геном человека — речь заикающегося зануды.
Доказать это очень просто. Сколько белков может синтезировать организм человека? Около 50 тыс. (конечно, в самом грубом приближении). Нуклеотидов в геноме человека 3,2 млрд. Зная молекулярную массу «среднего» белка, нетрудно прикинуть, из скольких аминокислотных остатков он состоит, сколькими кодонами кодируется. Помножив на 50 тыс., мы придем к выводу, что не меньше 95% ДНК в геноме лишние. Более того, теперь мы уже точно знаем, что большая часть ДНК в наших геномах никаких белков не кодирует, с нее не считывается в обычных условиях информационная РНК, а если и считывается, то не находит отражения в аминокислотных последовательностях. Что же делает эта ДНК, какова ее функция?
Самый неожиданный ответ на этот вопрос рискнули дать одновременно и независимо друг от друга У. Ф. Дулиттл со своей сотрудницей К. Сапиенса и классик молекулярной биологии Ф. Крик с Л. Орджелом в 1980 году.
Эпоха бранных слов. Какую же гипотезу они предложили? Теперь за ней устоялось название «гипотезы эгоистичной (selfish) ДНК». Суть ее заключается в том, что или вся ДНК, не перекодирующаяся в белок, или ее значительная часть не имеет смысла. Изменения в ней не затрагивают строение организма (фенетические признаки). Она размножается при каждом делении клеток, не принося организму пользы, но и не причиняя существенного вреда, существуя сама для себя. В геноме это нахлебник или паразит, умеющий довольствоваться малым.
Откуда же среди генов берутся такие эгоисты? Авторы этой концепции исходят из простых предпосылок. Уже давно известны способы, с помощью которых нуклеотидная последовательность, ранее существовавшая в единичном экземпляре, может размножиться, образовав десятки, сотни, тысячи и миллионы копий. Этот процесс назвали амплификацией (размножением).
Существует и обратный процесс — выпадение из генома последовательностей, в том числе и лишних, амплифицированных. Его назвали делецией. Нетрудно сообразить, что, если скорость амплификации последовательностей хоть немного превысит скорость делеции, геном быстро переполнится копиями генов, которые для существования организма попросту не нужны. Разумеется, это не может длиться бесконечно. Как только геном клетки переполнится паразитами, начнет действовать отбор. Медленно растущие носители паразитарных последовательностей будут им отсеиваться. Но сторонники эгоистичной ДНК полагают, что энергетические расходы клетки на содержание ненужной ДНК не столь значительны.