Генетики уже знали, что геном может распознавать происхождение хромосом из пары. Иными словами, он может выбирать отцовскую или материнскую хромосому при экспрессии определенного гена или группы генов. Эпигенетический механизм, который называется импринтингом, является ключевым фактором в развитии таких генетических заболеваний, как синдромы Прадера — Вилли или Ангельмана, потому что он выбирает поврежденную хромосому, полученную от одного из родителей, в то время как парная ей может быть абсолютно здоровой. Генетики выяснили, что основным механизмом действия импринтинга является эпигенетическое отключение определенной области второй (не выбранной) хромосомы с помощью длинной некодирующей РНК, получившей название
Вдохновленные этими открытиями, ученые начали искать другие длинные некодирующие РНК и выяснили, что они вписаны в различные участки генома млекопитающих. Со временем днРНК были признаны частью недавно открытой и очень мощной эпигенетической регуляторной системы, что дало толчок новым исследованиям, которые ведутся и сейчас, пока я пишу эту книгу. Мы уже знаем, что человеческий геном, как и геном растений и животных, содержит множество длинных и коротких некодирующих РНК, среди которых днРНК длиной от 200 до 100 тысяч нуклеотидов выделяются в отдельный класс. То, что мы знаем о кодировании таких днРНК, на первый взгляд кажется необычным, но при этом поразительно логичным.
Существует второй, совершенно новый вариант считывания всего генома. Этот вариант затрагивает обычные границы генов или регуляторных последовательностей. В таком случае можно кодировать любую последовательность, входящую в состав экзона, группы экзонов, промоторного региона, или комбинации промотора и экзона, или регуляторного длинного кольцевого повтора вируса, или всего этого вместе. В результате транскипции возникают некодирующие молекулы РНК.
Вот вам и объяснение неизвестных 50 % генома.
Я вижу удивление на вашем лице. Мы все еще находимся на волшебном поезде, направляясь в обычный мир.
— Загадка состояла в том, как именно получались такие геномные последовательности. При прочтении генома в 2001 году все последовательности информационных РНК, обнаруженные в человеческой клетке, компилировались с помощью технологии, носящей название маркерных экспрессируемых последовательностей. Информационная РНК реверсировалась до ее комплементарной ДНК, или кДНК, поэтому схема 2001 года основывалась не на ДНК человеческого генома, а на совокупности кодов всех информационных РНК, экспрессированных из ДНК.
Вы все еще качаете головой.
— Когда речь идет о генетических последовательностях, геном или большая его часть на самом деле транслируется дважды — двумя совершенно разными способами…
— Ага, то есть весь геном копируется два раза.
— Точно. Вот почему черная дыра составляла 50 %. В ней не хватало второй трансляции в некодирующие РНК.
Теперь мы видим, как старый подход к геному, в котором основное внимание уделялось генам ДНК, кодирующим белки, мешал нам увидеть всю картину целиком. Это более комплексное понимание все еще подвергается оценке специалистов.
Номенклатура некодирующих РНК проста и предсказуема — они называются в честь кодирующей их последовательности генома. Последовательность, основанная на одном экзоне или интроне, называется экзонной или интронной днРНК, на гене — генной днРНК и т. д. Может быть получена днРНК из смысловой нити ДНК, из промоторной последовательности, из целого гена, включая все экзоны и интроны, или даже из промежуточных последовательностей между различными генами, включая регуляторные области. Кроме того, таким же образом она может кодироваться и антисмысловой нитью ДНК. Некоторые кодируются в обоих направлениях и называются двунаправленными транскриптами. Существуют даже митохондриальные днРНК и вирусные или