Рис. 14.2.
Анализируя наборы данных проекта ENCODE, ученые выявили свыше трех миллионов сайтов с характеристиками регуляторных областей (исследуя множество клеточных линий человека). Площади кругов отражают распределение таких сайтов. Большинство их обнаруживали в клетках двух и более типов, хотя значительная их доля оказалась специфической для отдельных типов клеток. И лишь очень малую часть сайтов удалось найти в каждой из проанализированных клеточных линий.Свыше 90% регуляторных участков, выявленных благодаря этому методу, находились более чем за 2500 пар нуклеотидных оснований от начала ближайшего гена. Иногда они располагались вдали от всех генов, а иногда — в мусорной области, входящей в состав гена, но все равно они размещались далеко от его начала.
Большинство промоторов генов ассоциированы более чем с одним таким участком, а каждый такой участок обычно ассоциирован более чем с одним промотором. Однако, опять-таки, наши клетки, судя по всему, контролируют генетическую экспрессию отнюдь не прямолинейно. Они используют сложные сети взаимодействующих узлов.
Среди наиболее поразительных данных — информация, позволяющая предположить, что более 75% нашего генома хоть когда-нибудь, хоть в каких-нибудь клетках копируется в РНК9
. Любопытное предположение. Никто не мог ожидать, что три четверти мусорной ДНК наших клеток может реально использоваться для производства РНК. При сравнении информационных РНК, кодирующих белки, с длинными некодирующими РНК ученые выявили существенную разницу в картине экспрессии. В 15 изученных клеточных линиях информационные РНК, кодирующие белки, гораздо охотнее экспрессировались воВзятые в совокупности, данные из статей, опубликованных в рамках проекта ENCODE, рисуют картину весьма активного человеческого генома с чрезвычайно сложными схемами взаимодействия и «общения». В сущности, мусорная ДНК набита информацией и инструкциями. Нелишне повторить здесь указания гипотетического режиссера из Введения: «Если вы ставите „Гамлета“ в Ванкувере и „Бурю“ в Перте, в такой-то строке „Макбета“ ударение должно падать на четвертый слог. Если только при этом любительская труппа не ставит „Ричарда III“ в Момбасе, в Кито не идет дождь»10
.Рис. 14.3.
Экспрессию генов, кодирующих белки, и генов, не кодирующих белки, проанализировали на примере пятнадцати различных типов клеток. Выяснилось, что гены, кодирующие белки, гораздо чаще экспрессируются во всех типах клеток, чем области, которые вырабатывают молекулы РНК. не кодирующие белки.Всё это звучит очень вдохновляюще. Почему же тогда многие относятся к значимости этих данных с таким скептицизмом? Отчасти из-за того, что статьи, вышедшие в рамках проекта ENCODE, явили миру очень уж громкие заявления. Самым громким стало утверждение, что целых 80% генома обладают функциями. Проблема в том, что в основе некоторых таких утверждений лежали косвенные измерения самих функций. Особенно это касается исследований, где заключение о наличии функции выводили либо из присутствия эпигенетических модификаций, либо из других физических характеристик ДНК и ассоциированных с ней белков.
Потенциальное против реального
Скептики возражают: эти данные в лучшем случае указывают на то, что исследуемая область
Возможно, такая же ситуация и у нас в геноме. В нем могут существовать области, несущие на себе эпигенетические модификации или обладающие определенными физическими свойствами. Однако этого недостаточно для того, чтобы показать функциональность этих областей. Не исключено, что эти характеристики возникли просто как побочный эффект чего-то, что происходило поблизости.