Как мы вскоре убедимся, эпигенетика объясняет один из механизмов, с помощью которого клетка способна контролировать синтез производимого ею определенного белка, определяя в первую очередь, сколько копий мРНК должно быть получено с оригинального шаблона.
В нескольких последних абзацах говорилось о том, как гены кодируют белки. А сколько генов у нас в клетках? Вопрос на первый взгляд кажется совсем несложным, но, как это ни странно, в ответах на него нет единства мнений. Это объясняется тем, что ученые до сих пор не могут договориться о том, что считать геном. Раньше все было просто и понятно — геном назывался участок ДНК, кодирующий белок. Теперь мы понимаем, что это был слишком упрощенный подход. Однако абсолютно справедливо говорить, что все белки кодируются генами, даже если не все гены кодируют белки. В нашей ДНК насчитывается от 20 000 до 24 000 кодирующих белки генов, а это значительно меньше, чем цифра в 100 000, которую ученые считали наиболее вероятной всего лишь десять лет назад[17].
Большинство генов в клетках человека имеют весьма схожее строение. Начинаются они с области, называемой промотор, которая связывает белковые комплексы, копирующие ДНК для формирования мРНК. Затем белковые комплексы движутся вдоль образования, известного как тело гена, создавая в процессе этого длинную цепочку мРНК, чтобы в итоге отделится на конце гена.
Представьте себе тело гена длиной в 3000 пар оснований, что является для него вполне приемлемым размером. Длина мРНК тогда тоже составит 3000 пар оснований. Каждая аминокислота кодируется кодоном, состоящим из трех оснований, следовательно, мы можем предположить, что эта мРНК закодирует белок длиной в 1000 аминокислот. Но — и это довольно неожиданно — в действительности обнаруживается, что белок обычно существенно короче.
Если бы мы напечатали последовательность гена, она бы выглядела как длинная строчка, состоящая из разнообразных сочетаний букв А, Ц, Г и Т. Но если мы проанализируем ее подходящей для этой цели компьютерной программой, окажется, что мы можем разделить эту длинную строку на два типа последовательностей. Первый тип называется экзон (экспрессированная, то есть выраженная, последовательность), и именно экзон способен кодировать аминокислоты. Второй тип называется интрон (
Первая копия мРНК, полученная с ДНК, содержит в себе весь набор экзонов и интронов. Как только эта длинная молекула РНК будет создана, в дело вступает другое специализированное подразделение белкового комплекса. Оно удаляет все последовательности интронов и соединяет друг с другом экзоны, создавая тем самым мРНК, которая кодирует непрерывный поток аминокислот. Этот процесс редактирования называется сплайсингом.
И эта процедура также выглядит излишне усложненной, но и в данном случае эволюция руководствовалась весьма вескими причинами для выбора такого непростого механизма. Объясняется это тем, что клетка использует относительно небольшое количество генов для создания гораздо большего числа белков. Как действует этот механизм, показано на рисунке 3.3.
Рис. 3.3. В верхней части этой диаграммы показана молекула ДНК. Экзоны, кодирующие участки аминокислот, размещены в темных ячейках. Интроны, не участвующие в кодировании последовательностей аминокислот, представлены светлыми ячейками. Когда ДНК впервые копируется в РНК, что обозначено первой стрелкой, в РНК содержатся как экзоны, так и интроны. После этого клеточный механизм удаляет интроны полностью или частично (этот процесс называется сплайсинг). Получившиеся в результате этого молекулы матричной РНК могут передавать информацию самым разным белкам от одного и того же гена, что отражено на диаграмме различными словами. Для простоты восприятия, все экзоны и интроны имеют на диаграмме одинаковые размеры, однако в действительности они могут различаться в очень широких пределах