Ричард Дж. Робертс — выпускник моей альма матер, Шеффилдского университета. Там он получил степень бакалавра наук по химии, закончив докторскую диссертацию в 1965 году. После этого он работал в лаборатории в Колд-Спринг-Харбор, штат Нью-Йорк. Филлип Аллен Шарп — выпускник Иллинойского университета в Нью-Йорке. Он также закончил докторскую в 1965 году и работал в лаборатории в Колд-Спринг-Харбор. Робертс и Шарп исследовали, как гены вируса, называющегося аденовирус 2, кодировали белки в культуре клеток тканей. Ученые выяснили, что информационная РНК, которая у рибосом производила белок, была значительно короче в смысле нуклеотидной последовательности, чем ДНК в ядре вируса. Это подсказало ученым, что только часть так называемых кодирующих белки генов действительно кодировали аминокислоты производимых по их инструкциям белков. При передаче генетического кода из ядра вируса в клетки организмов-носителей, видимо, происходило что-то очень загадочное.
Ситуация такая же, как с исследованиями бактериофагов, самых маленьких из микробов, лет тридцать назад: вирусы открыли нам глаза на более общее биологическое правило. Робертс и Шарп обаружили то, что мы сейчас называем интронами и экзонами, которые очень важны в генетическом механизме сплайсирования. Это открытие принесло им Нобелевскую премию по физиологии/медицине в 1993 году.
Что такое интроны и экзоны? Как они решают вопрос несоответствия между количеством кодирующих белки генов и предполагаемым количеством белков, закодированных в человеческом геноме?
Возможно, настало время вновь вскарабкаться в вагон нашего воображаемого поезда, который отвезет нас в микроскопическую страну по своим удивительным двойным рельсам из фосфатов и дезоксирибозы и не менее удивительным шпалам.
В мгновение ока мы оказываемся в вагоне — чух-чух-чух — и едем по длинным цепочкам хромосом. Мы знаем, что в этой хромосоме есть определенные участки ДНК, называющиеся генами. Раз уж мы в Волшебной стране и здесь есть место магии, мы можем решить, что следующий ген на наших рельсах будет подсвечиваться зеленым. Зная это, мы замедляемся достаточно, чтобы увидеть впереди участок, пульсирующий изумрудно-зеленым светом, — мы находимся в начале гена. Затем переключаемся на тихий ход и едем вдоль рельсов. Заметно, что светятся зеленым именно шпалы. Через некоторое время они становятся обычного коричневого цвета. И я полагаю, что мы еще не у конца гена: зеленый участок пути, который мы прошли, — просто первый экзон.
И вам хочется спросить: «Где именно мы сейчас находимся?» — «Обычный участок с коричневыми шпалами — это первый интрон».
Мы медленно двигаемся по этому участку и понимаем, что он длиннее предыдущего. Но он внезапно заканчивается, и мы въезжаем на новый зеленый участок — второй экзон. Мы продолжаем путешествие и видим еще три экзона, перемежающихся двумя интронами, как будто пробелами. Все действительно очень просто. Робертс и Шарп поняли, что ДНК отдельного гена не обязательно кодирует один белок. Ген разделен на маленькие участки — экзоны, отделенные друг от друга интронами. Для кодирования одного белка нужно особое сочетание экзонов, а не целый ген, — эти экзоны и копируются в информационную РНК вместе с интронами, однако в процессе кодирования интроны уберутся и экзоны соединятся вместе для получения конечного варианта сообщения, которое передается посредством РНК и кодирует белок.
Будет полезно думать так: экзоны «покидают» ядро, чтобы закодировать белок, а интроны остаются «внутри» ядра. Общее количество экзонов в любом человеческом гене варьируется, но в среднем их 8,4. Следовательно, для кодирования определенного белка геном должен знать, как выбрать нужный ген, а в нем выбрать экзоны, которые придется слепить вместе, чтобы получить нужный код.
Возьмем, к примеру, человеческий бета-глобин — часть молекулы бета-глобулина. Мы знаем, что молекула гемоглобина содержит в своем ядре один атом железа, окруженный двумя первичными и двумя вторичными белковыми единицами. В целом белок состоит из четырех различных частей — такой белок называется четвертичным. Если мы посмотрим на одну из двух одинаковых вторичных белковых единиц, то увидим, что это те же единицы, которые мутируют при серповидной клеточной анемии: мы обнаружим, что участок ДНК, кодирующий этот белок, содержит три экзона и два разделяющих их интрона.
На этом этапе нужно понимать, как активируется ген.