Эволюция последовательно уточняла функции каждого из трех оснований кодона, что, в конечном счете, привело строгой триплетности только двух кодонов: ATG
– для M (метионина) и TTG – для W (триптофана). По способности триплета кодировать только одну аминокислоту отнесем эти два к группе вырожденности I. Когда продукт кодируется фиксированным дублетом оснований, а третье может быть любым из четырех возможных и фактически служит разделителем между функциональными дублетами, говорят об аминокислотах группы вырожденности IV; таких аминокислот восемь: аланин, A, аргинин, R, валин, V, глицин, G, лейцин, L, пролин, P, серин, S, треонин, T. Обобщенный кодон для каждой аминокислоты этой группы, например, лейцина, записывается так: СТN (N—произвольное основание).Двенадцать кодируемых продуктов относятся к группе вырожденности II
; в этой группе третье основание – одно из двух (а не из четырех, как в предыдущем случае): это пурин (R), то есть, либо аденин, А, либо гуанин, G, – или пиримидин (Y), то есть, либо цитозин, С, либо тимидин, Т. К этой группе относятся три аминокислоты, знакомые нам по четвертой группе вырожденности, – аргинин, лейцин и серин, но кодируемые здесь другими дублетами, две пары – аспарагин/аспарагиновая кислота (N/D), и глутамин/глутаминовая кислота (Q/E), а также гистидин H, лизин K, и тирозин Y. Универсальный генетический код относит к этой группе также цистеин С, с его двумя кодирующими триплетами – TGC и TGT, то есть, с третьим пиримидином, а также три стоп-кодона, TAG, TAA и TGA, которые работают только как пунктуационные знаки, фиксирующие окончание гена, но не кодирующие никакой аминокислоты. Обобщенный кодон для аминокислот этой группы, например, аспарагина, записывается так: AAY, а аспарагиновой кислоты – GAR.Наконец, группа вырожденности III
содержит изолейцин, кодируемый тремя триплетами ATA, ATC и ATT. Основания А, С и Т, третьи в кодонах для I, имеют общий символ Н, поэтому обобщенный изолейциновый кодон записывается так: АТН. Все эти особенности кода хорошо иллюстрирует приведенная выше его таблица.Любопытно, что молекулярная масса кодируемой аминокислоты находится в обратной зависимости от номера группы вырожденности, к которой она относится (В. Щербак). Это первое, отмечаемое здесь, свидетельство очевидной причастности молекулярной массы компонентов генетического кода к его рациональной организации.
В приведенной табличке упорядоченность по нарастанию молекулярной массы относится к аминокислотам в составе упорядоченных по номерам групп вырожденности (римские цифры), сгруппированным в два октета (арабские цифры). При этом позиция цистеина С
скорректирована, о чем речь будет идти в следующей главе; там же мы расскажем и об октетах.Возвращаясь к выбору именно двадцати
аминокислот для кодирования, стоит отметить еще одно интересное обстоятельство: этот выбор мог определяться также квантовой теорией информации, которая предлагает оптимальный алгоритм (алгоритм Гровера) упаковки и чтения информационного содержания ДНК (Апурва Патель, 2001). Такой алгоритм определяет число объектов N, различаемое числом ответов да/нет на вопросы Q, следующим образом:(2Q +1) sin-1
(1 / √N) = π /2.Решения этого уравнения для малых значений Q
весьма характерны:Q
= 1lnN = 04.0Q
= 2lnN = 10.5Q
= 3lnN = 20.2.Теоретически эти значения не обязательно должны быть целыми числами. Любопытно, что в первом приближении они соответствуют последовательности тетраэдрических чисел, а также эволюции функционального размера кодона от синглетного к триплетному. Другими словами, тетраэдр также можно построить из десяти и из четырех мономеров; эти числа и отмечены в решениях приведенного уравнения. Позднее мы покажем, что комбинация размерных параметров аминокислот и нуклеотидов, базирующаяся на предложенных нами правилах, приводит к пространственному равновесию тетраэдра из двадцати мономеров, соответствующих этим аминокислотам. Здесь же стоит, пожалуй, вспомнить актуальные до сих пор слова Вѐзе (1973): «Представляется почти жестокой шуткой, что Природа выбрала такое число
[кодируемых] аминокислот, какое легко получается в результате множестваматематических операций
». Но, так или иначе, двадцати альфа-аминокислот (из сотен, встречающихся в природе) оказалось довольно для обеспечения необходимого разнообразия белков.
…………………