Приблизительно так же, как человеческие мысли шифруются и передаются от человека к человеку в словах каждого языка. Все идеи человечества, все его бытовые навыки и все знания закодированы в какой-нибудь сотне тысяч слов. Каждое слово, или кодовая группа, состоит из букв. Их немного, несколько десятков. Буквы образуют алфавит. Таким образом, все богатства человеческой мысли, накопленные за тысячелетия, весь этот необъятный, казалось бы, арсенал знаний и идей может быть выражен, сохранен на полках библиотек и передан следующим поколениям в сочетаниях всего лишь нескольких десятков букв, или, как говорят кибернетики, символов.
Но та же самая сверхобширная информация может быть выражена еще меньшим числом букв — всего двумя символами. Примером служит азбука Морзе, в которой различная последовательность точек и тире способна передать все мысли человеческие.
У ДНК алфавит четырехбуквенный. Буквами служат особые химические соединения — азотистые основания: аденин (А), тимин (Т), гуанин (Г) и цитозин (Ц). Кодовыми группами, или словами, — их сочетания в молекулы ДНК. Как в азбуке Морзе определенное чередование тире и точек составляет фразу.
Из скольких же букв, скольких азотистых оснований составлены передающие наследственную информацию слова?
Проще всего в этом разобраться на примере синтеза белков. Ведь первое звено в длинной цепи построения организма по плану, заключенному в наследственности, это созидание специфических для него белков.
Все белки, а их великое множество сортов и разновидностей, строятся на РНК из двадцати аминокислот. Я уже говорил об этом. Так вот, каждая аминокислота занимает свое место на РНК напротив соответствующей ей кодовой группы, то есть соответствующего сочетания азотистых оснований.
Их всего четыре, а аминокислот двадцать. Значит, каждую аминокислоту не может кодировать одно-единственное основание — однобуквенное слово в генетическом лексиконе.
Может быть, двухбуквенное подойдет? Нет, и двухбуквенных мало: ведь аминокислот двадцать, а из четырех букв можно образовать только шестнадцать двухбуквенных слов.
А вот трехбуквенных будет достаточно, и даже с избытком. Ведь каждый из наших четырех символов А, Т, Г, Ц, которыми мы обозначили кодовые азотистые основания, может быть и первой, и второй, и третьей буквой в трехбуквенном слове. Нетрудно подсчитать, что таких слов шестьдесят четыре.
Шестьдесят четыре, а аминокислот-то всего двадцать! Значит, сорок четыре слова-триплета в генетическом языке ДНК лишние?
Впрочем, едва ли. Возможно, что некоторым наиболее часто повторяющимся в белке аминокислотам соответствует не одна, а несколько разных кодовых групп. Одна и та же аминокислота может сесть на поверхность РНК и там, где друг за другом следуют азотистые основания в такой, говоря к примеру, последовательности — АГЦ и в такой — АЦГ, но нигде больше: никакое другое слово генетического алфавита ее не привлечет.
Итак, мы установили, что в генетическом алфавите всего четыре буквы, а все слова, из них составленные, трехбуквенные. Не правда ли, не верится, что этих символов и слов достаточно, чтобы закодировать весь бесконечно разнообразный план строения организма — от синтеза специфических для его тела белков до цвета глаз и свойств характера?
Слов, которыми записаны генетические фразы, очень много. В некоторых молекулах ДНК до 30 тысяч азотистых оснований. Число их взаимных сочетаний поистине бесконечно. Ведь если бы даже азотистых оснований в каждой ДНК было всего по сто, полная коллекция их различных сочетаний достигла бы 4100
. Четыре в сотой степени! Это больше, чем атомов во всей Солнечной системе!А ведь молекулы ДНК содержат не сто, а тысячи и десятки тысяч азотистых оснований! Трудно даже вообразить, какое великое множество генетических фраз, иначе говоря генов, способны они образовать, объединяясь друг с другом в разной последовательности.
Подсчитали также, что, если бы удалось все молекулярные нити ДНК извлечь из клеток человека и развернуть их в одну цепь, она протянулась бы через всю Солнечную систему!
После этих упражнений в арифметике вы теперь, надо полагать, с большим уважением относитесь к четырем буквам генетического алфавита: их выразительные способности действительно безграничны.
Что же собой представляют четыре всемогущие буквы?
Соединения азота, углерода, водорода и кислорода.
Каждое из оснований в молекуле ДНК соединено с сахаром. Сахар не простой: в нем не шесть, как в обычных сахарах, а только пять атомов углерода. У сахара, который входит в состав ДНК, его называют дезоксирибоза, на один атом кислорода меньше, чем у рибозы — сахара РНК.
Сахара связаны в длинные цепи фосфорной кислотой. Но это не все: две сахарно-фосфорные нити ДНК соединяются в одну спирально закрученную молекулу. Соединяются так, что азотистые основания двух нитей-антиподов, цепляясь попарно друг за друга, образуют как бы перекладины лестницы. Притом аденин всегда соединяется с тимином, а гуанин — с цитозином.