В следующей главе мы покажем, что симметрии каллиграммы Щербака имеют неожиданный количественный характер, то есть, по-видимому, даже более сущностны, нежели только что описано. Стоит, однако, отметить, что известные небольшие отклонения от универсального генетического кода могут серьезно нарушать симметрии каллиграммы. Например, генетический код митохондрий позвоночных, который, по одним представлениям, был предшественником универсального, а по другим – сам происходил из него, отличается тем, что у него отсутствуют нечетные группы вырожденности, так что две четные прямо соответствуют двум октетам Румера. При этом дублет TG
кодирует цистеин, если в третьей позиции триплета стоит пиримидин, и триптофан, если в третьей позиции – пурин. То же относится и к дублету АТ: ATY=I, ATR=M. И еще одно отличие от универсального: триплет AGR кодирует не аргинин, а сигналы терминации (0). Это означает, что описанная каллиграмма Щербака, сама по себе, как будто, не является обязательным условием организации генетического кодирования (земных?) организмов. Вместе с тем, Андрей Хренников и Сергей Козырев56, используя так называемые р-адические числа, показали наличие значительной регулярности и в этой версии генетического кода. Автор не берется комментировать их работу, поскольку ровно ничего не понимает в р-адических числах и в d-адических плоскостях. Однако, она каким-то образом связывает регулярную организацию (в том числе и симметрии) генетического кода с его защищенностью. В своих рассуждениях Хренников и Козырев отталкивались от представления кодирующих триплетов, предложенного Роз-Мари Свансон5757 и позднее уточненного Драганом Босняцким5858 с соавторами на основе подхода, используемого для решения хорошо известной Проблемы Путешествующего Продавца (ППП). В этом представлении последовательность кодирующих триплетов образует цикл, известный как «код Грея»:
Напомню, что кодом Грея называется любая циклическая
последовательность всех наборов из нулей и единиц, в которой два соседних набора отличаются только по одной компоненте (дельта Хемминга). Другими словами, код Грея – это система замкнутой организации числового ряда, в которой два соседних значения различаются только в одном разряде. Вот как выглядит 3-битный двоичный код Грея (каждое трехзначное число представлено здесь вертикально; то есть чтение его сверху вниз соответствует обычному чтению слева направо) в линейном представлении:
Первое и последнее числа (000
) совпадают, указывая на замкнутость ряда. Читателю предлагается обратить внимание на то, что числа кода Грея (двоичные в данном случае) расположены в последовательности, не совпадающей с натуральным рядом: преобразованные в десятичные, они дают здесь последовательность 0—1—3—2—6—7—5—4—0.В представлениях Свансон и Босняцкого кодировка Грея образует последовательность наборов (3-компонентных наборов, то есть, триплетов из 4-х оснований), в которой два соседних набора отличаются только по одному основанию (в одной и той же позиции). В последовательности, организованной по этому правилу, различаются (хотя и не слишком строго) группы, соответствующие размерам аминокислот («большим» и «малым»), а также их позициям в составе белковых молекул («наружным» или «внутренним», то есть, гидрофильным или гидрофобным). Описанное свойство дает генетическому коду дополнительную защищенность. Стоит вспомнить, что – как об этом пишет Википедия – «коды Грея широко используются для упрощения выявления и исправления ошибок в системах связи, а также в формировании сигналов обратной связи в системах управления
». Они применяются и в теории генетических алгоритмов для кодирования генетических признаков, представленных целыми числами, поскольку минимизируют эффект ошибок при преобразовании аналоговых сигналов в цифровые.