Рассказ еще об одном приложении – на новом этапе развития медицины – начну с описания трагедии. Семья раввина ортодоксальной еврейской общины Нью–Йорка потеряла несколько новорожденных детей. Медики выяснили, что причина – в одной точечной мутации геномов на идентичном месте у него и у его жены. Те же проблемы были и у других членов общины: из-за ее замкнутости несколько мутаций встречались в ней значительно чаще, чем в среднем. Собрали деньги для генетического исследования – несколько миллионов. Однако их не хватало на полное обследование. Доктор Эрлих из института Уайтхэд нашел выход: он предложил делать генетический анализ групп, как Дорфман. Это сократило стоимость в несколько раз. Денег хватило. С тех пор раввин хранит у себя эту информацию и разрешает браки исходя из нее. Благодаря этому в общине больше не появлялись мертворожденные дети!
Второе «пришествие» идеи, похожей на идею Дорфмана, но в гораздо более сложной ситуации, произошло примерно в те же годы.
Выпускник МIТ Клод Шэннон долго не мог найти себя: защитил PhD по биологии, потом без особого успеха занимался абстрактной топологией. С началом Второй мировой войны он был командирован в компанию «Bell Labs» для участия в рассекреченном через много лет проекте «Х» создания безопасной передачи сообщений, совместно с У.Фридмном, А.Тьюрингом и С.Кульбаком.
Там он и создал теорию информации – возможно, наряду с атомной энергией, величайшее открытие, которое Америка дала миру в ХХ веке. Он предложил рассматривать поток передаваемых сообщений как стационарный случайный процесс, что позволило изобрести способ кодирования, оптимальный для сокращения времени передачи и подавления шумов.
Идею кодирования и декодирования сперва объясним на простейшем примере. Пусть имеем 1024 сообщения. Занумеруем их и присвоим каждому сообщению код – двоичное разложение его номера из 10 двоичных символов. Надо определить, какое из сообщений послано, если мы можем передавать сообщения последовательностями нулей или единиц («по двоичному каналу»). Тогда, передав двоичное разложение номера сообщения из 10 двоичных символов, на приемном конце безошибочно определят номер и само сообщение.
Эта схема еще далека от примера Дорфмана. В последней публикации Шэннон объявил, что решил проблему о наибыстрейшей передаче, когда несколько передатчиков посылают сообщения одновременно по одному каналу связи. Неожиданная болезнь Альцгеймера помешала ему обнародовать этот результат. Его получил позже Р.Альсведе. Вот эта проблема уже очень близка к нашему первому примеру, но выяснилось это только в конце семидесятых. А именно: занумеруем всех испытуемых и будем считать, что те из них, кто болен, «сообщают» о своих номерах двоичными последовательностями результатов проверок. Тогда размещение испытуемых по проверкам соответствует кодированию, а анализ результатов – декодированию.
А теперь я рискну рассказать о причине моего интереса к теории информации. Заниматься планированием эксперимента мне поручил А.Колмогоров, в новую большую лабораторию которого я был распределен после защиты кандидатской диссертации по чистой математике (в ней я решил знаменитую многомерную краевую задачу Пуанкаре – после более полувека отсутствия идей ее решения). Колмогоров плохо понимал рассказы Налимова – дилетанта в математике – и решил, что математик вроде меня поможет ему разобраться в деятельности большого отдела Налимова [25]. За несколько лет до моего общения с Сашей Лысянским я и мой начальник Л.Мешалкин прочли в книге В.Налимова (и моей однокурсницы Н.Черновой) о трагической истории, связанной с методом случайного баланса (МСБ) для нахождения существенных факторов качества продукта. Этот метод (описать его здесь сложно) был опубликован в новом прикладном журнале Technometrics в 1959 году известным американским статистиком с упоминанием десятков решенных им производственных задач. МСБ был революционным для традиционной статистики того времени: вместо классического планирования экспериментов использовались случайные планы, вместо классического метода анализа – визуальный.
В оскорбительной грубой дискуссии, опубликованной там же, метод был «похоронен» крупнейшими статистиками того времени, проглядевшими ключевое предположение автора, аналогичное сделанному Дорфманом: об относительной ничтожности числа существенных факторов. Автор метода не выдержал позора и попал в психиатрическую лечебницу, из которой так и не вышел. Ни автор, ни участники дискуссии, ни Налимов не имели понятия об опубликованной за десять лет до этого теории информации, дававшей ключ к пониманию эффективности МСБ.