Вернемся к вопросу, который мучил исследователей все сто лет изучения манускрипта и, по сути, остается открытым сейчас: может быть, «манускрипт Войнича» — не зашифрованный текст и не образчик искусственного языка, а просто написанная неведомым шутником бессмыслица?
Для начала попытаемся ответить на вопрос: а какими вообще критериями мы можем пользоваться, определяя: осмысленный перед нами текст или просто некие каракули? Оказывается, уже много столетий назад филологами, лингвистами, криптоаналитиками разрабатывались возможности проведения статистического анализа языков. Существует понятие «частотный анализ», или «частотный криптоанализ»: это способ установить определенные закономерности и последовательности в текстах — как обычных, так и зашифрованных. Законы частотного анализа гласят: в любом языке существуют свои определенные правила. Так, в текстах того или иного языка определенная буква будет повторяться с более или менее постоянной частотой; сложившиеся стойкие сочетания букв также будут присутствовать в текстах с определенной последовательностью и так далее. То есть любой язык, текст, надпись — не хаос нарисованных (написанных) значков, а строгая закономерность! Первые работы, которые можно назвать современным словосочетанием «частотный криптоанализ», появлялись еще в эпоху раннего Средневековья. Так, значительный вклад в это дело внесли арабские ученые, в частности философ, математик и астроном IX века Аль-Кинди.
В ХХ веке был выведен так называемый закон Ципфа: закономерность распределения частоты слов естественного языка. Еще в 1908 году французский стенографист Жан-Батист Эсту в работе «Диапазон стенографии» сформулировал основные законы этой закономерности, а в 1940-х годах американский лингвист Джордж Кингсли Ципф начал активно использовать и популяризировать ее, в частности для статистических исследований. В упрощенном виде закон Ципфа можно представить так: если все слова определенного языка или любого достаточно объемного текста расположить по убыванию частоты их использования, то сложится четкая пропорция: частота слова (например, 15-го в списке) будет обратно пропорциональна его порядковому номеру.
А теперь самое главное: «манускрипт Войнича» неоднократно рассматривали с применением формул Ципфа. Во время первых попыток статистического анализа текста выявились закономерности, актуальные для естественных языков. Некоторые слова встречаются только в определенных разделах или только на нескольких страницах, некоторые — рассеяны по всей рукописи. Большинство слов недлинные — до 10 символов, при этом довольно много слов, совсем незначительно отличающихся написанием друг от друга. Есть места, где одно и то же слово написано два-три раза подряд.
Итак, результат удивительный: присутствуют все признаки языка. Неизвестного, неведомого, непонятного — но это не декоративная абракадабра и не чья-то неудачная шутка. Это связный текст. Но… нечитаемый. Пока или в принципе?
3.2. 1930-е годы: манускрипт «молодеет»! Или… нет?
В 1931 году (видимо, по инициативе самой Этель Лилиан Войнич) с манускриптом начали работать специалисты Католического университета в Вашингтоне, в частности Теодор Петерсен и Теодор Холм. Они сделали множество фотокопий (вдобавок к тем, что уже имелись), составили подробнейшие описания текста и иллюстраций загадочного документа (и результатами их деятельности потом пользовались еще несколько поколений исследователей), но, к сожалению, каких-либо серьезных научных прорывов им осуществить не удалось. Несмотря на это, в обширной переписке представителей Католического университета с Этель Войнич и Энн Нилл содержится много любопытных деталей. Например, Теодор Петерсен выделил в тексте наиболее часто повторяющиеся слова (если это, конечно, слова) и обратил внимание на закономерности в сочетаниях отдельных символов. Также он высказал некоторые предположения относительно того, какие растения из числа изображенных в манускрипте можно идентифицировать.
Современник Петерсена, Теодор Холм, датчанин по происхождению, был высокообразованным ботаником и зоологом. Он также писал о том, что как минимум полтора десятка из числа представленных в манускрипте растений явно представляют собой обычную европейскую флору. Например, изображение на странице 9 он определил как трехцветную фиалку, у нас известную как «анютины глазки» (
Также согласно заключению Холма в манускрипте можно увидеть коноплю (