Однако вот что любопытно (и отчасти подтверждает, что в гипотезе Канчо-Соле есть рациональное зерно) — что в этом своем математическом анализе свойств воображаемого языка испанские исследователи наткнулись на вполне ощутимое свойство языков реальных, современных. Как мы уже мельком отметили, то ("самое взаимовыгодное") распределение частоты употребления разных слов, которое они нашли в результате математических расчетов, действительно характерно для многих существующих человеческих языков. В лингвистике оно называется "степенным законом", или еще — "законом Зипфа". Мало кто, кроме узких специалистов, знают об этом законе, наверняка еще меньше — о его авторе, поэтому тут будет уместно сделать небольшое отступление и сказать о нем несколько слов. Тем более, что это любопытная история сама по себе.
Джордж Кингсли Зипф прожил короткую жизнь: 1902-1950. Он был лингвистом и филологом и 20 лет преподавал немецкий язык в Гарвардском университете, параллельно увлекаясь китайским. Как пишет о нем знаменитый математик Бенуа Мандельброт, Зипф называл себя "специалистом по статистической социальной экологии". Он искал общие законы социологии, прилагая физические идеи и статистические методы к социальным явлениям, и был убежден, что все эти явления определяются двумя противоборствующими силами — выше мы назвали их "силой, толкающей к однообразию", и "силой, толкающей к многообразию", (это как раз были термины Зипфа), а результат такого противоборства диктуется принципом наименьшего действия. Свои идеи Зипф изложил в книге, которую так и назвал: "Человеческое поведение и принцип наименьшего действия" и которую издал незадолго до смерти, кажется, на собственные деньги.
Мандельброт так пишет об этой книге: "То было одно из тех сочинений, в которых проблески гениальности, вспыхивающие в самих разных направлениях, почти заслоняются кучей совершенно взбалмошных и экстравагантных идей. С одной стороны, автор обсуждает форму половых органов с точки зрения экономии затрат и оправдывает включение (аншлюс) Австрии в нацистскую Германию тем, что это улучшает приложимость некой математической формулы. С другой стороны, он наполняет страницы графиками и таблицами, которые неутомимо бьют в одну и ту же точку, доказывая, что социальная статистика лучше всего объясняется одними и теми же степенными законами. Физики и астрономы легко могут узнать в этих формулах Зипфа некоторые хорошо известные им законы своих наук. Поэтому им трудно будет понять, чем было продиктовано то яростное сопротивление, с которым было встречено применение Зипфом тех же законов к наукам социальным".
А вот как лауреат Нобелевской премии физик Гелл-Манн объясняет простейший закон Зипфа: "Положим, мы откроем статистический справочник и найдем там список крупнейших городов США, расположенных по порядку убывания населения, причем каждому городу будет приписан его "ранг": 1 — для самого большого, 2 — для следующего и так далее. Существует ли какой-нибудь общий закон, показывающий, как убывает население города по мере увеличения его "ранга"? Грубо говоря, да. С достаточной точностью население города обратно пропорционально его "рангу": если население первого принять за единицу, то население второго будет 1/2, третьего — 1/3 и так далее.
Глянем теперь на список крупнейших фирм, расположенных в порядке убывания их оборота. Существует ли здесь какой-либо приблизительный закон, связывающий объем оборота с "рангом" фирмы? Да, и это тот же закон, что для населения: оборот фирмы обратно пропорционален ее рангу. А как насчет экспорта из данной страны в порядке его убывания? Оказывается, и тут ситуация хорошо описывается тем же законом. Тогда отложим в сторону статистический справочник и возьмем в руки руководство по кодам, в котором имеется список самых распространенных английских слов в порядке убывания частоты их встречаемости в произвольном английском тексте. Мы опять увидим тот же закон обратной пропорциональности — он так же хорошо работает в языке, причем не только в английском".
Это последнее применение степенного закона — к языку — как раз и имеют чаше всего в виду, когда говорят о "законе Зипфа". На графике он изображается известной школьной кривой — гиперболой. Эта кривая отражает тот общепонятный факт, что некоторые немногие английские слова (в первую очередь — the, of, to, a, and, in, that, for, was, with, his, is) встречаются очень часто, подавляющее большинство слов встречаются со средней частотой и есть небольшое количество слов (очень длинных, вроде эллочкиного "эксгибиционизм"), которые встречаются очень редко.
Что гораздо менее очевидно — это то, что если расположить слова по частоте встречаемости (что и будет их "рангом"), то частота встречаемости слова с рангом п будет 1/п. Таково математическое выражение того же закона, и именно эту особенность нашли Канчо и Соле. Поэтому множество слов, появившееся из их компьютера, как Афина из головы Зевса, действительно заслуживает звания "языка".