Обобщенный закон Ципфа также выполняется внутри определенных ограниченных словарных составов. Например, специалисты в области одной эзотерической дисциплины, называемой агиоантропонимией и занимающейся исследованием случаев использования имен святых для именования обычных людей (см. [322]), установили, что к таким именам закон Ципфа вполне применим и к фамилиям. Означает ли это, что соответствующие деревья масштабно - инвариантны?
Показатель
Dесть фрактальная размерность. Мы заметили, что показатель D формально является фрактальной размерностью. Это наблюдение не столь поверхностно, как может показаться. В самом деле, если перед словом (в том виде, в каком мы его определили) поставить десятичную запятую, то это слово окажется ничем иным, как числом в интервале от 0 до 1, записанным в системе счисления с основанием (N+1) и содержащим нули только в конце. Отметим такие числа на интервале [0,1] и добавим сюда предельные точки этого множества. Построение, в сущности, сводится к удалению из интервала [0,1] всех чисел, содержащих нули в иных, кроме конца, позициях. В результате получаем канторову пыль, фрактальная размерность которой в точности равна D.Что же касается других, отличных от простейших, масштабно-инвариантных лексикографических деревьев, к которым мы обращались выше за обобщенным доказательством закона Ципфа, то они аналогичным образом соответствуют обобщенным канторовым множествам с размерностью D
. Уравнение для D в [326] представляет собой матричное обобщение определения размерности подобия с помощью равенства NrD=1.Дальнейшее обобщение: случай
D>1. Любопытно, что условие D<1 вовсе не является универсальным. Примеры, в которых обобщенный закон Ципфа выполняется, но оценка размерности D удовлетворяет неравенству D>1, весьма редки, однако, несомненно, имеют место. Для описания роли особого значения D=1 допустим, что закон P=F(ρ+V)−1/D выполняется только до некоторого значения ρ=ρ*≤∞. При D<1 не возникает никаких трудностей с составлением бесконечных словарей, предполагаемых вышеприведенными теоретическими рассуждениями. Однако при D≥1 бесконечный ряд ∑(ρ+V)−1/D расходится. Следовательно, согласно условиям ∑P=1 и F>0, величина P* должна быть конечна, т.е. словарь должен содержать конечное число слов.В самом деле, размерность D>1
, как выясняется, встречается только в тех случаях, когда словарь противоестественным образом ограничен какими-то внешними искусственными средствами (как, например, в случае вставок латинским шрифтом в нелатинский текст). Такие особые случаи рассматриваются в моих статьях, посвященных этой теме. Поскольку построение, ограниченное конечным количеством точек, не может дать фрактального множества, величину D>1 не следует интерпретировать как фрактальную размерность.ТЕМПЕРАТУРА ПОВЕСТВОВАНИЯ
Вышеописанные отклонения допускают на мгновение совершенно иную интерпретацию, идею которой мы позаимствовали в статистической термодинамике. Аналогами физической энергии и физической энтропии послужат стоимость кодирования и информация Шеннона. А показатель D
выступит в роли «температуры повествования». Чем «горячее» речь, тем больше вероятность употребления редких слов.Случай D<1
соответствует стандартному случаю, в котором формальный эквивалент энергии не ограничен сверху.С другой стороны, случай, в котором слова настолько «горячи», что это приводит в результате к D>1
, предполагает в высшей степени необычное наличие у энергии конечной верхней границы.Вскоре после того, как я описал эту резкую дихотомию в терминах лингвистической статистики, независимо от меня был найден ее физический аналог. Обратная физическая температура 1/θ
имеет наименьшее значение – и даже обращается в нуль, - когда тело нагрето до наивысшей температуры. Норманн Рэмзи предположил, что если тело подвергать дальнейшему нагреву, величина 1/θ должна стать отрицательной. Обсуждению этого параллелизма посвящена моя статья [360].В термодинамике объемные свойства объектов выводятся на основании микроканонической равно вероятности. Поскольку молекулы мы в лицо не различаем, допущения касательно их возможных состояний не вызывают у нас сильных эмоций, однако слова обладают ярко выраженной индивидуальностью, поэтому при изучении языка допущение о равновероятности вряд ли будет имеет успех.
Предыдущая аналогия становится особенно уместной в рамках определенных обобщенных подходов к термодинамике. Рискуя заслужить обвинение в чрезмерном цитировании работ, имеющих лишь косвенное отношение к настоящему эссе, все же скажу: один из таких формализмов я рассматривал в статьях [339, 344].
ЗАКОН ДОХОДОВ ПАРЕТО