Впрочем, к реальности это применимо плохо: ведь для того чтобы сравнивать таким образом грамматики естественных языков, нужно иметь грамматики для того самого условного марсианина на основе некоторых единых принципов описания – а очевидно, что таких не существует. Поэтому приходится искать какие-то корреляты языковой сложности, которые можно измерить, чтобы вычислить, какие языки сложнее, а какие проще.
Во-первых, один из таких коррелятов – это разнообразие элементов. Так, если в каком-то языке 8 согласных, а в каком-то другом – 60, то очевидно, что первый язык по системе согласных проще, чем второй.
Во-вторых, усложняющим фактором является невзаимнооднозначное соответствие между формой и значением на уровне грамматики языка. Например, если одна и та же форма в некотором языке образуется десятью разными способами, то это сложнее, чем если эта форма образуется одним способом. Скажем, в английском языке множественное число у абсолютного большинства существительных образуется регулярно при помощи одного и того же окончания -
Еще один коррелят сложности – это невзаимнооднозначное соответствие между формой и значением на уровне уже не грамматики, а текста: если одно и то же значение выражается в тексте несколько раз. Такое явление в языках мира называется согласованием. Если мы переведем на английский язык словосочетание
Зачем все это нужно? Ясно, что человеческий язык – это продукт эволюции. Ему уже примерно 100 000 лет, и если бы это было какое-то избыточное переусложнение, оно уже давно устранилось бы. Но нет – такие явления могут и возникать, и сохраняться, и утрачиваться, а никакого единого вектора развития не существует. Дело в том, что языковая сложность так или иначе выгодна и говорящему, и слушающему, причем разные ее аспекты выгодны разным участникам коммуникации.
Разнообразие элементов позволяет делать тексты короче. Скажем, если в языке 8 согласных, то обычно слова в нем будут длиннее, чем в языке с 60 согласными. Это видно на простом математическом примере: если одно и то же число записать в двоичной системе счисления, где символов только два, и в десятичной, где символов десять, то десятичная запись обычно будет примерно в три раза короче двоичной: например, 91 08910 (5 цифр) = 101100011110100012 (17 цифр).
То же касается и нерегулярности в грамматике. Если мы вернемся к английскому множественному числу и посмотрим, как устроены те формы, которые образуются не по правилам, то они обычно короче, чем были бы, если бы были регулярными. Скажем, несуществующая, но регулярная форма *
Невзаимнооднозначность соответствия между формой и содержанием на уровне текста позволяет делать сообщения избыточными. Это может быть очень полезно слушающему, потому что в коммуникации постоянно происходят помехи. Так, если мы слышим английское словосочетание