Читаем Алло, робот! полностью

Объясняется эта формула следующим образом. Подсчитайте на большом материале, сколько раз встречается то или иное слово. Запишите затем все частоты слов в список в порядке убывания частот: первым поставьте самое «популярное» слово, вторым — следующее за ним по частоте, и т. д., пока на последнем месте не окажется самое редкое слово. Список занумеруйте. И затем, если вы перемножите частоту слова на номер этого слова в списке (р на s), то получите постоянную величину!

И первое, и десятое слова, и любое другое слово в списке, номер которого будет умножен на частоту этого слова, даст одну и ту же величину! Этот закон приложим к любому языку, любому тексту (за исключением поэтических, как выяснилось позднее).

Чем объясняется эта удивительная особенность нашего языка? Французский ученый Мандельброт объяснил «закон Ципфа» с помощью теории информации, заодно несколько уточнив его. Этот закон «отвечает стремлению к оптимальному распределению информации среди имеющихся в языке слов, с тем чтобы полностью использовать возможности данного кода», — писал он.

<p>ФОРМУЛЫ ГРАММАТИКИ</p>

Если бы Юл принял то определение, какое давал слову Ципф, он, вероятно, пришел бы к открытию этого закона Но, увы! У лингвистов нет точных критериев определения слова. Академик В. В. Виноградов в своей книге «Русский язык», вышедшей в конце 40-х годов, приводил около сорока различных определений, которые давали слову языковеды.

За время, истекшее с тех пор, к старым определениям прибавилось еще множество других: с позиции математической лингвистики, теории информации, теории множеств (например, слово — это минимальный промежуток между двумя пробелами). Попробуйте-ка выбрать подходящую «единицу счета» для составления частотного словаря и других статистических исследований!

Вот почему ученые задумались над тем, чтобы к изучению языка применить не только количественные, но и другие разделы математики. Ибо, по справедливому замечанию французского лингвиста Фердинанда де Сос-сюра, предтечи современного точного языкознания, «до сих пор в области языка довольствовались операциями над единицами, как следует не определенными».

Ольга Сергеевна Кулагина предложила применять математическую теорию множеств для определения грамматических понятий. Это было вызвано практическими причинами: необходимо было дать четкие критерии для машинного перевода. Но из прикладной эта задача вскоре стала на повестку дня языковедов-теоретиков.

Идея Кулагиной породила ряд работ как в математике, так и в лингвистике, посвященных «формулам грамматики», определению законов языка на основании теории множеств.

Специалист по математической логике В. А. Успенский, лингвист И. И. Ревзин, математик Р. Л. Добрушин предложили ряд «математико-грамматических» моделей языка. Академик А. Н. Колмогоров предложил свою математическую модель определения падежа (известный лингвист Р. О. Якобсон считает «определение падежа по Колмогорову» лучшим определением падежа, которое когда-либо было предложено в языкознании).

Возьмем две русские фразы, в каждой из них заменим многоточием какое-либо слово, например:

… кипит.

Кошка пьет …

Теперь будем подставлять в каждую из фраз вместо многоточия какое-либо слово. Например, слово «молоко». Получим:

Молоко кипит.

Кошка пьет молоко.

Обе фразы осмысленны и грамматически правильны. Поставим теперь вместо многоточий какое-нибудь другое слово. Например, слово «вода». Получим:

Вода кипит.

Кошка пьет вода.

Для слова «молоко» обе фразы с точками равноценны, эквивалентны. И «молоко кипит», и «кошка пьет молоко» — правильные русские предложения. Но для слова «вода» первая фраза с точками подходит, а вторая — нет: «кошка пьет вода» по-русски не говорят. Значит, для слова «вода» фразы с многоточиями — «… кипит» и «кошка пьет …» — неравноценны, неэквивалентны.

Возьмем теперь не две, а несколько фраз с многоточиями. В каждую из них подставим вместо точек слово «молоко». «… кипит», «кошка пьет …», «кошка любит …», «я смотрю на …», «хорошее …». Все эти фразы равны друг другу. Равны в том смысле, что в любую из них можно подставить слово «молоко» и получить осмысленную и грамматически верную фразу.

Все множество русских фраз с многоточиями можно разбить на непересекающиеся классы. Эти классы А. Н. Колмогоров и предложил называть падежами.

<p>ЯЗЫК-ПОСРЕДНИК</p>

Придет время, когда в школьных учебниках русского и любого другого языка мира появятся числа и формулы. Законы математики с одинаковым успехом приложимы и к русскому, и к английскому, и к любым другим языкам мира…

А раз так, нельзя ли, опираясь на эти законы, создать некий универсальный язык? Язык, в котором бы нашли отражение закономерности всех живых языков мира?

Перейти на страницу:

Похожие книги

115 сочинений с подготовительными материалами для младших школьников
115 сочинений с подготовительными материалами для младших школьников

Дорогие друзья!Сочинение – это один из видов работы по развитию речи, который предполагает самостоятельное, продуманное изложение вами своих мыслей в соответствии с требуемой темой.Работа над сочинением развивает мышление, речь, позволяет выразить свой взгляд на мир. Такой вид работы способствует осознанию окружающего мира, действительности, самих себя. Кроме того, сочинение учит аргументированно доказывать и отстаивать свою точку зрения.В данном пособии вы найдёте методику написания сочинений, а также различные виды сочинений с планами и подготовительными материалами.Не забывайте, что сочинение – это прежде всего творческая работа, которая не терпит шаблона. Советуем вам не использовать представленные в пособии сочинения для бездумного, механического переписывания их в свои тетради. Наши сочинения – это возможные варианты раскрытия определённых тем, которые, надеемся, помогут вам при создании самостоятельных текстов.Желаем успехов!

Ольга Дмитриевна Ушакова

Детская образовательная литература / Школьные учебники и пособия, рефераты, шпаргалки / Книги Для Детей