Видимо, для сравнения Фсуб
и Фсуб надо одним ии. предложить размышлять о повторяемости букв, представленных в виде алфавита, т. е. построить опыт так же, как это сделал Эттнив в первой группе своих информантов. Другая же группа ии. должна оценивать повторяемость букв, имея перед собой список, где русские буквы расположены в заведомо случайном по сравнению с алфавитным порядке.Такой эксперимент провел А. П. Василевич в конце 1960–х годов.
Самый интересный результат в этом эксперименте относится не к тому, что ии. действительно способны дать такие оценки Фсуб
букв, которые были бы близки к Фоб, — все же после опытов Эттнива это трудно было бы поставить под сомнение. Более важно другое — оказалось, что ии. имеют совершенно разный "внутренний масштаб" оценок.Инструкция в эксперименте Василевича предлагала ии. оценить частоту повторяемости букв в тексте длиной 1000 букв. При этом подчеркивалось, что, с учетом числа букв русского алфавита, это значит, что более частые буквы могут встретиться более чем 31 раз, а менее частые — менее чем 31 раз. Но это не помешало ии. дать отдельным буквам такие оценки Фсуб
, что их сумма доходила до 1250!Например, все ии. считают самой частой русской буквой букву а
. Здесь Фсуб четко расходится с Фоб- Ибо самой частой русской буквой в текстах, согласно надежной статистике, является о, далее идет е, буква а занимает только третье место.Впрочем, это не так важно. Более интересно иное: ии. приписывали букве а
Фсуб от 30 до 150! Но зато даже те ии., которые мыслят весьма "размашисто", этот масштаб сохраняют и в оценках других букв.Отсюда можно сделать любопытный вывод: человек, по–видимому, хорошо предсказывает относительные частоты и куда хуже — абсолютные.
Это, в общем, естественно — ведь для адекватного прогноза нам надо знать именно сравнительную вероятность того или иного события.
Таблица 3
Оценки относительной частоты встречаемости 15 букв русского алфавита
Буква | Данные опроса (Фсуб) | Данные подсчетов по текстам (Фоб) |
А | 1 | 3 |
0 | 2 | 1 |
Е | 3 | 2 |
И | 4 | 4 |
К | 5 | 14 |
С | 6 | 9 |
Н | 7 | 5 |
Р | 8 | 7 |
П | 9 | 13 |
Л | 10 | 10–11 |
в | 11 | 8 |
т | 12 | 6 |
м | 13 | 12 |
Б | 14 | 19 |
Д | 15 | 10–11 |
Важно, что стоит на первом месте, а что на пятом, т. е. важно знать порядок, относительный ранг буквы, слога или слова.
О мере адекватности оценок частоты встречаемости букв можно судить по данным табл. 3, где приведены сравнительные данные ФСуб
и Фоб для 15 букв русского алфавита.3. ОЦЕНКА ЧАСТОТЫ ВСТРЕЧАЕМОСТИ СЛОВ
Выше мы уже говорили о том, что, используя частотные словари, можно так выбрать слова, значение которых надо выучить в первую очередь, чтобы объем абсолютно необходимого словаря–минимума свести к 2,5–3 тыс. наиболее частых слов.
Это, в общем, верный путь. Однако — и это было отмечено в свое время французскими учеными, решавшими сходные практические задачи, — есть частые слова, которые почему–то регулярно не находят себе места в перечне того, что оказывается самым частым по данным частотных словарей.
Например, таково слово
Заметьте, что в тексте "Случай с Оливером" этот феномен отчасти проявился — в список наиболее частых слов не попал ни
Условимся называть обиходными
слова, именующие подобные предметы.Исследования французских ученых некогда показали, что о многих весьма "обиходных" и важных предметах мы не только не пишем, но и говорим о них редко, поэтому к редким словам, например, относятся