Читаем Семь раз проверь... полностью

Здесь перед нами тридцать две буквы русского алфавита. Но впечатление такое, словно все они взбунтовались и сорвались со своих привычных мест. Ничего подобного! Буквы стоят в безусловном порядке, но не в той последовательности, в какой мы привыкли их видеть в букварях и словарях. Наиболее «нужные» выдвинуты вперед, а те, которые реже встречаются в печати, потеснились на задние места. Этот порядок обусловлен относительной частотой появления в тексте каждой отдельной буквы. Например, для буквы «о» относительная частота составляет (в условном исчислении) 0,090, а для буквы «ф» — 0,002, то есть первая буква встречается в тексте в сорок пять раз чаще, чем последняя. Одинаково часто встречаются пары букв «а» и «и» (у них одинаковые значения частот), «т» и «н», «ы» и «з», «ь» и «б», «ю» и «ш», «щ» и «э», но букву «р» мы найдем в печати в четыре раза чаще, чем «й», а букву «ж» в пять раз реже, чем «л», и т.д.

Дальнейшие подсчеты показали, что четыре самые «нужные» буквы — «о», «е», «а», «и» — составляют около одной трети (33,9%) русского печатного текста. Следующую треть (33,6%) образуют шесть букв — «н», «т», «р», «в», «с», «д». И лишь последняя треть (32,5%) приходится на долю всех остальных двадцати двух букв.

Вместе с тем ученые обнаружили парадоксальное, на первый взгляд, явление: чем «нужнее» или употребительнее буква, тем меньше информации она содержит. В частности, информационная насыщенность каждой буквы первой группы почти в два раза ниже, чем буквы третьей группы (1,97 и 3,79 бита). В практическом отношении это означает, что реконструкция текстов с опорой на буквы третьей группы быстрее и точнее, чем с опорой на буквы двух первых групп. На основании всех указанных подсчетов профессор Г.Н. Кечхуашвили пришел к интересному выводу, что оставшиеся в сокращенном или искаженном тексте буквы в силу своих статистических связей сами как бы диктуют человеку, имеющему опыт чтения на данном языке, чего и где недостает [55, с. 34].

Становится все яснее, что мы ничуть не отвлеклись в сторону, занявшись вопросом о вероятности появления отдельных букв в тексте. Закономерность, установленная для «правильных» букв алфавита, как нетрудно убедиться, действительна и в отношении «неправильных» букв, то есть опечаток. Согласившись с заключением исследователей, что линотипист делает в среднем пять процентов ошибок (к количеству набранных строк), логично предположить, что «жертвой» неправильных действий оператора скорее будет расхожая буква «о», чем редкая «ф». Срывы и отказы в действиях оператора несомненно корреспондируют с частотой употребления отдельных букв в печати, хотя нельзя забывать, конечно, и о таких факторах, как расположение букв на клавиатуре наборной машины (и в гнездах кассы) и умение быстро распознавать буквы в оригинале.

Эмпирические данные подтверждают, что опечатки действительно чаще всего связаны с буквами «о», «е», «а», «и», «т», «н», занимающими первые места в таблице частот.

Осторожности ради, не следует считать эти данные полными и окончательными, пока не произведены более капитальные исчисления. Однако уже сейчас ориентировочные значения частот появления отдельных букв алфавита в печати могут помочь в работе с печатными текстами, особенно в тех случаях, когда при переиздании ранее опубликованных произведений (например, сочинений классиков литературы и науки) необходимо идентифицировать (опознать) опечатку, то есть доказать, что в таком-то месте допущено искажение, а не приводятся подлинные слова автора.

Вот, кстати, любопытный пример, который сам, что называется, подвернулся под руку. В корректуре одной литературоведческой статьи оказалась такая фраза: «Есенин вернулся в Москву изМуренным, больным». Искаженное слово можно было прочесть двояко: и «измученным» и «изнуренным». На какой же букве споткнулся наборщик?

Прежде чем обратиться к первоисточнику (приведенная фраза — это цитата из книги), мы решили справиться в таблице частот букв русского алфавита. Ориентировочное значение частоты для буквы «н» равняется 0,053, а для буквы «ч» намного меньше — 0,012. Заглянув после этого в книгу, мы прочитали именно то, что было подсказано математикой: «Есенин вернулся в Москву изнуренным, больным».

Это маленькое «открытие» настолько нас заинтересовало, что мы решили проверить, как часто случаи смешения букв в наборе (известно, что это самый распространенный вид опечаток) подчиняются математическим закономерностям. С этой целью мы взяли первый попавшийся лист корректуры и выписали из него ряд ошибочных букв, стоявших на месте правильных: «к» вместо «н», «ц» вместо «з», «в» вместо «н», «д» вместо «р», «п» вместо «с», «а» вместо «о», даже «ы» вместо «а» и т.д.

Перейти на страницу:

Похожие книги

Основы русской деловой речи
Основы русской деловой речи

В книге подробно описываются сферы и виды делового общения, новые явления в официально-деловом стиле, а также языковые особенности русской деловой речи. Анализируются разновидности письменных деловых текстов личного, служебного и производственного характера и наиболее востребованные жанры устной деловой речи, рассматриваются такие аспекты деловой коммуникации, как этикет, речевой портрет делового человека, язык рекламы, административно-деловой жаргон и т. д. Каждый раздел сопровождается вопросами для самоконтроля и списком рекомендуемой литературы.Для студентов гуманитарных вузов, преподавателей русского языка и культуры профессиональной речи, а также всех читателей, интересующихся современной деловой речью.2-е издание.

авторов Коллектив , Коллектив авторов

Языкознание, иностранные языки / Языкознание / Образование и наука
Исключение как правило
Исключение как правило

В монографии обсуждаются переходные единицы, занимающие промежуточное положение между лексикой и грамматикой, между разными грамматическими уровнями, обладающие непрозрачностью формы и некомпозициональностью содержания, не вписывающиеся в традиционные лингвистические классификации. Причиной появления таких переходных единиц авторы считают процессы идиоматизации. В исследовании подчеркивается, что идиоматизация – один из постоянных и важнейших процессов конвенциализации речевого потока языковым сообществом. Результаты этого процесса проявляются в огромном числе полуоформленных фрагментов и размывании границ между языковыми уровнями. Речевые единицы на границах этих уровней и являются главным объектом описания в этой книге.

Михаил Вячеславович Копотев , Татьяна Ивановна Стексова

Языкознание, иностранные языки