Читаем Введение в теоретическую лингвистику полностью

С первого взгляда это может показаться несколько странным. Однако рассмотрим сначала предельный случай полной предсказуемости. В письменном английском языке появление буквы u, когда она следует за q, почти полностью предсказуемо; если отвлечься от некоторых заимствованных слов и собственных имен, можно сказать, что оно полностью предсказуемо (его вероятность равна 1). Подобно этому, вероятность слова to в таких предложениях, как I want . . . go home, I asked him . . . help me [29] (предполагается, что пропущено только одно слово), равна 1. Если бы мы решили опустить u (в queen 'королева', queer 'странный', inquest 'следствие' и т. п.) или слово to в упомянутых контекстах, никакой информации не было бы потеряно (здесь мы наблюдаем связь между обычным и более специальным значением слова «информация»). Поскольку буква u и слово to не находятся в парадигматическом контрасте ни с какими другими единицами того же уровня, которые могли бы встретиться в том же контексте, вероятность их появления равна 1, а их информационное содержание — 0; они целиком избыточны. Рассмотрим теперь случай двучленного контраста, где рх = 2/3 и ру = 1/3. Ни один из членов не является целиком избыточным. Но ясно, что пропуск х приводит к меньшим последствиям, чем пропуск у. Поскольку появление х вдвое вероятнее, чем появление у, получатель сообщения (знающий априорные вероятности) имеет в среднем вдвое лучшие шансы «угадать» пропуск х, чем «угадать» пропуск у. Таким образом, избыточность проявляется в различной степени. Избыточность х в два раза больше, чем избыточность у. В общем, чем более вероятно появление единицы, тем большей оказывается степень ее избыточности (и тем ниже ее информационное содержание). 

2.4.3. БИНАРНЫЕ СИСТЕМЫ

Количество информации обычно измеряется в битах (этот термин происходит от англ. binary digit 'двоичный знак'). Всякая единица с вероятностью появления 1/2 содержит один бит информации; всякая единица с вероятностью 1/4 несет 2 бита информации, и так далее. Удобство такого измерения количества информации станет очевидным, если мы обратимся к практической задаче «кодирования» множества единиц (сначала предположим, что вероятности их появления равны) группами двоичных знаков. В предыдущем разделе мы видели, что каждый элемент множества из восьми единиц может быть реализован отдельной группой из трех двоичных знаков (см. § 2.3.8). Это определяется связью между числом 2 (основанием двоичной системы исчисления) и 8 (количеством единиц, которые требуется различать): 8 = 23. В более общем виде, если N — это число единиц, которые следует различать, a m — это число позиций контраста в группах двоичных знаков, требуемых для их различения, то N = 2m. Связь между числом парадигматических контрастов на «высшем» уровне (N) и синтагматической длиной групп элементов «низшего» уровня (m), таким образом, логарифмическая: m = log2 N. (Логарифм числа есть степень, в которую следует возвести основание числовой системы, чтобы получить данное число. Если N = xm, то m = logx N 'если N равняется х в степени m, то m равняется логарифму N по основанию x'. Напомним, что в десятичной арифметике логарифм 10 равен 1, логарифм 100 равен 2, логарифм 1000 равен 3 и т. д., т. е. log10 10 = 1, log10 100 = 2, log10 1000 = 3 и т. д. Если бы теория информации основывалась на десятичной, а не на двоичной системе измерения, то было бы удобнее определять единицу информации в терминах вероятности 1/10. Читателю должно быть ясно, что приведенное здесь равенство N = 2m — это частный случай равенства N = р1 x р2 x р3, ..., рm, введенного в § 2.3.8. Равенство N = 2m  справедливо, если в каждой позиции синтагматической группы в парадигматическом контрасте находится одно и то же число элементов.

Перейти на страницу:

Похожие книги

В лаборатории редактора
В лаборатории редактора

Книга Лидии Чуковской «В лаборатории редактора» написана в конце 1950-х и печаталась в начале 1960-х годов. Автор подводит итог собственной редакторской работе и работе своих коллег в редакции ленинградского Детгиза, руководителем которой до 1937 года был С. Я. Маршак. Книга имела немалый резонанс в литературных кругах, подверглась широкому обсуждению, а затем была насильственно изъята из обращения, так как само имя Лидии Чуковской долгое время находилось под запретом. По мнению специалистов, ничего лучшего в этой области до сих пор не создано. В наши дни, когда необыкновенно расширились ряды издателей, книга будет полезна и интересна каждому, кто связан с редакторской деятельностью. Но название не должно сужать круг читателей. Книга учит искусству художественного слова, его восприятию, восполняя пробелы в литературно-художественном образовании читателей.

Лидия Корнеевна Чуковская

Документальная литература / Языкознание / Прочая документальная литература / Образование и наука / Документальное
Основы риторики: Учебное пособие для вузов
Основы риторики: Учебное пособие для вузов

Рекомендовано Советом по филологии Учебно-методическогообъединения по классическому университетскомуобразованию в качестве учебного пособия для студентоввысших учебных заведений, обучающихся по направлению520300 и специальности 021700 — «Филология»К 250-летию Московского государственного университета им. М.В. ЛомоносоваИздание осуществлено при финансовом участии филологического факультета МГУ им. М.В. ЛомоносоваРецензенты;доктор филологических наук профессор М.Л. Ремнева,доктор филологических наук профессор В.И. АннушкинКнига содержит систематическое изложение понятий и категорий общей риторики; она создана на основе курса лекций, который читается автором на филологическом факультете МГУ им. М.В. Ломоносова, и является руководством для студентов и аспирантов, изучающих риторику. Книга адресована также специалистам, интересующимся проблемами риторики, преподавателям риторики и всем, чья профессиональная или общественная деятельность связана с публичной аргументацией: юристам, политикам, журналистам, философам, педагогам.

Александр Александрович Волков

Языкознание, иностранные языки / Языкознание / Образование и наука