Читаем Теория языка: учебное пособие полностью

Первым частотным словарём был словарь Кединга (1898). За девяносто лет XX столетия было составлено несколько сот частотных словарей и частотных списков для нескольких десятков языков. Первым частотным словарём русского языка был словарь Г. Йоссельсона (США, Детройт, 1953). В нашей стране первый частотный словарь русского языка был составлен Э. Штейнфельд (1963). Интересны материалы к частотному словарю языка Пушкина (1963). В 1977 г. вышел в свет «Частотный словарь русского языка» под редакцией Л.Н. Засориной. Создавался он на основе выборки в один миллион словоупотреблений из четырёх жанров (художественная проза, драматургия, научная публицистика, газетно-журнальные материалы). В нём около 40 тыс. слов. Самое частотное слово – предлог в (во) далее идут служебные слова и местоимения (и, не, на, я, быть, что, он, с, а, как, это). Самое частотное существительное – год.

В 90-х гг. XX в. в Швеции вышел в свет «Частотный словарь современного русского языка» (Уппсала, 1993).

Идея частотных словарей возникла из практической потребности решения ряда вопросов: 1) создание рациональной методики изучения родного и иностранного языков; 2) усовершенствование различных кодовых систем; 3) выявление специфики разных стилей литературных памятников или языка отдельных авторов. Вслед за частотными списками слов появляются словари, отражающие частоты морфем и грамматических форм.

Частотные словари позволили обнаружить целый ряд количественных закономерностей в лексическом составе языка. Первые 1500 слов частотного словаря для любого языка составляют примерно 80 % всех словоупотреблений. Причём 12 самых частотных слов – артикли и предлоги – из 20 тыс. слов (словарь Эсту) составляют примерно 40 % всех словоупотреблений. По Г. Йоссельсону, в русском языке наречия, предлоги, союзы, частицы составляют 13,9 % всего текста. Сделан общий вывод, что первые 50 слов охватывают грамматический словарь любого языка.

Нет сомнения, что частотные словари окажутся мощным инструментом теоретического и практического языкознания. Они могут дать корректные в научном смысле выводы о структуре общенародной лексики и количественном соотношении её различных пластов, помогут решить проблему языковой нормы и строго определить понятие функционального стиля.

Характерно, что математические методы обладают следующими возможностями:

– делают точными суждения, основанные на количественно-частотных соображениях;

– указывают на такие обстоятельства функционирования языка или диалекта, которые иными способами не обнаруживаются;

– позволяют глубже и всесторонне понять причины и результаты языковой эволюции, длительность эволюционных процессов и их хронологию, и даже прогнозировать будущее языковое развитие;

– расширяют сферу прикладного использования языкознания [Русинов 1983: 42].

Количественная методика стала более эффективной с появлением вычислительной техники.

Определение авторства с помощью формально-количественных и статистических методов стимулировало поиск и выявление характерных структур авторского языка. На этом строятся многообразные методики, представленные в книге «От Нестора до Фонвизина. Новые методы определения авторства» (М., 1994).

Два специалиста исследовали несколько простых параметров авторского стиля и на базе большого количества произведений писателей XVIII–XX вв. статистически доказали, что доля всех служебных слов в данном прозаическом произведении является авторским инвариантом [Фоменко В.П., Фоменко Т.Г. 1996]. Д.В. Хмелев, опираясь на модель цепей А.А. Маркова, предложил методику определения авторства, основанную на том, что по произведениям автора, которые достоверно им созданы, вычисляется матрица переходных частот употреблений пар букв. Затем такие матрицы строятся для каждого из авторов, «подозреваемых» в написании анонимного текста, и для каждого автора оценивается вероятность того, что именно он написал анонимный фрагмент текста. В результате автором анонимного текста полагается тот, у которого вычисленная оценка вероятности больше [Хмелев 2000].

Перейти на страницу:

Похожие книги

Английский язык с Шерлоком Холмсом. Второй сборник рассказов (ASCII-IPA)
Английский язык с Шерлоком Холмсом. Второй сборник рассказов (ASCII-IPA)

Второй сборник детективных повестей Конана-Дойла о Шерлоке Холмсе, состоящий из:The Six Napoleons (Шесть Наполеонов)The Three Students (Три студента)The Second Stain (Второе пятно)The Musgrave Ritual (Обряд Месгрейвов)The Noble Bachelor (Знатный холостяк)The Beryl Coronet (Берилловая диадема)The Resident Patient (Постоянный пациент)Текст адаптирован (без упрощения текста оригинала) по методу Ильи Франка: текст разбит на небольшие отрывки, каждый и который повторяется дважды: сначала идет английский текст с «подсказками» — с вкрапленным в него дословным русским переводом и лексико-грамматическим комментарием (то есть адаптированный), а затем — тот же текст, но уже неадаптированный, без подсказок.Начинающие осваивать английский язык могут при этом читать сначала отрывок текста с подсказками, а затем тот же отрывок — без подсказок. Вы как бы учитесь плавать: сначала плывете с доской, потом без доски. Совершенствующие свой английский могут поступать наоборот: читать текст без подсказок, по мере необходимости подглядывая в подсказки.Запоминание слов и выражений происходит при этом за счет их повторяемости, без зубрежки.Кроме того, читатель привыкает к логике английского языка, начинает его «чувствовать».Этот метод избавляет вас от стресса первого этапа освоения языка — от механического поиска каждого слова в словаре и от бесплодного гадания, что же все-таки значит фраза, все слова из которой вы уже нашли.Пособие способствует эффективному освоению языка, может служить дополнением к учебникам по грамматике или к основным занятиям. Предназначено для студентов, для изучающих английский язык самостоятельно, а также для всех интересующихся английской культурой.Мультиязыковой проект Ильи Франка: www.franklang.ruОт редактора fb2. Есть два способа оформления транскрипции: UTF-LATIN и ASCII-IPA. Для корректного отображения UTF-LATIN необходимы полноценные юникодные шрифты, например, DejaVu или Arial Unicode MS. Если по каким либо причинам вас это не устраивает, то воспользуйтесь ASCII-IPA версией той же самой книги (отличается только кодированием транскрипции). Но это сопряженно с небольшими трудностями восприятия на начальном этапе. Более подробно об ASCII-IPA читайте в Интернете:http://alt-usage-english.org/ipa/ascii_ipa_combined.shtmlhttp://en.wikipedia.org/wiki/Kirshenbaum

Arthur Ignatius Conan Doyle , Андрей Еремин , Артур Конан Дойль , Илья Михайлович Франк

Детективы / Языкознание, иностранные языки / Классические детективы / Языкознание / Образование и наука