Читаем Актуальные проблемы современной лингвистики полностью

Рассмотрим указанные и иные относящиеся к ним вопросы в определенной последовательности. Для начала зафиксируем исходные позиции, которые заключаются, по-видимому, в следующем.

Моделирование процессов восприятия речи (во всяком случае, на материале русского языка) включает в себя такие подготовительные этапы, как:

• формирование представительного корпуса текстов (на начальном этапе – в орфографической записи) с акцентуацией словоформ и разметкой согласно специально разработанной системы аннотирования;

• создание, на базе корпуса текстов, словаря для моделирования восприятия речи; единицей словаря выступает словоформа с индексом частотности.

На настоящий момент общий объем нашего корпуса – 1 031 920 словоупотреблений.

На основании подкорпуса объемом 322 тысячи словоупотреблений организован частотный словарь словоформ, включающий 63 742 единицы и словарь фонетических слов объемом 84 174 единицы. Этот подкорпус имеется также в транскрибированном виде. Автоматическое транскрибирование текстов осуществлялось с помощью версии фонологического транскриптора на базе кириллицы (автор программы А.В. Венцов).

В данной статье мы попытались отразить как методологический подход, так и основные направления исследований авторского коллектива в заявленной области.

<p>Компьютерное моделирование сегментации и идентификации графической записи текста</p>

Наличие корпуса и словаря словоформ позволило осуществить компьютерное моделирование сегментации графической беспробельной записи текста через идентификацию, т.е. путем сличения с единицами словаря. Мы исходим из того, что подобная процедура на материале «сплошной» графической записи может рассматриваться как некоторое приближение к работе с материалом звучащего текста, а используемые принципы компьютерного моделирования до некоторой степени соответствуют процессам восприятия речи человеком. Сделанный акцент на процедуре сегментации через идентификацию ни в коей мере не означает отказ от исследования автономного механизма сегментации (независимой от идентификации), но лишь признание относительно небольшого удельного веса автономной сегментации на слова в восприятии речи (подробнее см. об этом <...>).

Существенно отметить, что в большинстве ранних работ, выполненных в русле «модели когорты», материалом, подлежащим распознаванию, выступали изолированные слова – соответственно проблема сегментации вообще не возникала. В отличие от этого, наш алгоритм принципиально нацелен на обработку слитной речи – на данной стадии исследования в ее графическом представлении, а именно орфографической и транскрипционной (в терминах фонем) записей. В основу алгоритма положено упрощенное предположение о том, что в буфер памяти слушающего сведения о символах, составляющих экспонент слова, поступают последовательно во времени и, соответственно, происходит накопление информации, обеспечивающей выбор подходящего слова из словаря.

Сам процесс выбора начинается сразу же, как только в буфере появляются первые один-два символа. По ним из словаря выбираются все подходящие слова – т.е. начинающиеся на тот же символ или последовательность символов слова, которые и образуют «когорту». По мере поступления в буфер следующих символов, из когорты удаляются все слова, не согласующиеся по началу с имеющейся в буфере цепочкой, и процесс этот продолжается до тех пор, пока в когорте не останется одно-единственное слово, которое и будет считаться идентификатором распознаваемого отрезка текста.

Создатели «модели когорты» предполагали, что по мере накопления информации о фонемном составе слова будет резко сокращаться объем когорты и процесс идентификации должен сходиться достаточно быстро и эффективно (особенно если принять во внимание возможность априорного контекстного ограничения словаря, из которого производится начальная выборка когорты, что обычно не учитывается). Сделанные нами самые предварительные расчеты для русского языка показали, что объем выборки действительно стремительно сокращается по мере появления во входном буфере все новых фонем, особенно если при составлении когорты принять во внимание ритмическую структуру распознаваемого слова.

Перейти на страницу:

Похожие книги

История России
История России

Издание описывает основные проблемы отечественной истории с древнейших времен по настоящее время.Материал изложен в доступной форме. Удобная периодизация учитывает как важнейшие вехи социально-экономического развития, так и смену государственных институтов.Книга написана в соответствии с программой курса «История России» и с учетом последних достижений исторической науки.Учебное пособие предназначено для студентов технических вузов, а также для всех интересующихся историей России.Рекомендовано Научно-методическим советом по истории Министерства образования и науки РФ в качестве учебного пособия по дисциплине «История» для студентов технических вузов.

Александр Ахиезер , Андрей Викторович Матюхин , И. Н. Данилевский , Раиса Евгеньевна Азизбаева , Юрий Викторович Тот

Педагогика, воспитание детей, литература для родителей / Детская образовательная литература / История / Учебники и пособия / Учебная и научная литература
История русской литературы XX века. Том I. 1890-е годы – 1953 год
История русской литературы XX века. Том I. 1890-е годы – 1953 год

Русская литература XX века с её выдающимися художественными достижениями рассматривается автором как часть великой русской культуры, запечатлевшей неповторимый природный язык и многогранный русский национальный характер. XX век – продолжатель тысячелетних исторических и литературных традиций XIX столетия (в книге помещены литературные портреты Л. Н. Толстого, А. П. Чехова, В. Г. Короленко), он же – свидетель глубоких перемен в обществе и литературе, о чём одним из первых заявил яркий публицист А. С. Суворин в своей газете «Новое время», а следом за ним – Д. Мережковский. На рубеже веков всё большую роль в России начинает играть финансовый капитал банкиров (Рафалович, Гинцбург, Поляков и др.), возникают издательства и газеты («Речь», «Русские ведомости», «Биржевые ведомости», «День», «Россия»), хозяевами которых были банки и крупные предприятия. Во множестве появляются авторы, «чуждые коренной русской жизни, её духа, её формы, её юмора, совершенно непонятного для них, и видящие в русском человеке ни больше ни меньше, как скучного инородца» (А. П. Чехов), выпускающие чаще всего работы «штемпелёванной культуры», а также «только то, что угодно королям литературной биржи…» (А. Белый). В литературных кругах завязывается обоюдоострая полемика, нашедшая отражение на страницах настоящего издания, свою позицию чётко обозначают А. М. Горький, И. А. Бунин, А. И. Куприн и др.XX век открыл много новых имён. В книге представлены литературные портреты М. Меньшикова, В. Розанова, Н. Гумилёва, В. Брюсова, В. Хлебникова, С. Есенина, А. Блока, А. Белого, В. Маяковского, М. Горького, А. Куприна, Н. Островского, О. Мандельштама, Н. Клюева, С. Клычкова, П. Васильева, И. Бабеля, М. Булгакова, М. Цветаевой, А. Толстого, И. Шмелёва, И. Бунина, А. Ремизова, других выдающихся писателей, а также обзоры литературы 10, 20, 30, 40-х годов.

Виктор Васильевич Петелин

Культурология / История / Учебники и пособия / Языкознание / Образование и наука
Качество, эффективность, нравственность
Качество, эффективность, нравственность

Монография доктора экономических наук, профессора, Академика Академии проблем качества посвящена одной из самых острых и сложных проблем современного производства и экономики. Значение качества продукции особенно возросло в последнее время в связи с финансово-экономическим кризисом и усилением конкурентной борьбы на рынках. Отличительной особенностью книги является то, что автор рассматривает проблемы управления качеством в развитии во времени, т. е. в динамике.Автор подробно рассматривает роль и возможности факторов нравственности и этики в деятельности по качеству.Книга написана в форме доступной для понимания проблематики читателями различного уровня: бизнесменам, начинающим предпринимателям, инженерам (менеджерам) по качеству, аспирантам. Книга может быть полезной и для студентов высших учебных заведений.

Александр Владимирович Гличев

Учебники и пособия / Учебники / Управление, подбор персонала / Образование и наука / Финансы и бизнес