Читаем Журнал "Компьютерра" №729 полностью

С точки же зрения машины мы произносим одно и то же слово совершенно по-разному". По этой причине при создании систем дикторонезависимого пофонемного распознавания используется статистический подход. Для реализации такого подхода нужны большие базы с образцами речи разных людей для накопления параметров вероятностных моделей. Если база данных содержит достаточное количество образцов, оказывается возможным создать модель речевого процесса, отражающую вариативность естественной речи.

Акустические модели, - поясняет Татарникова, - это статистические модели, основанные либо на аппарате скрытых марковских моделей, либо на нейронных сетях. Обучение моделей происходит на размеченных речевых базах". В ЦРТ обучали собственные акустические модели на двухстах пятидесяти дикторах, половина из которых - мужчины, а половина - женщины. Все дикторы проживают в европейской части России.[Запись речевой базы частично велась ЦРТ, а частично приобреталась на стороне.]Таким образом, на решение задачи сразу накладывалось некоторое ограничение, ведь русская речь от региона к региону меняется очень сильно и звучит по-разному. Вся база данных составляла около тридцати часов речи. Текст для дикторов подбирался так, чтобы в нем присутствовали все аллофоны русского языка во всех окружениях. Часть записей лингвисты вручную разбивали на сегменты (фоны), для чего есть специальные программы (речь после записи отображается в графическом виде, и на картинке специалист ставит метки на границах сегментов). После того как часть материала была сегментирована, строились начальные акустические модели, а затем, по определенным алгоритмам, на компьютере обрабатывалась остальная часть базы, при этом сегментация проводилась уже автоматически. В процессе обработки параметры акустических моделей переопределялись. Обучение моделей на шести вычислительных машинах заняло около двух суток.

Великий и могучий

Для создания языковой модели в ЦРТ применяется N граммный подход, при этом чаще всего используются би граммы и три граммы. Для тренировки языковых моделей используются текстовые базы данных. В Интернете были собраны аудиозаписи новостей, которым присущ один и тот же стиль речи. В этой базе сейчас около 35 млн. слов. Для оценки параметров языковых моделей требуются огромные объемы данных, и, как правило, этих объемов не достаточно. Всегда существуют n граммы, которые не встретились в языковой модели. В этом случае используют сложные техники сглаживания и отката для оценки вероятностей так называемых unseen n грамм.

Все это более или менее хорошо работает в английском языке и ему подобных, где есть жесткая последовательность слов в предложении. С русским языком у специалистов возникают немалые трудности. "В области акустики наибольшую проблему для распознавания русской речи представляет необычайно сильная количественная и качественная редукция гласных безударных слогов, - объясняет Марина Татарникова, - частично обусловленная свободным характером словесного ударения". Вместе с низкой артикуляторной напряженностью русской речи это приводит к нейтрализации и "размазыванию" акустических свойств сегментов, особенно в спонтанной разговорной речи.

С точки зрения грамматики и синтаксиса русский язык относится к синтетическим языкам со свободным порядком слов. "Богатая словоизменительная парадигма нашего языка существенно затрудняет языковое моделирование на основе "классической" n граммной модели, - говорит Марина Татарникова, - поскольку требует использования чрезвычайно больших речевых корпусов для получения приемлемого числа реализаций всех входящих в словарь словоформ". Приходится ученым экспериментировать, использовать другие подходы при построении языковой модели, например морфемную или классовую. В морфемной модели словари строятся отдельно для основ и флексий, при этом n граммные модели считаются для основ и флексий отдельно. В классовой модели n граммы строятся не для слов, а для так называемых классов. Существует два основных подхода к построению классов: статистический и частеречный (от "часть речи"). Здесь улучшение достигается не при изолированном использовании классовой модели, а при интерполяции ее с базовой. Выбор того или иного подхода для русского языка требует исследований. Чем сейчас и занимаются в ЦРТ.


Убийственный нюанс

Увы, языковая модель, построенная на текстах новостной базы, не может быть применена в создании, например, языковой модели для распознавания спортивных трансляций (и наоборот).

"Общая модель языка, - говорит Татарникова, - в принципе, вряд ли интересна: каждый приобретающий систему распознавания будет использовать ее в своих целях, подразумевающих определенный стиль речи. И за рубежом так же".

Перейти на страницу:

Похожие книги

«Если», 2000 № 08
«Если», 2000 № 08

ФАНТАСТИКАЕжемесячный журналСодержание:Джеймс Типтри-младший. ДЕВОЧКА, КОТОРУЮ ПОДКЛЮЧИЛИ, рассказВернисаж*Вл. Гаков. ЧУЖАК В ЧУЖОЙ СТРАНЕ, статьяКир Булычёв. ЧЕГО ДУША ЖЕЛАЕТ, рассказВидеодром*Атлас--- Галина Компаниченко. НА РОДИНЕ РОБОТОВ, статья*Скандал сезона--- Вл. Гаков. «НО НЕ ЛЮБИМ МЫ ЕГО НЕ ЗА ЭТО…», статья*Рецензии*Экранизация--- Дмитрий Байкалов. СТРАННАЯ ИСТОРИЯ СО ЗНАМЕНИТЫМ РАССКАЗОМ, статьяБрайан Олдисс. ВИДИМОСТЬ ЖИЗНИ, рассказВладимир Хлумов. МОЛЧАНИЕ КОСМОСА, статьяАлександр Громов. ВЫЧИСЛИТЕЛЬ, повестьДжеймс Келли. КРОШКА-МОШКА-ПАУЧОК, рассказАлександр Ройфе. В ПОИСКАХ НОВОГО ИДЕАЛА, круглый столКонкурс «Альтернативная реальность»*Валерия Илющенко. НАКАЗАНИЕ ПЕРВОЙ СТЕПЕНИ, рассказВладимир Михайлов. ХОЖДЕНИЕ СКВОЗЬ ЭРЫ, окончание эссеРецензииКрупный план*Дмитрий Володихин. ИЛЛЮЗИЯ РЕАЛЬНОСТИ, статья2100: история будущего*Алексей Зарубин. НА ЧАРЕ ВСЕ СПОКОЙНО…, рассказКурсорPersonaliaНа обложке иллюстрация И. Тарачкова к повести Александра Громова «Вычислитель».Иллюстрации А. Филиппова, А. Жабинского, А. Балдина, И. Тарачкова, О. Дунаевой.

Александр Николаевич Громов , Валерия Валерьевна Илющенко , Владимир Гаков , Джеймс Типтри-младший , Журнал «Если»

Фантастика / Журналы, газеты / Научная Фантастика
«Если», 2011 № 07
«Если», 2011 № 07

Евгений ЛУКИН. ПРИБЛУДНЫЕУ кого не дрогнет сердце при виде дворовой кошки, шмыгающей в подвал… Однако все аналогии оставим на совести автора.Николай ГОРНОВ. БРИЛЛИАНТОВЫЙ ЗЕЛЁНЫЙВы боялись в детстве мазать царапины зеленкой? И правильно: антисептические свойства этого средства сомнительны.Алексей МОЛОКИН. ДЕНЬ ЯЙЦАСегодня — праздник, завтра — национальная идея.Анжела и Карлхайнц ШТАЙНМЮЛЛЕР. ПЕРЕД ПУТЕШЕСТВИЕМЭто только репетиция, которую назначили устроители тура. И назначили не зря…Оливье ПАКЕ. УМЕРЕТЬ СТО РАЗ, СТО РАЗ ПОДНЯТЬСЯИз роботов делают актеров. А жизнь лицедеев-людей превращена в подмостки.Кейт ВИЛЬХЕЛЬМ. ТВОРЦЫ МУЗЫКИРутинное задание сулило журналисту одну лишь скуку. О том, что в результате изменится его жизнь, он и помыслить не мог.Генри СТРАТМАНН. КОГДА ЕЁ НЕ СТАЛОПрилипчивый мотивчик, досаждавший герою Марка Твена, спустя столетие приобрел размах мирового бедствия.Джейсон СЭНФОРД. МИЛЛИСЕНТ ИГРАЕТ В РЕАЛЬНОМ ВРЕМЕНИЗдесь неоплатный долг перед Родиной выражается вполне конкретными цифрами.Сергей НЕКРАСОВ. ГИНЗБУРГ И ПУСТОТАЭкранизация «главного романа конца 90-х» имела непростую съёмочную судьбу и получилась спорной. Однако критик твердо занял сторону режиссера.Аркадий ШУШПАНОВ. НОВЫЕ РУССКИЕ СКАЗКИСовременная российская детская кинофантастика — миф или реальность?Тимофей ОЗЕРОВ. УРОКИ МИФОЛОГИИПоход в кино длиной в полугодие.ВИДЕОРЕЦЕНЗИИГолливуд ни в чем не уступает российским чиновникам: способен потратить на пустые и нелепые проекты даже самые запредельные бюджеты.Глеб ЕЛИСЕЕВ. МЕЛОДИИ СФЕРА для того, чтобы их услышать, нужно… читать.РЕЦЕНЗИИНаши рецензенты не отбирают книги по жанровой принадлежности. Для них важен лишь один принцип — литературного качества.КУРСОРКиберпанк имеет отличный шанс возродиться в новой экранной ипостаси: знаменитый режиссер «Куба» готовится снимать «Нейроманта».Валерий ОКУЛОВ. ПЕРВОПРОХОДЕЦ, НЕ ИСКАВШИЙ ТИТУЛОВОн стал отцом-основателем жанра НФ-очеркистики и вернул читателям автора «Человека-амфибии».Вл. ГАКОВ. РАЗНОЦВЕТНАЯ СУДЬБАПисательница, славная не только книгами, но и тем, что придумала главную жанровую награду.ПЕРСОНАЛИИЕвропа et Америка.

Алексей Молокин , Аркадий Шушпанов , Валерий Окулов , Дмитрий Володихин , Кейт Вильгельм

Фантастика / Фэнтези / Эссе / Проза / Журналы, газеты / Научная Фантастика