Читаем Журнал "Компьютерра" №729 полностью

Каждый журналист мечтает о том, чтобы прийти после встречи, подключить диктофон к компьютеру и открыть весь разговор непосредственно в текстовом редакторе. На деле же приходится тратить уйму времени на расшифровку аудиозаписи. Автоматизации это процесс поддается плохо, если, конечно, у вас нет расторопной прислуги. Да и просто наговаривать тест, отложив клавиатуру, хочется еще со школьных лет. Фантастика? Специалисты питерского Центра речевых технологий полагают, что нет.

Формальным поводом для этой статьи послужило заявление питерского Центра речевых технологий (ЦРТ) о завершении работы над технологией распознавания слитной русской речи. Такая новость воспринимается не иначе, как первоапрельская шутка, особенно при воспоминании о весьма неуклюжих "российских" разработках типа "Горыныч" ["Горыныч" - адаптация под русский язык системы распознавания Dragon Naturally Speaking от компании Nuance. Она создавалась для английского языка - совершенно иначе организованного, если сравнивать его с русским]. Еще более забавной кажется идея того же ЦРТ подготовить к Олимпиаде в Сочи, ни много ни мало, карманный переводчик устной речи.

Центр речевых технологий был образован в 1990 году небольшой группой инженеров, часть которых работала в НИИ "Дальняя связь", где была своя речевая лаборатория. Впрочем, заниматься чистой наукой в ЦРТ не получилось, компании были нужны проекты, способные быстро себя окупить.

"Сейчас у нас работает около двухсот человек, - говорит Алексей Хитров, аналитик ЦРТ. - В основном мы специализируемся на системах профессиональной записи звука, включая многоканальную запись. Мы разработали профессиональный диктофон "Гном", у нас есть также системы протоколирования и стенографирования".

Весьма недешевый - больше 1000 долларов - цифровой диктофон "Гном 2М" отмечен экспертами МВД РФ как прибор, записывающий человеческую речь с качеством, позволяющим проводить идентификацию голоса. Кроме того, ЦРТ сам занимается криминалистической фоноскопической экспертизой: по словам Хитрова, доля компании в этом бизнесе составляет около 25% по всему миру.[В основном такая работа ведется в развивающихся странах]

О работе ЦРТ над распознаванием речи и, главное, о сложностях этой проблемы рассказала Марина Татарникова, математик по образованию, руководящая группой исследователей Центра.

"Сначала у нас было реализовано дикторозависимое распознавание изолированных команд как целостных образов, для небольших словарей, - рассказывает Татарникова. - Процедура распознавания в этом случае требует хранения нескольких эталонов для каждой команды. Потом были разработаны алгоритмы построения акустических моделей аллофонов [Аллофон(а) (от греч. бllos - иной, другой, и phфnз - звук), вариант, разновидность фонемы, обусловленная данным фонетическим окружением (БСЭ). Например, в словах "первое" и "апреля" звук "п" находится в разном окружении, и, соответственно, будут разные аллофоны.  и на основе этого - пофонемное [Фонема (от греч. phonema - звук), основная единица звукового строя языка, предельный элемент, выделяемый линейным членением речи (БСЭ)] распознавание команд и поиск ключевых слов, независимые от диктора и словаря".

Для распознавания же слитной речи необходимы огромные речевые базы, нужны специалисты-алгоритмисты и вычислительные мощности. Поначалу проблема казалась слишком трудной и многогранной, если не сказать - безграничной.

Моделирование

Система распознавания слитной речи представляет собой взаимодействие акустических моделей, лексикона, языковой модели и декодера. Если акустические модели выполняют оценку вероятностей распознавания отдельных аллофонов, то языковые модели оценивают вероятность следования слов друг за другом. Лексикон содержит все возможные варианты произнесения слов, которые будут распознаваться в процессе работы системы. Декодер определяет лучшую гипотезу в сети распознавания. Это программа, оперирующая большими объемами данных, которая в максимально сжатые сроки должна принять решение о распознанном тексте. Для успешной работы программы требуется разработка особых алгоритмов, ускоряющих процесс и уменьшающих число ошибок.

"Сложностей хватает, - признает Марина Татарникова. - Вот вы и я произносим звуки и понимаем друг друга.

Перейти на страницу:

Похожие книги

«Если», 2000 № 08
«Если», 2000 № 08

ФАНТАСТИКАЕжемесячный журналСодержание:Джеймс Типтри-младший. ДЕВОЧКА, КОТОРУЮ ПОДКЛЮЧИЛИ, рассказВернисаж*Вл. Гаков. ЧУЖАК В ЧУЖОЙ СТРАНЕ, статьяКир Булычёв. ЧЕГО ДУША ЖЕЛАЕТ, рассказВидеодром*Атлас--- Галина Компаниченко. НА РОДИНЕ РОБОТОВ, статья*Скандал сезона--- Вл. Гаков. «НО НЕ ЛЮБИМ МЫ ЕГО НЕ ЗА ЭТО…», статья*Рецензии*Экранизация--- Дмитрий Байкалов. СТРАННАЯ ИСТОРИЯ СО ЗНАМЕНИТЫМ РАССКАЗОМ, статьяБрайан Олдисс. ВИДИМОСТЬ ЖИЗНИ, рассказВладимир Хлумов. МОЛЧАНИЕ КОСМОСА, статьяАлександр Громов. ВЫЧИСЛИТЕЛЬ, повестьДжеймс Келли. КРОШКА-МОШКА-ПАУЧОК, рассказАлександр Ройфе. В ПОИСКАХ НОВОГО ИДЕАЛА, круглый столКонкурс «Альтернативная реальность»*Валерия Илющенко. НАКАЗАНИЕ ПЕРВОЙ СТЕПЕНИ, рассказВладимир Михайлов. ХОЖДЕНИЕ СКВОЗЬ ЭРЫ, окончание эссеРецензииКрупный план*Дмитрий Володихин. ИЛЛЮЗИЯ РЕАЛЬНОСТИ, статья2100: история будущего*Алексей Зарубин. НА ЧАРЕ ВСЕ СПОКОЙНО…, рассказКурсорPersonaliaНа обложке иллюстрация И. Тарачкова к повести Александра Громова «Вычислитель».Иллюстрации А. Филиппова, А. Жабинского, А. Балдина, И. Тарачкова, О. Дунаевой.

Александр Николаевич Громов , Валерия Валерьевна Илющенко , Владимир Гаков , Джеймс Типтри-младший , Журнал «Если»

Фантастика / Журналы, газеты / Научная Фантастика
«Если», 2011 № 07
«Если», 2011 № 07

Евгений ЛУКИН. ПРИБЛУДНЫЕУ кого не дрогнет сердце при виде дворовой кошки, шмыгающей в подвал… Однако все аналогии оставим на совести автора.Николай ГОРНОВ. БРИЛЛИАНТОВЫЙ ЗЕЛЁНЫЙВы боялись в детстве мазать царапины зеленкой? И правильно: антисептические свойства этого средства сомнительны.Алексей МОЛОКИН. ДЕНЬ ЯЙЦАСегодня — праздник, завтра — национальная идея.Анжела и Карлхайнц ШТАЙНМЮЛЛЕР. ПЕРЕД ПУТЕШЕСТВИЕМЭто только репетиция, которую назначили устроители тура. И назначили не зря…Оливье ПАКЕ. УМЕРЕТЬ СТО РАЗ, СТО РАЗ ПОДНЯТЬСЯИз роботов делают актеров. А жизнь лицедеев-людей превращена в подмостки.Кейт ВИЛЬХЕЛЬМ. ТВОРЦЫ МУЗЫКИРутинное задание сулило журналисту одну лишь скуку. О том, что в результате изменится его жизнь, он и помыслить не мог.Генри СТРАТМАНН. КОГДА ЕЁ НЕ СТАЛОПрилипчивый мотивчик, досаждавший герою Марка Твена, спустя столетие приобрел размах мирового бедствия.Джейсон СЭНФОРД. МИЛЛИСЕНТ ИГРАЕТ В РЕАЛЬНОМ ВРЕМЕНИЗдесь неоплатный долг перед Родиной выражается вполне конкретными цифрами.Сергей НЕКРАСОВ. ГИНЗБУРГ И ПУСТОТАЭкранизация «главного романа конца 90-х» имела непростую съёмочную судьбу и получилась спорной. Однако критик твердо занял сторону режиссера.Аркадий ШУШПАНОВ. НОВЫЕ РУССКИЕ СКАЗКИСовременная российская детская кинофантастика — миф или реальность?Тимофей ОЗЕРОВ. УРОКИ МИФОЛОГИИПоход в кино длиной в полугодие.ВИДЕОРЕЦЕНЗИИГолливуд ни в чем не уступает российским чиновникам: способен потратить на пустые и нелепые проекты даже самые запредельные бюджеты.Глеб ЕЛИСЕЕВ. МЕЛОДИИ СФЕРА для того, чтобы их услышать, нужно… читать.РЕЦЕНЗИИНаши рецензенты не отбирают книги по жанровой принадлежности. Для них важен лишь один принцип — литературного качества.КУРСОРКиберпанк имеет отличный шанс возродиться в новой экранной ипостаси: знаменитый режиссер «Куба» готовится снимать «Нейроманта».Валерий ОКУЛОВ. ПЕРВОПРОХОДЕЦ, НЕ ИСКАВШИЙ ТИТУЛОВОн стал отцом-основателем жанра НФ-очеркистики и вернул читателям автора «Человека-амфибии».Вл. ГАКОВ. РАЗНОЦВЕТНАЯ СУДЬБАПисательница, славная не только книгами, но и тем, что придумала главную жанровую награду.ПЕРСОНАЛИИЕвропа et Америка.

Алексей Молокин , Аркадий Шушпанов , Валерий Окулов , Дмитрий Володихин , Кейт Вильгельм

Фантастика / Фэнтези / Эссе / Проза / Журналы, газеты / Научная Фантастика