Читаем Журнал "Компьютерра" №729 полностью

Татарникова приводит как доказательство от противного довольно известную разработку Dragon, принадлежащую фирме Nuance. Продаваемая этой компанией система диктовки для любого текста и любого пользователя требует перед началом работы адаптации языковых моделей и расширения словаря. Адаптация языковых моделей производится путем загрузки в систему типичных для работы пользователя текстов и последующей корректировки статистических языковых моделей. Расширение словаря - задача пользователя. Насколько успешно он с ней справится, настолько успешно будет работать система. Любая система распознавания знает только те слова, что есть в ее словаре.

Существует в системе Dragon подстройка и под голос диктора. Для этого нужно минут тридцать почитать тексты, предложенные системой, чтобы программа адаптировала параметры существующих акустических моделей.

В ЦРТ также ведется работа по созданию алгоритмов адаптации акустических моделей под голос диктора, но в принципе уже ясно: журналистам, которым приходится проводить интервью с разными людьми в разном окружении, рассчитывать особо не на что. Универсального продукта для русского языка ждать не стоит. Даже более простой (в контексте распознавания) английский язык специалистам пока не поддается. О записи неформальной беседы, кажется, нет и речи.

"Надеяться на быстрое появление мобильных и даже стационарных устройств для распознавания спонтанной речи (например, нашего с вами разговора) вряд ли стоит в ближайшее время, - говорит Марина Татарникова.

 Спонтанная речь отличается более сложными языковыми и акустическими моделями. Кроме того, необходимы речевые базы спонтанной речи гораздо больших объемов".

Вопрос специализации

"Определенный скепсис насчет систем распознавания речи, конечно, имеет место, - продолжает Татарникова.

- На самом же деле, в мире такие системы есть, и они замечательно работают. Например, их используют медицинские учреждения в США". Известно, что медицинским работникам постоянно требуется делать какие-то записи, будь то история болезни или протоколирование действий. Медики в США просто наговаривают текст, который автоматически переводится в машинный вид. Этот текст нуждается лишь в косметической правке. Соответствующие технологии есть, к примеру, у той же Nuance. То, что это хорошие системы, косвенно подтверждает Алексей Хитров:

"У одной Nuance - капитализация 5 млрд. долларов. Это на три порядка больше, чем мы смогли вложить в наши разработки. Обращаю внимание на то, что и у них наибольших успехов достигли системы, работающие на ограниченных специализированных словарях. По разным данным, объем продаж только медицинских систем распознавания речи в США составляет 12–15 млрд. долларов".

В ЦРТ тоже планируют зарабатывать именно на специальных воплощениях своей системы распознавания, то есть компании интересен прежде всего корпоративный рынок. Правда, не факт, что первыми с новыми технологиями ознакомятся медики. В Америке создание речевых баз для систем распознавания было государственным проектом, чего не скажешь о российских разработках. Интерес, конечно, у наших медиков тоже есть, но нет государственной заинтересованности, чтобы оплачивать дорогостоящие исследования.

"И акустические, и языковые модели, а также алгоритмы для декодера - у нас собственной разработки", - говорит Хитров. По его словам, решение для диктовки текста будет готово в течение года. Сейчас ЦРТ доделывает программу Voice Digger для Auto Data Mining (поиск ключевых слов в звуковых файлах), а также готов представить распознавание команд для IVR [Interactive voice response.] -систем (управление голосом).

Из всей этой группы готовящихся или почти готовых продуктов самой массовой кажется система для диктовки.

Она призвана сделать реальностью голубую мечту многих людей, желающих диктовать компьютеру текст, а не набирать вручную. Однако в ЦРТ повторяют, что такие системы эффективны лишь при работе с тематически ограниченным словарем. Впрочем, электронного писаря Центр пока в люди не выводит, зато мне удалось немного поработать с другими программами, благо базируются они на одной и той же технологии.

На испытательном полигоне

Система IVR используется в самом ЦРТ для автоматического перенаправления входящих звонков. Тест прошел на ура, но как-то не впечатлил: автосекретарь вместо привычного "нажмите 1 или 2" говорил "скажите 1 или 2".

Наверное, можно реализовать и более сложные системы такого типа, но рука тянулась к клавиатуре телефона - привычка.

Перейти на страницу:

Похожие книги

«Если», 2000 № 08
«Если», 2000 № 08

ФАНТАСТИКАЕжемесячный журналСодержание:Джеймс Типтри-младший. ДЕВОЧКА, КОТОРУЮ ПОДКЛЮЧИЛИ, рассказВернисаж*Вл. Гаков. ЧУЖАК В ЧУЖОЙ СТРАНЕ, статьяКир Булычёв. ЧЕГО ДУША ЖЕЛАЕТ, рассказВидеодром*Атлас--- Галина Компаниченко. НА РОДИНЕ РОБОТОВ, статья*Скандал сезона--- Вл. Гаков. «НО НЕ ЛЮБИМ МЫ ЕГО НЕ ЗА ЭТО…», статья*Рецензии*Экранизация--- Дмитрий Байкалов. СТРАННАЯ ИСТОРИЯ СО ЗНАМЕНИТЫМ РАССКАЗОМ, статьяБрайан Олдисс. ВИДИМОСТЬ ЖИЗНИ, рассказВладимир Хлумов. МОЛЧАНИЕ КОСМОСА, статьяАлександр Громов. ВЫЧИСЛИТЕЛЬ, повестьДжеймс Келли. КРОШКА-МОШКА-ПАУЧОК, рассказАлександр Ройфе. В ПОИСКАХ НОВОГО ИДЕАЛА, круглый столКонкурс «Альтернативная реальность»*Валерия Илющенко. НАКАЗАНИЕ ПЕРВОЙ СТЕПЕНИ, рассказВладимир Михайлов. ХОЖДЕНИЕ СКВОЗЬ ЭРЫ, окончание эссеРецензииКрупный план*Дмитрий Володихин. ИЛЛЮЗИЯ РЕАЛЬНОСТИ, статья2100: история будущего*Алексей Зарубин. НА ЧАРЕ ВСЕ СПОКОЙНО…, рассказКурсорPersonaliaНа обложке иллюстрация И. Тарачкова к повести Александра Громова «Вычислитель».Иллюстрации А. Филиппова, А. Жабинского, А. Балдина, И. Тарачкова, О. Дунаевой.

Александр Николаевич Громов , Валерия Валерьевна Илющенко , Владимир Гаков , Джеймс Типтри-младший , Журнал «Если»

Фантастика / Журналы, газеты / Научная Фантастика
«Если», 2011 № 07
«Если», 2011 № 07

Евгений ЛУКИН. ПРИБЛУДНЫЕУ кого не дрогнет сердце при виде дворовой кошки, шмыгающей в подвал… Однако все аналогии оставим на совести автора.Николай ГОРНОВ. БРИЛЛИАНТОВЫЙ ЗЕЛЁНЫЙВы боялись в детстве мазать царапины зеленкой? И правильно: антисептические свойства этого средства сомнительны.Алексей МОЛОКИН. ДЕНЬ ЯЙЦАСегодня — праздник, завтра — национальная идея.Анжела и Карлхайнц ШТАЙНМЮЛЛЕР. ПЕРЕД ПУТЕШЕСТВИЕМЭто только репетиция, которую назначили устроители тура. И назначили не зря…Оливье ПАКЕ. УМЕРЕТЬ СТО РАЗ, СТО РАЗ ПОДНЯТЬСЯИз роботов делают актеров. А жизнь лицедеев-людей превращена в подмостки.Кейт ВИЛЬХЕЛЬМ. ТВОРЦЫ МУЗЫКИРутинное задание сулило журналисту одну лишь скуку. О том, что в результате изменится его жизнь, он и помыслить не мог.Генри СТРАТМАНН. КОГДА ЕЁ НЕ СТАЛОПрилипчивый мотивчик, досаждавший герою Марка Твена, спустя столетие приобрел размах мирового бедствия.Джейсон СЭНФОРД. МИЛЛИСЕНТ ИГРАЕТ В РЕАЛЬНОМ ВРЕМЕНИЗдесь неоплатный долг перед Родиной выражается вполне конкретными цифрами.Сергей НЕКРАСОВ. ГИНЗБУРГ И ПУСТОТАЭкранизация «главного романа конца 90-х» имела непростую съёмочную судьбу и получилась спорной. Однако критик твердо занял сторону режиссера.Аркадий ШУШПАНОВ. НОВЫЕ РУССКИЕ СКАЗКИСовременная российская детская кинофантастика — миф или реальность?Тимофей ОЗЕРОВ. УРОКИ МИФОЛОГИИПоход в кино длиной в полугодие.ВИДЕОРЕЦЕНЗИИГолливуд ни в чем не уступает российским чиновникам: способен потратить на пустые и нелепые проекты даже самые запредельные бюджеты.Глеб ЕЛИСЕЕВ. МЕЛОДИИ СФЕРА для того, чтобы их услышать, нужно… читать.РЕЦЕНЗИИНаши рецензенты не отбирают книги по жанровой принадлежности. Для них важен лишь один принцип — литературного качества.КУРСОРКиберпанк имеет отличный шанс возродиться в новой экранной ипостаси: знаменитый режиссер «Куба» готовится снимать «Нейроманта».Валерий ОКУЛОВ. ПЕРВОПРОХОДЕЦ, НЕ ИСКАВШИЙ ТИТУЛОВОн стал отцом-основателем жанра НФ-очеркистики и вернул читателям автора «Человека-амфибии».Вл. ГАКОВ. РАЗНОЦВЕТНАЯ СУДЬБАПисательница, славная не только книгами, но и тем, что придумала главную жанровую награду.ПЕРСОНАЛИИЕвропа et Америка.

Алексей Молокин , Аркадий Шушпанов , Валерий Окулов , Дмитрий Володихин , Кейт Вильгельм

Фантастика / Фэнтези / Эссе / Проза / Журналы, газеты / Научная Фантастика