Читаем Журнал «Компьютерра» №38 полностью

Большой спрос в мобильном мире также на энциклопедии и справочники - довольно неожиданный после краткого взлета мультимедиа для ПК в середине 1990-х годов. То же касается простеньких игр, многие из которых сейчас возвращаются аж из конца 80-х и переживают второе рождение в мобильниках.

Мобильный мир требует и нового программного обеспечения для бизнеса - пусть и примерно с теми же самыми функциями. Это еще один стык, на котором рождаются инновации. Например, компания «ДИСКо» в прошлом году выпустила продукт «ДИСКаунт» для учета продаж на наладонном компьютере. Это принципиально иная задача, нежели решаемая, скажем, «1С:Торговлей» для настольного компьютера (хотя «1С» один из продавцов этого продукта). Аудитория тоже иная - малый (скорее даже мелкий) бизнес, на уровне лотка или палатки на Горбушке

Лидер в категории «мобильный офис» пока не появился. Соответственно, нет и общего стандарта, хотя он всем очень нужен. Кто его разработает и внедрит, тот будет монополистом (боюсь, им опять окажется Microsoft).


Искусственный интеллект и мобильные технологии


В области ИИ обещания создать говорящих роботов, устройства распознавания речи, машинные переводчики даются уже более сорока лет, однако сделано не очень много. Мне кажется, в первую очередь потому, что у рядового потребителя не было потребности в разумном поведении бытовых устройств. Однако с проникновением ИТ, а особенно мобильников в массы эта потребность появилась.

Мобильные устройства и телефоны сейчас остро требуют внедрения технологий ИИ. В первую очередь - распознавания речи.


Распознавание речи


Насколько удобнее было бы вводить SMS или номер абонента вслух, чем с помощью убогой клавиатуры и капризного алгоритма Т9! Не говоря уже о пользовании мобильником в автомобиле, где управлять звонками голосом гораздо удобнее и безопаснее. Но до сих пор эта проблема не решена; я не говорю об элементарных голосовых метках, которые есть во многих современных телефонах - там, по сути, распознается не речь, а звуковой паттерн, и они начинают сбоить уже при числе меток номеров более 15-20.

Вообще же качество распознавателя определяется соотношением числа узнанных слов к допустимому числу разных дикторов. Сейчас существуют системы только двух крайних типов - множество слов для одного или нескольких дикторов (скажем, 60 тысяч слов/1 диктор) и много дикторов с несколькими десятками слов. А чтобы обслуживать массового пользователя, нужны системы для множества дикторов с множеством слов.

Первый тип голосовых систем используется для диктовки текстов или управления компьютером, при условии тщательного обучения системы вашему голосу. Такие системы после обучения работают довольно надежно. Однако массовый пользователь никогда ничего не настраивает, никогда ничему не обучает, это известный факт. Настройки в операционной системе, текстовом редакторе или на веб-сайте поисковика меняют не более 1-2% пользователей.

Второй тип распознавания используется для элементарных вопросо-ответных систем в центрах обслуживания абонентов, для набора номера голосом, в так называемых голосовых порталах, но тут технология работает не очень хорошо. Понятно, что системы с многими дикторами должны работать без обучения с любым диктором, и это их проклятие.

В общем, безупречная массовая система типа, скажем, 1000/1000 или 1000/10000, то есть для многих дикторов с распознаванием нескольких сотен слов (а уж тем более фраз или слитной речи любого диктора), пока не создана. Тот, кто создаст такую систему для английского, немецкого, китайского, да и для русского языка, озолотится.

Естественно, такие системы активно разрабатываются. На мой взгляд, тут самая обещающая идея - перейти от «сугубо технического» распознавания 90-х годов (очистка сигнала, нарезка, угадывание фонем и пр.) к распознаванию «по смыслу», по контексту, то есть к предугадыванию того, что могло бы быть сказано. Именно так распознает речь человек: без знания контекста и заранее сформированной модели ситуации мы ошибаемся в распознавании на слух абстрактных текстов не реже машины. А предугадать круг возможных реплик не слишком трудно, это и так делают при создании любого центра обработки звонков, службы технической поддержки и пр.

Ясно, что заранее обученные контексту системы можно создавать только для ограниченного контекста, то есть для узких и хорошо описанных предметных областей (или они должны надежно распознавать предметные области и быстро переключаться между ними). Тем не менее для массовых справочных сервисов в мобильном телефоне этого было бы вполне достаточно.

Вторая перспективная идея - отказ от попытки точно распознать всю фразу. Вместо этого нужно «ловить» в потоке непонятной речи ключевые слова и фразы - и по ним строить гипотезы о возможном содержании запроса. Это тоже близко к тому, как распознает речь человек, особенно в условиях шума, сильного акцента собеседника, большого количества неизвестных слов в его речи. Фактически нужно превратить распознаватель в поисковую машину по возможным репликам пользователя.


Виртуальные собеседники


Перейти на страницу:

Похожие книги

«Если», 2003 № 08
«Если», 2003 № 08

ФАНТАСТИКАЕжемесячный журналСодержание:Геннадий Прашкевич. БЕЛЫЙ МАМОНТ, повестьЛитературный портрет*Владимир Борисов. «МНЕ ПОВЕЗЛО: Я ЗНАЮ ОЗАРЕНЬЕ…», статьяСвятослав Логинов. О ЧЁМ ПЛАЧУТ СЛИЗНИ, рассказДелия Шерман. РУБИН «ПАРВАТ», рассказ,ВЕРНИСАЖАлександр Павленко. РИСОВАННЫЕ ЛЕНТЫ МЁБИУСА, статьяБорис Руденко. ИЗМЕНЁННЫЙ, рассказНаталия Ипатова. ДОМ БЕЗ КОНДИЦИОНЕРА, рассказВИДЕОДРОМ*Тема--- Сергей Кудрявцев. ВЗГЛЯДЫ, КОТОРЫЕ УБИВАЮТ, статья*Рецензии*Рейтинг--- Вячеслав Яшин. 100 ГЕРОЕВ, статьяНил Геймен. ДЕЛО СОРОКА СЕМИ СОРОК, рассказГенри Лайон Олди. ЦЕНА ДЕНЕГ, повестьТом Холт. СПАСТИСЬ ОТ МЕДВЕДЕЙ, рассказМайкл Кэднэм. ОБИЛЬНАЯ ЖАБАМИ, рассказМария Галина. МУЗА В ЧУЖОЙ ЗЕМЛЕ, статьяЭкспертиза темыВладимир Михайлов, Андрей Валентинов, Николай СветлевКрупный план*Эдуард Геворкян. ЛЬВЫ ГАЯ КЕЯ (статья), рецензия на роман Г. Г. Кея «Львы Аль-РассанаРецензииКрупный планЛеонид Кудрявцев. ЗА СТОЛЕТИЕ ДО АРМАГЕДДОНА, рецензия на несуществующий роман Алексея Джерджау «Канонада Армагеддона»Владислав Гончаров. «ЧИТАЮ БЕЗ СЛОВАРЯ, НО С ТРУДОМ», статьяКир Булычёв. ПАДЧЕРИЦА ЭПОХИ (продолжение серии историко-литературных очерков)КурсорПерсоналииОбложка Игоря Тарачкова к повести Геннадия Прашкевича «Белый мамонт».Иллюстрации Игоря Тарачкова, Е. Капустянского, В. Овчинникова, Жана Жиро (Мебиуса), А. Филиппова, С. Голосова, А. Балдина, С. Шехова, А. Акишина

Александр Павленко , Геннадий Мартович Прашкевич , Журнал «Если» , Леонид Викторович Кудрявцев , Наталия Борисовна Ипатова

Фантастика / Фэнтези / Современная проза / Проза / Журналы, газеты / Научная Фантастика
«Если», 2002 № 02
«Если», 2002 № 02

ФАНТАСТИКАЕжемесячный журналСодержание:Ллойд Биггл. КТО В ЗАМКЕ КОРОЛЬ? повестьПитер Гамильтон, Грэм Джойс. БЕЛОЕ ВЕЩЕСТВО, рассказВидеодром*Адепты жанра--- Евгений Харитонов. КОСМИЧЕСКАЯ ОДИССЕЯ ПАВЛА КЛУШАНЦЕВА (статья)*Экранизация--- Вл. Гаков. ХРАНИТЕЛИ ОТПРАВЛЯЮТСЯ В ДОРОГУ (статья)*Рецензии*Хит сезона--- Дмитрий Байкалов. НЕГР ИЗ КАЛИФОРНИИ ПРИ ДВОРЕ КОРОЛЯ ЛЕО (статья)Пол Ди Филиппо. ПОЖИЗНЕННОЕ ЗАКЛЮЧЕНИЕ, рассказЧарлз Стросс. АНТИТЕЛА, рассказДэвид Лэнгфорд. COMP.BASILISK.FAQ (отрывок из статьи в журнале «Нейчур»)Джо Холдеман. СЛЕПАЯ ЛЮБОВЬ, рассказКристофер Маккитрик. ПОТЕРЯВШИЕСЯ СОБАКИ, рассказАльберт Каудри. «КРУКС», повестьВладимир Березин. КТО ИДЁТ ЗА «КЛИНСКИМ»? (статья)Крупный план*Александр Громов. ГУД БАЙ, АМЕРИКА! (статья)РецензииКрупный план*Глеб Елисеев. ТРИ ДАРА ЛЕСТЕРА ДЕЛЬ РЕЯ (статья)Альтернативная реальностьМаксим Форост. РАДУГА ПЕРВОГО ЗАВЕТА, рассказЭдуард Геворкян. МЕДАЛЬ ЗА ВЗЯТИЕ КАНОССЫ (статья)Евгений Харитонов. ЖУРНАЛЬНАЯ ЛИХОРАДКА (статья)КурсорПерсоналииОбложка И. Тарачкова к повести Альберта Каудри «Крукс».Иллюстрации: А. Балдин, А. Юрьева, С. Шехов, В. Овчинников, А. Филиппов, И. Тарачков

Альберт Каудри , Джо Холдеман , Дэвид Лэнгфорд , Кристофер Маккитрик , Максим Форост

Фантастика / Журналы, газеты / Научная Фантастика / Фэнтези