Читаем Журнал «Компьютерра» № 34 от 18 сентября 2006 года полностью

— Дело не только в языках. Дело в знаниях. Количество информации, порождающейся ежедневно, ежесекундно, растет в геометрической прогрессии, и очень скоро нас ожидает если не комбинаторный взрыв, то, по меньшей мере, значительные проблемы с доступом к этой информации. Но это только иллюстрация. То, что человечеству необходимы системы, позволяющие накапливать знания и обеспечивать к ним формальный доступ, совершенно очевидно. Возьмем, например, проблему распознавания слитной речи без настройки на голос диктора. В ее практической необходимости никто не сомневается. Можно ли сделать это с помощью компьютера? Ответ очень простой. Если проанализировать звуковой сигнал, записанный на этом диктофоне, то обнаружится, что семьдесят процентов изначальной информации было утеряно в процессе записи. А при этом уровне шума — все восемьдесят, а то и девяносто, местами. Тем не менее расшифровать наш разговор можно будет на 99 процентов, если не больше. Почему? Как вы можете достичь такого результата, если этих данных физически нет в сигнале?

Потому что вы не распознаете, а домысливаете. Точно так же во время нашего разговора ухо, как любой микрофон, теряет часть информации на входе. Собственно, мозг распознает только тридцать процентов информации, все остальное ему приходится додумывать на основе априорных знаний о языке, смысле и знании предмета (прагматических знаний). Проверить это довольно просто. Если бы я сейчас продиктовал вам предложение по-армянски, вы бы смогли правильно записать только тридцать процентов букв, хотя армянские буквы в целом похожи на русские (здесь имеется в виду не схожесть алфавитов, а фонетическая схожесть. — Прим. ред.). И мы понимаем, что задача распознавания слитной речи — в меньшей степени задача распознавания, а в большей — задача понимания.

И сколько времени пройдет между выпуском NLC и выходом первой системы распознавания слитной речи?

— Много. К сожалению, устная речь сильно неформализована, в ней зачастую не соблюдаются законы семантики, так что один этап анализа практически выпадает. Также сложно применять синтаксический анализ: неполные, оборванные предложения, где заканчивается одно предложение и начинается другое — непонятно. Плюс интонационные нюансы. Тонкостей здесь масса. Так что о работающей системе распознавания слитной речи говорить пока рано. Но довольно быстро появятся системы, которые распознают речь не так хорошо, как люди, но во много раз точнее, чем сейчас. Они будут успешно работать в ситуации, когда озвучивается письменная речь — например, при чтении доклада. Наш с вами разговор или, скажем, телефонный разговор или непринужденная беседа на бытовые темы людей, которые хорошо друг друга знают и понимают, что называется, с полуслова — здесь уже сложнее, конечно.

А эксперименты «Яндекса» и Google в области семантического анализа близки к тому, что делает ABBYY в проекте NLC?

— Google и «Яндекс», конечно, понимают важность таких технологий, и я абсолютно убежден, что к моменту появления NLC на рынке появится некоторое количество технологий, заявляющих примерно то же направление. Но у меня внутреннее ощущение, что подход ABBYY, которая потратила на разработки десять лет, существенно глубже. Я вполне могу допустить даже то, что в первые годы технологии Google, «Яндекс» и других фирм могут оказаться даже эффективнее наших, потому что они настраиваются на решение конкретной задачи, четко поставленной, с понятным результатом. Они не пытаются решить проблему в принципе. Но в дальней перспективе нам неизвестны чужие разработки, которые настолько глубоко и последовательно пытаются решить задачу понимания в общей постановке.

Я могу сказать, что еще пару лет назад весь этот проект для нас оставался очень рискованным вложением. У нас не было уверенности, что это вообще будет работать. Но сейчас есть основания надеяться на лучшее.

На самом деле, Давид рассказал нам немного больше, однако он сам был не уверен, чем стоит делиться, а чем — нет. В результате довольно значительная (и самая, пожалуй, интересная) часть разговора в этот материал не вошла.

Задачки и задачи

— Я не являюсь менеджером компании, я не контролирую ни одного человека напрямую. У этого проекта есть научные консультанты, руководитель разработки, огромная команда, целый этаж сидит. Как и когда мы будем объявлять об этом — во многом зависит от их готовности. Я же в компании появляюсь раз в неделю. Да и то хожу на занятия китайского, которые проводит мой отец, поэтому не всегда обладаю всей необходимой информацией для принятия такого решения.

Перейти на страницу:

Все книги серии Компьютерра

Похожие книги

«Если», 2001 № 04
«Если», 2001 № 04

Эдмунд КУПЕР. НАСЛЕДНИКИ СВЕРХЧЕЛОВЕКАОни живут в уютном мире, их детство можно назвать счастливым, но в один прекрасный день они обнаруживают: что-то в их жизни не так, да и мир оказывается очень странным.Стивен БЕРНС. СИСТЕМА СРОЧНЫХ СООБЩЕНИЙМежпланетным захватчикам противостоит необычная троица: коп-неудачник, весьма колоритная негритянка и подросток-хакер.Анкл РИВЕР. ЧЕСТЬ ВОИНАНовый Пигмалион: обитатели виртуального мира способны преподать урок своему создателю.Майкл ФЛИНН. ВОЗВЕДЕНО НА ПЕСКАХ ВРЕМЕНИНа дне пивной кружки можно обнаружить такие истины…Нил ГЕЙМЕН. СПЕЦИАЛЬНОЕ ПРЕДЛОЖЕНИЕ«Посчитаем, господа кроты?»Грей РОЛЛИНС. ЗВЕЗДНАЯ БОЛЕЗНЬНежась в лучах славы, кинозвезды и не помышляют, что в недалеком будущем их отнесут к исчезающему виду.Мэтью ДЖАРП. УБОРКА ОРБИТ И РЕМОНТ СПУТНИКОВИ мусорщика подстерегают опасные приключения, если это мусорщик космический.ВИДЕОДРОМПодводная фантастика: за и против… Королевство № 10… Новые фильмы.Вл. ГАКОВ. БЛУЖДАЮЩИЙ В ОБЛАКАХЭдмунд Купер — завзятый антифеминист, но ценим мы его не за это.Спиридон НАЗАРИН. НОЛЬ-НОЛЬ-НОЛЬ, или О ДЕСТРУКТИВИЗМЕ В НФЧитатель критикует писателей.Олег ДИВОВ. НОЛЬ-ТРИ, или КАК РАЗОБРАТЬСЯ С ФАНТАСТИКОЙПисатель критикует читателей.Мария ГАЛИНА. О ЧЕМ ГРУСТЯТ КИТАЙЦЫПо утверждению московского критика, пришло время «массово-элитарной» фантастики. А что это такое?Сергей ПИТИРИМОВ. ПОПЫТКА К БЕГСТВУВ поле зрения критика — новый сборник А. Столярова.РЕЦЕНЗИИНа книжных развалах можно растеряться.КУРСОРПервый кон наступившего века и другие новости.БАНК ИДЕЙНа этот раз загадка оказалась слишком сложной.ПЕРСОНАЛИИЖурналист Геймен, биохимик Джарп, эссеист Флинн и поэт Ривер…

Владимир Гаков , Дмитрий Караваев , Марина и Сергей Дяченко , Нил Геймен , Стивен Бернс

Фантастика / Журналы, газеты / Научная Фантастика
«Если», 1998 № 01
«Если», 1998 № 01

ФАНТАСТИКАЕжемесячный журналСодержание:Сьюзи МакКи Чарнас. СЛУШАЯ БРАМСА, рассказАлександр Громов. СЧАСТЛИВАЯ ЗВЕЗДА, рассказБилл Джонсон. ВЫПЬЕМ, ГОСПОДИН ПОСОЛ! рассказАлексей Васильев. БЛИЖЕ К ТЕЛУ!ФактыДжеймс Типтри-младший. МИМОЛЕТНЫЙ ПРИВКУС БЫТИЯ, повестьЛитературный портрет*Вл. Гаков. В ТЕНИ ЧУЖОЙ СУДЬБЫФактыДжеффри Лэндис. БЕСКОНЕЧНЫЕ СОБЛАЗНЫ ЭНИГМЫ, повестьВиктор Комаров. Наш главный собеседникФантариум ЗВЁЗДНЫЙ ПОРТПРЯМОЙ РАЗГОВОР*Кир Булычёв. Будем уважать друг другаЕвгений Харитонов. За великой стенойКУРСОРРЕЦЕНЗИИPERSONALIAВИДЕОДРОМ*Адепты жанра— Дмитрий Караваев. Светлые идеи рыцаря «черного юмора»*Рецензии*Герой экрана— Станислав Ростоцкий. Черный ворон Голливуда*Рейтинг— Сергей Кудрявцев. Лидеры 1997. Самые кассовые фантастические фильмы*Сериал— Александр Алексеев. «Вавилон-5». Подготовка к пятому запуску*Внимание, мотор!— Евгений Зуенко. Компьютерные игры на экранеПремия читательских симпатий (лист для голосования)Обложка Мура К. (Chris Moore).Иллюстрации О. Васильева, О. Дунаевой, А. Жабинского, А. Филиппова.

Александр Николаевич Громов , Виктор Ноевич Комаров , Владимир Гаков , Журнал «Если» , Станислав Иосифович Ростоцкий

Фантастика / Журналы, газеты / Научная Фантастика
«Если», 1998 № 08
«Если», 1998 № 08

ФАНТАСТИКАЕжемесячный журналСодержание:Нэнси Кресс. ЦВЕТЫ ТЮРЬМЫ АУЛИТ, повестьДжек Вэнс. РАЗУМ ГАЛАКТИКИ, рассказВладимир Успенский. ОСОБЕННОСТИ НАЦИОНАЛЬНОЙ ОХОТЫ НА ИЗБИРАТЕЛЯКоллектив авторов. БОЕВАЯ СТАНЦИЯ*Билл Фосетт. ПРОЛОГ, хроники*Дэвид Аллен Дрейк. ВСТРЕЧА С ВРАГОМ, рассказ*Билл Фосетт. БОЕВАЯ СТАНЦИЯ, хроники*Кристофер Сташефф. ДЕТИ ГЛОБИНА, рассказ*Билл Фосетт. СТИВЕН ХОУКИНГ, хроники*Роберт Шекли. КОМАНДИРОВКА НА ЛЮМИНОС, рассказ*Билл Фосетт. БЕЗВЫХОДНАЯ СИТУАЦИЯ, хроники*Джанет Моррис. ПЕРЕСЕЛЕНИЕ ДУШИ, рассказ*Билл Фосетт. ПОСЛЕДНИЙ РЕЗЕРВ, хроники*Кэтрин Куртц. ЖЕРТВОПРИНОШЕНИЕ, рассказСергей Переслегин. СТРАТЕГИЯ И ТАКТИКА ГАЛАКТИЧЕСКИХ ВОЙНПол Деллинджер. ИГРА В КОСТИ СО ВСЕЛЕННОЙ, рассказКОНКУРС «АЛЬТЕРНАТИВНАЯ РЕАЛЬНОСТЬ»*Олег Овчинников. ГЛУБИНКА, рассказПРЯМОЙ РАЗГОВОР*Андрей Лазарчук. «РАЗЛИЧИТЬ ИСТИНУ И ВЫМЫСЕЛ НЕВОЗМОЖНО…» (ответы на вопросы читателей «Если»)Дмитрий Байкалов, Андрей Синицын. НЕ ТАК СТРАШЕН ЧЕРТ…КУРСОРРЕЦЕНЗИИPERSONALIAВЕРНИСАЖ*Вл. Гаков. КОНСТРУКТОР ПЯТНИСТЫХ ЗВЕЗДОЛЕТОВВИДЕОДРОМ*Тема— Дмитрий Караваев. «МЫ СВОЙ, МЫ НОВЫЙ МИР…», ИЛИ ГРЕЗЫ КИНО ОБ ЭПОХЕ КОСМИЧЕСКОГО КОЛОНИАЛИЗМА*Рецензии*Хит сезона— Евгений Богарнин. УДАРОМ НА УДАР*Экранизация— Евгений Харитонов. ГИПЕРБОЛОИД СТРЕЛЯЕТ С ЭКРАНА*Рекорды— Игорь Фишкин. КИНОФАНТАСТИКА В «КНИГЕ ГИННЕССА»*Внимание, мотор!— Арсений Иванов. НОВОСТИ СО СЪЕМОЧНОЙ ПЛОЩАДКИОбложка Фосса К. (Chris Foss).Иллюстрации Белова А. С., О. Васильева, А. Филиппова, С. Шехова.

Владимир Гаков , Евгений Викторович Харитонов , Журнал «Если» , Ненси Кресс , Пол Деллинджер

Фантастика / Журналы, газеты / Научная Фантастика