Тем не менее остается еще один, самый главный кирпичик. Если мы хотим, чтобы общение с компьютером было продуктивным, компьютер должен нас понимать. Собственно, natural language understanding - это огромное междисциплинарное направление, на которое и отдельной темы номера не хватит, но не нужно быть семи пядей во лбу, чтобы прийти к очевидному выводу: построение эффективных речевых коммуникаций невозможно без нахождения обоих собеседников в одном и том же контексте.
В разделе, посвященном машинному переводу, мы приводили пример с коробкой в ручке, но вот другой пример, никак не связанный с переводами. Допустим, у нас есть компьютер, загруженный по самое не хочу словарями, семантикой, лингвистическими правилами, статистическими алгоритмами и прочая, и прочая, и прочая. Что он ответит на элементарный вопрос «есть ли вода в холодильнике?» Нормальный компьютер, конечно же, ответит, что вода в холодильнике есть. Во всяком холодильнике в любой момент времени можно найти множество молекул воды. На любой вкус. При этом компьютер не путает определения (как он делал в случае с «pen»). Формально он прав. Но мы-то спрашивали совсем о другом.
Человек, услышав тот же вопрос, сразу поймет, что имеется в виду не просто вода, а бутылка с минералкой. Иными словами, компьютер неправильно (с нашей точки зрения) отвечает на вопрос, хотя вся необходимая для ответа информация ему доступна.
Проблема в том, что речевая коммуникация - это не вещь в себе. Это верхушка айсберга, и если мы пытаемся подтянуть компьютеры до нашего уровня, то не можем усовершенствовать только их коммуникационные способности. Нельзя научить улитку французскому языку. И очень вероятно, что все описанные в статье задачи - распознавание речи, синтез текста, качественный машинный перевод - неразрешимы, пока не решена более глобальная задача: построение искусственного интеллекта.
Разработчики не любят говорить на эту тему. Задача создания ИИ давно уже табуирована. Но странное совпадение: сразу несколько исследовательских организаций (включая MIT Labs и Марвина Мински) работает сегодня над компьютерными программами (стоит ли называть их программами - тоже вопрос), обладающими зачатками здравого смысла и умеющими учиться. Они обучают нейросети простым, интуитивно понятным каждому человеку вещам. И не исключено, что когда-нибудь эти разработки действительно дадут нам возможность общаться с компьютером, не задумываясь о том, поймет он нас или нет.
Звучит фантастично? Пока - да.
Terralab.ru: Железный поток
процессор Pentium M (1,86 ГГц)
до 2 Гбайт памяти DDR2
поддержка Wi-Fi, WLAN, GPS и Bluetooth (опции)
амортизированный 12,1-дюймовый ЖК-экран с разрешением 1024x768 (XGA)
амортизированный съемный жесткий диск объемом 40 или 80 Гбайт
клавиатура с защитой от пролитых жидкостей
два коннектора для антенн WLAN и WWAN
система защиты от кражи
цена $3330
Ноутбук для работы в экстремальных условиях, прекрасно экипированный в плане беспроводных стандартов. Для работы при нестандартных температурах жесткий диск оснащен обогревателем и кулером. Ресурс литий-ионной батареи - 4-6 часов. Компьютер, соответствующий военному стандарту MIL STD 810F, помещен в прочный корпус из магниевого сплава с шарнирами из нержавеющей стали. На базе этой модели и одновременно с нею выпущен вариант под названием Hammer ($3000); Itronix заключила лицензионное соглашение с корпорацией General Motors на эксклюзивное использование знаменитого автобрэнда.
12,1-дюймовый ЖК-экран с разрешением 1280x800 (WXGA)
процессор Pentium M 740 (1,3 ГГц, 2 Мбайт L2, 533-МГц шина);
чипсет Intel 915GM
512 Мбайт памяти DDR2 (до 2 Гбайт)
60-Гбайт 1,8-дюймовый жесткий диск Toshiba (4200 об./мин, PATA)
оптический привод DVD+/-RW, RAM
считыватель карт с поддержкой форматов xD, SD/MMC, MS/MS Pro
Wi-Fi-адаптер 802.11 b/g
разъем ExpressCard
цена $1750