Основное препятствие в том, что системы машинного перевода, как и системы распознавания речи, выполняют свою задачу, не понимая обрабатываемый текст[272]. В сфере перевода, как и в сфере распознавания речи, остается вопрос: какая степень понимания необходима машинам, чтобы они смогли добиться человеческих результатов? Дуглас Хофштадтер утверждает: “Перевод – это гораздо более сложная задача, чем поиск соответствий в словаре и перестановка слов… Перевод предполагает наличие ментальной модели мира, о котором идет речь”[273]. Например, человеческий перевод истории о ресторане предполагает наличие ментальной модели, в рамках которой в ситуации, когда человек выбегает из ресторана, не заплатив, официантка с большей вероятностью кричит ему вслед об оплате счета, чем о “законопроекте”. Словам Хофштадтера вторит недавняя статья исследователей ИИ Эрнеста Дэвиса и Гэри Маркуса: “Машинный перевод… часто сталкивается с проблемами неоднозначности, разрешить которые невозможно, не добившись истинного понимания текста – и не пустив в ход знания о реальном мире”[274].
Может ли сеть кодер-декодер усвоить необходимые ментальные модели и знания о реальном мире, просто получив более крупный обучающий набор данных и большее количество сетевых уровней, или необходимо нечто фундаментально иное? В ИИ-сообществе этот вопрос по-прежнему остается открытым и вызывает горячие споры. Пока я просто скажу, что нейронный машинный перевод может быть впечатляюще эффективным и полезным для различных целей, но без постредактирования квалифицированными специалистами этот перевод остается совершенно ненадежным. Если вы используете машинный перевод – а я его использую, – не принимайте результаты за чистую монету. Когда я обратилась к “
Перевод изображений в предложения
Вот безумная идея: может ли система вроде пары нейронных сетей, построенных на основе архитектуры кодер-декодер, не только переводить тексты с одного языка на другой, но и переводить
Рис. 39. Схема автоматизированной системы подписи изображений, разработанной в
Как выясняется, эта идея не такая уж безумная. В 2015 году две группы исследователей – одна из
На рис. 39 показана схема работы системы
Как эта система учится генерировать осмысленные подписи? Как вы помните, обучающие данные для машинного перевода текстов состоят из пар предложений, в которых первое предложение пары написано на языке оригинала, а второе представляет собой перевод этого предложения, выполненный человеком. В случае с подписями к изображениям каждый пример состоит из изображения, в паре к которому идет подпись. Изображения были скачаны из таких хранилищ, как