Читаем Искусственный интеллект. Что стоит знать о наступающей эпохе разумных машин полностью

В конце 1980-х годов IBM использовала машинное обучение компьютера англо-французскому переводу путем предоставления ему двуязычных документов, подготовленных канадским парламентом. Как и в Rosetta Stone, данные документы содержали в себе несколько миллионов примеров предложений, переведенных на оба языка.

Система IBM определила взаимосвязи между словами и фразами в обоих языках и повторно использовала их для создания нового перевода. Но результаты все еще содержали очень много ошибок – системе нужно научиться обрабатывать больше данных. «А затем появился Google, который в буквальном смысле скормил этой системе весь Интернет», – рассказывает Виктор Майер-Шенбергер из Института интернета Оксфордского университета.

Каждый день Google переводит больше текста, чем расшифровывают все профессиональные переводчики мира за год. Свою работу над сервисом перевода Google, как и IBM, начинал с обучения алгоритмов сопоставлению документов на разных языках. Но затем пришло осознание того, что результаты перевода можно значительно улучшить, если научить систему тому, как на самом деле люди разговаривают на русском, французском или корейском.

Google обратился к огромной сети проиндексированных слов, объем которой стремительно приближался к фантастической библиотеке из рассказа Хорхе Луиса Борхеса «Вавилонская библиотека». Google-переводчик с английского на французский может сравнить свой начальный вариант перевода с каждой фразой на французском языке, размещенной в Интернете. В качестве примера Майер-Шенбергер приводит английское слово light (свет, легкий). Система должна понять, как именно перевести это слово на французский: lumi`ere (свет) или l'eger (легкий). Google обучался тому, что бы выбрали сами французы.

Переводчики от Google и Microsoft (тот самый, который Рик Рашид продемонстрировал в Китае) обучались в примерно одинаковых условиях: не зная о языке ничего, кроме относительной частоты использования огромного количества последовательностей слов. И все же Google может на достаточно хорошем уровне переводить на 135 письменных языках, начиная африкаанс и заканчивая зулу. Эти ИИ проводят пословный анализ текста, который сводится к расчету вероятности следующего используемого варианта. Для них слова – это набор вероятностей.

Основы алгоритма перевода более или менее понятны. Сложность возникает из-за большого количества сопоставлений, которые происходят между огромными объемами данных. Например, для того чтобы выстроить прогноз об окружающей обстановке, беспилотные автомобили Google каждую секунду собирают почти гигабайт данных. А Amazon нет равных по части того, как заставить людей купить больше, – алгоритм подбирает рекомендации товаров, основанные на миллиардах сопоставлений из миллионов других заказов.

Перевод речи Рашида – то есть обработка того, что он сказал голосом, с дальнейшим мгновенным переводом – лишний раз показывает, насколько мощным может быть статистический ИИ. «Эти системы не творят чудеса», – говорит Крис Бишоп из Microsoft. «Но мы не перестаем удивляться тому, как далеко можно продвинуться, просто просматривая статистику очень больших наборов данных».

«Вам также может понравиться»

Если такой подход к разумности кажется вам обманом, поскольку сам алгоритм не является разумным, то готовьтесь – худшее еще впереди.

Следующим по сложности шагом после функции автозаполнения идет агент по выдаче рекомендаций. Вспомните свой любимый онлайн-магазин. Изучив ваши предыдущие заказы или даже просто историю просмотров на сайте, этот агент постарается отыскать в своем каталоге товары, которые с наибольшей вероятностью смогут вас заинтересовать. Они подбираются путем анализа базы данных, содержащей миллионы транзакций, поисковых запросов и товаров. Также впечатляет и количество параметров, которые потребуется извлечь из обучающего набора: в каталоге Amazon зарегистрировано свыше 200 миллионов клиентов и 3 миллионов книг.

Сопоставление пользователей с товарами на основании предыдущих операций требует статистического анализа колоссального масштаба. Как и в случае с функцией автозаполнения, традиционного понимания здесь не требуется, так как для подбора рекомендаций не нужны психологические модели покупателей или литературная критика новел. Поэтому неудивительно, что возникает закономерный вопрос: а следует ли вообще называть таких агентов «разумными»? Тем не менее никаких сомнений о самом «обучении» быть не может: с накоплением опыта такие агенты действительно становятся лучше.

Имитация поведения
Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже