Читаем Искусственный интеллект полностью

В конце 1980-х годов IBM использовала машинное обучение компьютера англо-французскому переводу путем предоставления ему двуязычных документов, подготовленных канадским парламентом. Как и в Rosetta Stone, данные документы содержали в себе несколько миллионов примеров предложений, переведенных на оба языка.

Система IBM определила взаимосвязи между словами и фразами в обоих языках и повторно использовала их для создания нового перевода. Но результаты все еще содержали очень много ошибок – системе нужно научиться обрабатывать больше данных. «А затем появился Google, который в буквальном смысле скормил этой системе весь Интернет», – рассказывает Виктор Майер-Шенбергер из Института интернета Оксфордского университета.

Каждый день Google переводит больше текста, чем расшифровывают все профессиональные переводчики мира за год. Свою работу над сервисом перевода Google, как и IBM, начинал с обучения алгоритмов сопоставлению документов на разных языках. Но затем пришло осознание того, что результаты перевода можно значительно улучшить, если научить систему тому, как на самом деле люди разговаривают на русском, французском или корейском.

Google обратился к огромной сети проиндексированных слов, объем которой стремительно приближался к фантастической библиотеке из рассказа Хорхе Луиса Борхеса «Вавилонская библиотека». Google-переводчик с английского на французский может сравнить свой начальный вариант перевода с каждой фразой на французском языке, размещенной в Интернете. В качестве примера Майер-Шенбергер приводит английское слово light (свет, легкий). Система должна понять, как именно перевести это слово на французский: lumi`ere (свет) или l'eger (легкий). Google обучался тому, что бы выбрали сами французы.

Переводчики от Google и Microsoft (тот самый, который Рик Рашид продемонстрировал в Китае) обучались в примерно одинаковых условиях: не зная о языке ничего, кроме относительной частоты использования огромного количества последовательностей слов. И все же Google может на достаточно хорошем уровне переводить на 135 письменных языках, начиная африкаанс и заканчивая зулу. Эти ИИ проводят пословный анализ текста, который сводится к расчету вероятности следующего используемого варианта. Для них слова – это набор вероятностей.

Основы алгоритма перевода более или менее понятны. Сложность возникает из-за большого количества сопоставлений, которые происходят между огромными объемами данных. Например, для того чтобы выстроить прогноз об окружающей обстановке, беспилотные автомобили Google каждую секунду собирают почти гигабайт данных. А Amazon нет равных по части того, как заставить людей купить больше, – алгоритм подбирает рекомендации товаров, основанные на миллиардах сопоставлений из миллионов других заказов.

Перевод речи Рашида – то есть обработка того, что он сказал голосом, с дальнейшим мгновенным переводом – лишний раз показывает, насколько мощным может быть статистический ИИ. «Эти системы не творят чудеса», – говорит Крис Бишоп из Microsoft. «Но мы не перестаем удивляться тому, как далеко можно продвинуться, просто просматривая статистику очень больших наборов данных».

«Вам также может понравиться»

Если такой подход к разумности кажется вам обманом, поскольку сам алгоритм не является разумным, то готовьтесь – худшее еще впереди.

Следующим по сложности шагом после функции автозаполнения идет агент по выдаче рекомендаций. Вспомните свой любимый онлайн-магазин. Изучив ваши предыдущие заказы или даже просто историю просмотров на сайте, этот агент постарается отыскать в своем каталоге товары, которые с наибольшей вероятностью смогут вас заинтересовать. Они подбираются путем анализа базы данных, содержащей миллионы транзакций, поисковых запросов и товаров. Также впечатляет и количество параметров, которые потребуется извлечь из обучающего набора: в каталоге Amazon зарегистрировано свыше 200 миллионов клиентов и 3 миллионов книг.

Сопоставление пользователей с товарами на основании предыдущих операций требует статистического анализа колоссального масштаба. Как и в случае с функцией автозаполнения, традиционного понимания здесь не требуется, так как для подбора рекомендаций не нужны психологические модели покупателей или литературная критика новел. Поэтому неудивительно, что возникает закономерный вопрос: а следует ли вообще называть таких агентов «разумными»? Тем не менее никаких сомнений о самом «обучении» быть не может: с накоплением опыта такие агенты действительно становятся лучше.

Имитация поведения
Перейти на страницу:

Все книги серии New Scientist. Лучшее от экспертов журнала

Похожие книги

Норвежский лес
Норвежский лес

…по вечерам я продавал пластинки. А в промежутках рассеянно наблюдал за публикой, проходившей перед витриной. Семьи, парочки, пьяные, якудзы, оживленные девицы в мини-юбках, парни с битницкими бородками, хостессы из баров и другие непонятные люди. Стоило поставить рок, как у магазина собрались хиппи и бездельники – некоторые пританцовывали, кто-то нюхал растворитель, кто-то просто сидел на асфальте. Я вообще перестал понимать, что к чему. «Что же это такое? – думал я. – Что все они хотят сказать?»…Роман классика современной японской литературы Харуки Мураками «Норвежский лес», принесший автору поистине всемирную известность.

Ларс Миттинг , Харуки Мураками

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Проза / Современная русская и зарубежная проза / Современная проза
История целибата
История целибата

Флоренс Найтингейл не вышла замуж. Леонардо да Винчи не женился. Монахи дают обет безбрачия. Заключенные вынуждены соблюдать целибат. История повествует о многих из тех, кто давал обет целомудрия, а в современном обществе интерес к воздержанию от половой жизни возрождается. Но что заставляло – и продолжает заставлять – этих людей отказываться от сексуальных отношений, того аспекта нашего бытия, который влечет, чарует, тревожит и восхищает большинство остальных? В этой эпатажной и яркой монографии о целибате – как в исторической ретроспективе, так и в современном мире – Элизабет Эбботт убедительно опровергает широко бытующий взгляд на целибат как на распространенное преимущественно в среде духовенства явление, имеющее слабое отношение к тем, кто живет в миру. Она пишет, что целибат – это неподвластное времени и повсеместно распространенное явление, красной нитью пронизывающее историю, культуру и религию. Выбранная в силу самых разных причин по собственному желанию или по принуждению практика целибата полна впечатляющих и удивительных озарений и откровений, связанных с сексуальными желаниями и побуждениями.Элизабет Эбботт – писательница, историк, старший научный сотрудник Тринити-колледжа, Университета Торонто, защитила докторскую диссертацию в университете МакГилл в Монреале по истории XIX века, автор несколько книг, в том числе «История куртизанок», «История целибата», «История брака» и другие. Ее книги переведены на шестнадцать языков мира.

Элизабет Эбботт

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Педагогика / Образование и наука