Читаем Архитекторы интеллекта. Вся правда об искусственном интеллекте от его создателей полностью

И. Б.: К концу 1990-х гг. нейронные сети вышли из моды, и ими практически никто не занимался. Но моя интуиция говорила, что мы упускаем что-то важное. Ведь благодаря композиционной структуре они могли представить богатую информацию о данных, базируясь на множестве «строительных блоков» – нейронов и их слоев. Лично меня это привело к лингвистическим моделям, то есть к нейронным сетям, которые моделировали текст, используя векторные представления слов. Каждое слово в них связано с набором чисел, соответствующих различным атрибутам, которые изучаются машиной автономно. Тогда этот подход не получил широкого распространения, но в настоящее время эти идеи используются почти во всем, что связано с моделированием языка на основе данных.

Обучать глубокие сети мы не умели, но проблему решил Джеффри Хинтон своей работой по быстрым алгоритмам обучения ограниченной машины Больцмана (restricted Boltzmann machine, RBM). В моей лаборатории велась работа над связанными с ней автокодировщиками, которые дали начало таким моделям, как генеративно-состязательные сети (generative adversarial networks). Благодаря им появилась возможность обучения более глубоких сетей.

М. Ф.: А что такое автокодировщик?

И. Б.: Это специальная архитектура, состоящая из двух частей: кодировщика и декодера. То, что кодировщик сжал – декодер восстанавливал, причем так, чтобы выход был максимально близок к оригиналу. Автокодировщики превращали входную необработанную информацию в более абстрактное представление, в котором проще было выделить семантический аспект. Затем декодер восстанавливал по этой высокоуровневой абстракции исходные данные. Это были первые работы по глубокому обучению.

Через несколько лет мы обнаружили, что для обучения глубоких сетей достаточно изменения нелинейности. Вместе с одним из моих студентов, который работал с нейробиологами, мы решили попробовать блоки линейной ректификации (rectified linear unit, ReLU). Это пример копирования работы человеческого мозга.

М. Ф.: И к каким результатам это привело?

И. Б.: Раньше для активации нейронных сетей использовали сигмоиду, но оказалось, что с функцией ReLU гораздо проще обучать глубокие сети с большим количеством уровней. Переход случился примерно в 2010 г. Появилась огромная база данных ImageNet, предназначенная для отработки и тестирования методов распознавания объектов на изображениях и машинного зрения. Чтобы заставить людей поверить в методы глубокого обучения, нужно было показать хорошие результаты на примере этой базы. Это смогла сделать группа Джеффри Хинтона, которая использовала в качестве основы работы Яна Лекуна, посвященные сверточным сетям. В 2012 г. эти новые архитектуры позволили значительно улучшить существующие методы. За пару лет на эти сети переключились все, кто занимался компьютерным зрением.

М. Ф.: То есть именно в этот момент началось настоящее глубокое обучение?

И. Б.: Нет, совокупность факторов, ускоривших глубокое обучение, целиком сложилась только к 2014 г.

М. Ф.: То есть к моменту, когда этим занялись не только университеты, но и такие компании, как Google, Facebook и Baidu?

И. Б.: Именно так. Процесс ускорения начался чуть раньше, примерно в 2010 г., благодаря таким компаниям, как Google, IBM и Microsoft, которые работали над нейронными сетями для распознавания речи. Эти нейронные сети к 2012 г. Google начала использовать на смартфонах Android. Тот факт, что одну и ту же технологию глубокого обучения смогли применить как для компьютерного зрения, так и для распознавания речи, оказался по-настоящему революционным. Это привлекло внимание к сфере ИИ.

М. Ф.: Удивляет ли вас тот факт, что нейронные сети, с которыми вы много лет назад начали работать, стали центральным элементом проектов в таких крупных компаниях, как Google и Facebook?

И. Б.: Конечно, изначально этого никто не ожидал. В области глубокого обучения был сделан ряд важных, удивительных открытий. Я уже упоминал, что распознавание речи появилось в 2010 г., а о компьютерном зрении стали говорить в 2012 г. Пару лет спустя начался прорыв в сфере машинного перевода, который в 2016 г. привел к появлению сервиса Google Translate. В этом же году началось активное развитие программы AlphaGo. Всего этого мы не ожидали. Помню, как в 2014 г. я просматривал результаты генерации подписей к изображениям и поражался тому, что компьютер смог это сделать. Если бы годом раньше меня спросили, реально ли подобное, я бы ответил «нет».

М. Ф.: Это действительно нечто потрясающее. Конечно, осечки иногда происходят, но в большинстве случаев мы имеем поразительно точный результат.

И. Б.: Осечки неизбежны! Системы пока не обучены на достаточном количестве данных, кроме того, требуется изрядно продвинуться в фундаментальных исследованиях, чтобы они действительно научились распознавать объекты на изображениях и понимать язык. Пока до этого далеко, но ведь даже современного уровня производительности мы изначально не ожидали.

Перейти на страницу:

Похожие книги

21 урок для XXI века
21 урок для XXI века

«В мире, перегруженном информацией, ясность – это сила. Почти каждый может внести вклад в дискуссию о будущем человечества, но мало кто четко представляет себе, каким оно должно быть. Порой мы даже не замечаем, что эта полемика ведется, и не понимаем, в чем сущность ее ключевых вопросов. Большинству из нас не до того – ведь у нас есть более насущные дела: мы должны ходить на работу, воспитывать детей, заботиться о пожилых родителях. К сожалению, история никому не делает скидок. Даже если будущее человечества будет решено без вашего участия, потому что вы были заняты тем, чтобы прокормить и одеть своих детей, то последствий вам (и вашим детям) все равно не избежать. Да, это несправедливо. А кто сказал, что история справедлива?…»Издательство «Синдбад» внесло существенные изменения в содержание перевода, в основном, в тех местах, где упомянуты Россия, Украина и Путин. Хотя это было сделано с разрешения автора, сравнение версий представляется интересным как для прояснения позиции автора, так и для ознакомления с политикой некоторых современных российских издательств.Данная версии файла дополнена комментариями с исходным текстом найденных отличий (возможно, не всех). Также, в двух местах были добавлены варианты перевода от «The Insider». Для удобства поиска, а также большего соответствия теме книги, добавленные комментарии отмечены словом «post-truth».Комментарий автора:«Моя главная задача — сделать так, чтобы содержащиеся в этой книге идеи об угрозе диктатуры, экстремизма и нетерпимости достигли широкой и разнообразной аудитории. Это касается в том числе аудитории, которая живет в недемократических режимах. Некоторые примеры в книге могут оттолкнуть этих читателей или вызвать цензуру. В связи с этим я иногда разрешаю менять некоторые острые примеры, но никогда не меняю ключевые тезисы в книге»

Юваль Ной Харари

Обществознание, социология / Самосовершенствование / Зарубежная публицистика / Документальное
Открытый заговор
Открытый заговор

Работа «Открытый Заговор» принадлежит перу известного английского писателя Герберта Уэллса, широко известного в России в качестве автора научно-фантастических романов «Машина времени», «Человек-невидимка», «Война миров» и другие. Помимо этого, Уэллс работал в жанрах бытового романа, детской, научно-популярной литературы и публицистики. «Открытый Заговор» – редкий для английского писателя жанр, который можно назвать политическим. Предлагаемую работу можно даже назвать манифестом, содержащим призыв к человечеству переустроить мир на новых началах.«Открытый Заговор» ранее не переводился на русский язык и в нашей стране не издавался. Первая версия этой работы увидела свет в 1928 году. Несколько раз произведение перерабатывалось и переиздавалось. Настоящая книга является переводом с издания 1933 года. Суть предлагаемого Уэллсом переустройства мира – в демонтаже суверенных государств и создании вместо них Мирового государства, возглавляемого Мировым правительством. Некоторые позиции программы «Открытого Заговора» выглядят утопичными, но, вместе с тем, целый ряд положений программы уже воплощен в жизнь, а какие-то находятся в стадии реализации. Несмотря на то что работа писалась около 90 лет назад, она помогает лучше понять суть процессов, происходящих сегодня в мире.

Герберт Джордж Уэллс , Герберт Уэллс

Государство и право / Политика / Зарубежная публицистика / Документальное