Читаем Власть роботов. Как подготовиться к неизбежному полностью

DeepMind поставила вычислительный эксперимент: исследователи обучили мощную нейронную сеть на данных, моделировавших информацию о движении, которой пользуется животное, разыскивающее еду в темноте. Исследователи с удивлением обнаружили, что структуры, напоминающие нейроны решетки, «спонтанно возникли внутри сети — что поразительно напоминает паттерны активности нейронов, наблюдающиеся у разыскивающих еду млекопитающих»[157]. Иными словами, оказалось, что одна и та же базовая навигационная структура сама собой возникает в двух совершенно разных субстратах, биологическом и цифровом. Хассабис сказал мне, что считает это одним из самых поразительных прорывов, совершенных компанией. Похоже, что внутренняя система, использующая нейроны решетки, попросту представляет собой самый эффективный с точки зрения вычислений способ отображения навигационной информации в любой структуре, независимо от того, как именно она реализована[158]. Научная статья DeepMind, описывающая это исследование и опубликованная в журнале Nature[159], вызвала широкий отклик в сфере нейробиологии. Подобные открытия заставляют предположить, что междисциплинарный подход, которого придерживается эта компания, скорее всего, окажется улицей с двусторонним движением — исследователи ИИ будут не только учиться у мозга, но и способствовать его пониманию.

DeepMind внесла еще один важный вклад в нейробиологию в начале 2020 года, использовав свой опыт в области глубокого обучения для исследования работы дофаминовых нейронов в мозге[160]. Нейробиологи с 1990-х годов стали понимать, что эти особые нейроны предсказывают вероятное вознаграждение за выполнение животным определенного действия. Если реальная награда оказывается больше ожидаемой, то выделяется относительно больше дофамина. Если же результат отстает от ожиданий, это химическое вещество, дающее нам чувство благополучия, вырабатывается в меньшем количестве. Традиционное обучение с подкреплением у компьютерных систем устроено во многом так же — алгоритм делает прогноз и затем регулирует вознаграждение, исходя из разницы между ожидаемыми и действительными результатами. Исследователям из DeepMind удалось значительно усовершенствовать алгоритм обучения с подкреплением, сгенерировав распределение прогнозов вместо одного усредненного предсказания и затем корректируя вознаграждение в соответствии с ними. Затем компания совместно с группой исследователей из Гарварда проверила, происходит ли подобный процесс в головном мозге. Им удалось доказать, что мозг мышей действительно создает аналогичное распределение прогнозов: одни дофаминовые нейроны оценивают потенциальную награду более пессимистично, другие — более оптимистично. Иными словами, компания снова продемонстрировала наличие одного и того же базового механизма, обеспечивающего аналогичные результаты, в цифровом алгоритме и в биологическом мозге.

Исследования такого рода свидетельствуют о глубокой вере Хассабиса и его команды в обучение с подкреплением и об отношении к этому методу как к важнейшему элементу попыток приблизиться к более универсальному искусственному интеллекту. В этом плане они стоят особняком. Например, Ян Лекун из Facebook заявил, что отводит обучению с подкреплением второстепенную роль. В своих выступлениях он часто говорит, что если бы интеллект был тортом, то обучение с подкреплением представляло бы собой лишь вишенку на нем[161]. Команда из DeepMind убеждена в принципиально большей значимости этого метода, а также видит в нем реальный путь к созданию универсального ИИ.

Обычно мы описываем обучение с подкреплением как действие основанного на вознаграждении алгоритма, оптимизирующего некоторые внешние макропроцессы, например освоение игры го или навыка вождения смоделированного автомобиля. Однако Хассабис отмечает, что обучение с подкреплением также играет определяющую роль в головном мозге и может являться обязательным условием возникновения разума. Вполне возможно, что обучение с подкреплением — первичный механизм, побуждающий мозг проявлять любопытство, учиться и мыслить. Представим, например, что естественная задача мозга сводится к исследованию и последующему упорядочиванию потока необработанных данных, непрерывно воспринимаемых животным, движущимся в своей среде обитания. По словам Хассабиса, «мы знаем, что при взгляде на что-то новое и необычное в мозге вырабатывается дофамин», и если мозг так устроен, что «поиск информации и ее структурирование само по себе есть вознаграждение, то это чрезвычайно полезная мотивация»[162]. Иначе говоря, двигателем, поддерживающим наше постоянное стремление к постижению окружающего мира, вполне может быть алгоритм обучения с подкреплением, связанный с выработкой дофамина.

Перейти на страницу:

Похожие книги

100 великих угроз цивилизации
100 великих угроз цивилизации

Человечество вступило в третье тысячелетие. Что приготовил нам XXI век? С момента возникновения человечество волнуют проблемы безопасности. В процессе развития цивилизации люди смогли ответить на многие опасности природной стихии и общественного развития изменением образа жизни и новыми технологиями. Но сегодня, в начале нового тысячелетия, на очередном высоком витке спирали развития нельзя утверждать, что полностью исчезли старые традиционные виды вызовов и угроз. Более того, возникли новые опасности, которые многократно усилили риски возникновения аварий, катастроф и стихийных бедствий настолько, что проблемы обеспечения безопасности стали на ближайшее будущее приоритетными.О ста наиболее значительных вызовах и угрозах нашей цивилизации рассказывает очередная книга серии.

Анатолий Сергеевич Бернацкий

Публицистика
1941 год. Удар по Украине
1941 год. Удар по Украине

В ходе подготовки к военному противостоянию с гитлеровской Германией советское руководство строило планы обороны исходя из того, что приоритетной целью для врага будет Украина. Непосредственно перед началом боевых действий были предприняты беспрецедентные усилия по повышению уровня боеспособности воинских частей, стоявших на рубежах нашей страны, а также созданы мощные оборонительные сооружения. Тем не менее из-за ряда причин все эти меры должного эффекта не возымели.В чем причина неудач РККА на начальном этапе войны на Украине? Как вермахту удалось добиться столь быстрого и полного успеха на неглавном направлении удара? Были ли сделаны выводы из случившегося? На эти и другие вопросы читатель сможет найти ответ в книге В.А. Рунова «1941 год. Удар по Украине».Книга издается в авторской редакции.В формате PDF A4 сохранен издательский макет книги.

Валентин Александрович Рунов

Военное дело / Публицистика / Документальное
Принцип Дерипаски
Принцип Дерипаски

Перед вами первая системная попытка осмыслить опыт самого масштабного предпринимателя России и на сегодняшний день одного из богатейших людей мира, нашего соотечественника Олега Владимировича Дерипаски. В книге подробно рассмотрены его основные проекты, а также публичная деятельность и антикризисные программы.Дерипаска и экономика страны на данный момент неотделимы друг от друга: в России около десятка моногородов, тотально зависимых от предприятий олигарха, в более чем сорока регионах работают сотни предприятий и компаний, имеющих отношение к двум его системообразующим структурам – «Базовому элементу» и «Русалу». Это уникальный пример роли личности в экономической судьбе страны: такой социальной нагрузки не несет ни один другой бизнесмен в России, да и во всем мире людей с подобным уровнем личного влияния на национальную экономику – единицы. Кто этот человек, от которого зависит благополучие миллионов? РАЗРУШИТЕЛЬ или СОЗИДАТЕЛЬ? Ответ – в книге.Для широкого круга читателей.

Владислав Юрьевич Дорофеев , Татьяна Петровна Костылева

Публицистика / Документальное / Биографии и Мемуары