Читаем Как мы учимся. Почему мозг учится лучше, чем любая машина… пока полностью

Некоторые алгоритмы машинного обучения черпают вдохновение из дарвиновского алгоритма, который управляет эволюцией видов: в ходе оптимизации параметров они вводят мутации ранее обнаруженных решений. Как и в биологии, скорость этих мутаций должна тщательно контролироваться; это позволяет машине исследовать новые решения, не тратя слишком много времени на разного рода «авантюры».

В основе другого алгоритма лежит отжиг – один из видов термической обработки, которым издавна пользовались кузнецы и ремесленники для оптимизации свойств металла. Метод отжига позволяет получить исключительно прочный клинок и состоит в многократном нагревании сплава при постепенно понижающихся температурах. Это повышает вероятность того, что атомы займут правильное положение. Недавно суть этого процесса была успешно перенесена в информатику: алгоритм имитации отжига вносит случайные изменения в параметры при постепенном понижении виртуальной «температуры». Вероятность случайного события высока в начале, а затем начинает снижаться, пока система не достигает оптимальной конфигурации.

Ученые обнаружили, что все эти приемы чрезвычайно эффективны – а значит, не исключено, что в ходе эволюции некоторые из них были «встроены» в наш мозг. Случайный поиск, стохастическое любопытство и зашумленные нейроны – все это играет важную роль в научении у Homo sapiens. И в игре «камень, ножницы, бумага», и в джазовой импровизации, и в анализе возможных решений математической задачи случайность есть один из важнейших компонентов решения. Как мы увидим ниже, всякий раз, когда дети переходят в режим обучения – то есть когда они играют, – они исследуют десятки возможностей, причем зачастую делают это беспорядочно, наобум. Ночью их мозг продолжает жонглировать идеями, пока не натыкается на ту, которая лучше всего объясняет пережитое в течение дня. В третьей части этой книги мы еще вернемся к полуслучайному алгоритму, который отвечает за ненасытное любопытство детей – и тех счастливых взрослых, которым удалось сохранить ум ребенка.

Научение – это оптимизация функции вознаграждения

Помните систему LeNet Лекуна, которая распознает формы цифр? Чтобы этот тип искусственной нейросети мог учиться, его необходимо обеспечить правильными ответами. Иными словами, сеть должна знать, какой из десяти возможных цифр соответствует каждое введенное изображение. Для исправления ошибок система должна вычислить разницу между своим и правильным ответами. Данная процедура получила название «обучения с учителем»: некто вне системы знает решение и пытается научить машину. Метод достаточно эффективный, однако следует отметить, что ситуация, в которой правильный ответ известен заранее, – большая редкость. Когда дети учатся ходить, никто не говорит им, какие именно мышцы нужно сокращать; их просто поощряют пробовать снова и снова, пока они не перестают падать. Другими словами, малыши учатся исключительно на основе оценки результата: я упал или же мне удалось наконец пересечь комнату.

С той же проблемой «обучения без учителя» сталкивается и искусственный интеллект. Например, когда машина учится играть в видеоигру, перед ней ставят одну-единственную задачу – набрать максимальное количество очков. Никто не говорит ей, какие именно действия необходимо для этого предпринять. Как же быть? Как машине самостоятельно найти эффективный и быстрый способ достичь поставленной цели?

«Очень просто», – сказали ученые и придумали так называемое «обучение с подкреплением», в рамках которого мы не сообщаем системе никаких подробностей о том, что она должна делать (этого никто не знает!), но определяем «награду» – например, в виде количества очков9. Что еще хуже, машина может узнавать это количество с задержкой, уже после совершения тех или иных действий. Обучение на основе отложенного подкрепления – принцип, на базе которого DeepMind, дочерняя компания Google, построила машину, способную играть в шахматы, шашки и го. В конце партии система получает один-единственный сигнал, свидетельствующий о выигрыше или проигрыше. Во время самой игры обратная связь отсутствует – засчитывается лишь окончательная победа над соперником. Как же тогда машине определить, что нужно делать? И, если уж на то пошло, как она может оценить свои действия, если известен только исход игры?

Ученые нашли хитрое решение. Они программируют машину так, чтобы она делала сразу две вещи: действовала и одновременно оценивала собственный прогресс. Одна половина системы, так называемый «критик», учится предсказывать конечный результат. Цель этой сети искусственных нейронов заключается в том, чтобы как можно точнее оценить состояние игры и предсказать ее исход: я выигрываю или проигрываю? Благодаря «внутреннему критику» система способна оценивать свои действия в любой момент времени, а не только в конце. На основании этой оценки другая половина машины, «актор» (собственно, «исполнитель»), корректирует свое поведение: пожалуй, мне не стоит делать то-то и то-то – «критик» считает, что это увеличит мои шансы на проигрыш.

Перейти на страницу:

Похожие книги

Что-то на айтишном. Продуктовый подход к развитию личности
Что-то на айтишном. Продуктовый подход к развитию личности

Альтернативный учебник в жанре сторителлинга о метанавыках в условиях стремительно меняющегося мира. Автор получает второй шанс на осмысленное формирование своей личности и делится историей своего становления на основе современных исследований о мозге и поведении, продуктового подхода, используемого в IT и собственного опыта работы в коммуникациях всех уровней. Книга посвящена поколениям зумеров, поздних миллениалов и внутренним детям людей любого возраста. Перед вами – практическое руководство по всестороннему развитию и практикам self help.Комментарий Редакции: Есть книги, которые дают инструменты работы над собой, есть те, в которых авторы, изменившие свою жизнь, вдохновляют примером успеха. Эта книга – чудо алхимии, умелый сплав драгоценных металлов мотивационной литературы.

Ирина Баринская

Карьера, кадры / Личная эффективность / Образование и наука
Как брать интервью. Искусство задавать правильные вопросы и получать содержательные ответы
Как брать интервью. Искусство задавать правильные вопросы и получать содержательные ответы

Интервью берут все. Врачи, юристы, учителя, рекрутеры, соцработники, писатели… Каждый из нас оказывается в ситуациях, когда нужно поговорить с незнакомцем, провести встречу, пройти собеседование, получить какую-то важную информацию. Конечно, можно положиться на удачу, но, если потратить немного времени на подготовку, результат будет куда более впечатляющим.Дин Нельсон – американский журналист с сорокалетним опытом, публиковавшийся в The New York Times, The Boston Globe и USA Today, провел интервью с множеством известных людей, в частности с писателями Рэем Брэдбери, Джойс Кэрол Оутс, Карлосом Руисом Сафоном, поэтом Билли Коллинзом, бывшим президентом Мексики Висенте Фоксом Кесадой, актером, режиссером и сценаристом Томасом Маккарти и баскетболистом Каримом Абдул-Джаббаром.В этой книге он делится профессиональными секретами: как правильно выбрать место встречи, задавать «неудобные» вопросы, как говорить с кумиром или с тем, кто вызывает неприязнь, находить правильные формулировки и выстраивать успешную схему беседы.«Умение задавать хорошие вопросы в правильном порядке, которое приводит к более глубинному пониманию вещей, не повредит любой работе и пригодится в жизни буквально каждому. Я лично имел возможность наблюдать, как это происходит с самыми разными людьми и практически в любой профессиональной среде» (Дин Нельсон).

Дин Нельсон

Личная эффективность / Образование и наука