Читаем Как мы учимся. Почему мозг учится лучше, чем любая машина… пока полностью

Некоторые алгоритмы машинного обучения черпают вдохновение из дарвиновского алгоритма, который управляет эволюцией видов: в ходе оптимизации параметров они вводят мутации ранее обнаруженных решений. Как и в биологии, скорость этих мутаций должна тщательно контролироваться; это позволяет машине исследовать новые решения, не тратя слишком много времени на разного рода «авантюры».

В основе другого алгоритма лежит отжиг – один из видов термической обработки, которым издавна пользовались кузнецы и ремесленники для оптимизации свойств металла. Метод отжига позволяет получить исключительно прочный клинок и состоит в многократном нагревании сплава при постепенно понижающихся температурах. Это повышает вероятность того, что атомы займут правильное положение. Недавно суть этого процесса была успешно перенесена в информатику: алгоритм имитации отжига вносит случайные изменения в параметры при постепенном понижении виртуальной «температуры». Вероятность случайного события высока в начале, а затем начинает снижаться, пока система не достигает оптимальной конфигурации.

Ученые обнаружили, что все эти приемы чрезвычайно эффективны – а значит, не исключено, что в ходе эволюции некоторые из них были «встроены» в наш мозг. Случайный поиск, стохастическое любопытство и зашумленные нейроны – все это играет важную роль в научении у Homo sapiens. И в игре «камень, ножницы, бумага», и в джазовой импровизации, и в анализе возможных решений математической задачи случайность есть один из важнейших компонентов решения. Как мы увидим ниже, всякий раз, когда дети переходят в режим обучения – то есть когда они играют, – они исследуют десятки возможностей, причем зачастую делают это беспорядочно, наобум. Ночью их мозг продолжает жонглировать идеями, пока не натыкается на ту, которая лучше всего объясняет пережитое в течение дня. В третьей части этой книги мы еще вернемся к полуслучайному алгоритму, который отвечает за ненасытное любопытство детей – и тех счастливых взрослых, которым удалось сохранить ум ребенка.

Научение – это оптимизация функции вознаграждения

Помните систему LeNet Лекуна, которая распознает формы цифр? Чтобы этот тип искусственной нейросети мог учиться, его необходимо обеспечить правильными ответами. Иными словами, сеть должна знать, какой из десяти возможных цифр соответствует каждое введенное изображение. Для исправления ошибок система должна вычислить разницу между своим и правильным ответами. Данная процедура получила название «обучения с учителем»: некто вне системы знает решение и пытается научить машину. Метод достаточно эффективный, однако следует отметить, что ситуация, в которой правильный ответ известен заранее, – большая редкость. Когда дети учатся ходить, никто не говорит им, какие именно мышцы нужно сокращать; их просто поощряют пробовать снова и снова, пока они не перестают падать. Другими словами, малыши учатся исключительно на основе оценки результата: я упал или же мне удалось наконец пересечь комнату.

С той же проблемой «обучения без учителя» сталкивается и искусственный интеллект. Например, когда машина учится играть в видеоигру, перед ней ставят одну-единственную задачу – набрать максимальное количество очков. Никто не говорит ей, какие именно действия необходимо для этого предпринять. Как же быть? Как машине самостоятельно найти эффективный и быстрый способ достичь поставленной цели?

«Очень просто», – сказали ученые и придумали так называемое «обучение с подкреплением», в рамках которого мы не сообщаем системе никаких подробностей о том, что она должна делать (этого никто не знает!), но определяем «награду» – например, в виде количества очков9. Что еще хуже, машина может узнавать это количество с задержкой, уже после совершения тех или иных действий. Обучение на основе отложенного подкрепления – принцип, на базе которого DeepMind, дочерняя компания Google, построила машину, способную играть в шахматы, шашки и го. В конце партии система получает один-единственный сигнал, свидетельствующий о выигрыше или проигрыше. Во время самой игры обратная связь отсутствует – засчитывается лишь окончательная победа над соперником. Как же тогда машине определить, что нужно делать? И, если уж на то пошло, как она может оценить свои действия, если известен только исход игры?

Ученые нашли хитрое решение. Они программируют машину так, чтобы она делала сразу две вещи: действовала и одновременно оценивала собственный прогресс. Одна половина системы, так называемый «критик», учится предсказывать конечный результат. Цель этой сети искусственных нейронов заключается в том, чтобы как можно точнее оценить состояние игры и предсказать ее исход: я выигрываю или проигрываю? Благодаря «внутреннему критику» система способна оценивать свои действия в любой момент времени, а не только в конце. На основании этой оценки другая половина машины, «актор» (собственно, «исполнитель»), корректирует свое поведение: пожалуй, мне не стоит делать то-то и то-то – «критик» считает, что это увеличит мои шансы на проигрыш.

Перейти на страницу:

Все книги серии Книги, которые сделают вас еще умнее

Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы
Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы

За последнее десятилетие чтение стало неотъемлемой частью нашей жизни. Мы перестали замечать, как много читаем и пишем и едва ли когда-нибудь задумываемся о том, как мы это делаем.Станислас Деан – французский нейробиолог, ведущий когнитивный нейроученый в мире – задумался об этом всерьез и провел широкомасштабное исследование процессов формирования навыков чтения и письма. В этой книге Деан отвечает на вопросы, касающиеся дефицита чтения, методов обучения этому навыку, нарушений письма и чтения, особенностей восприятия различных систем письменности, а также других важных аспектов. В том числе нейробиолог дает рекомендации по обучению чтению детей.Исследование Станисласа Деана – шаг к более осознанному чтению, пониманию того, как символы на бумаге трансформируются в нашем сознании в новые миры и смыслы. Прямо здесь и сейчас.

Станислас Деан

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Научно-популярная литература / Образование и наука

Похожие книги

20 великих бизнесменов. Люди, опередившие свое время
20 великих бизнесменов. Люди, опередившие свое время

В этой подарочной книге представлены портреты 20 человек, совершивших революции в современном бизнесе и вошедших в историю благодаря своим феноменальным успехам. Истории Стива Джобса, Уоррена Баффетта, Джека Уэлча, Говарда Шульца, Марка Цукерберга, Руперта Мердока и других предпринимателей – это примеры того, что значит быть успешным современным бизнесменом, как стать лидером в новой для себя отрасли и всегда быть впереди конкурентов, как построить всемирно известный и долговечный бренд и покорять все новые и новые вершины.В богато иллюстрированном полноцветном издании рассказаны истории великих бизнесменов, отмечены основные вехи их жизни и карьеры. Книга построена так, что читателю легко будет сравнивать самые интересные моменты биографий и практические уроки знаменитых предпринимателей.Для широкого круга читателей.

Валерий Апанасик

Карьера, кадры / Биографии и Мемуары / О бизнесе популярно / Документальное / Финансы и бизнес
Как мы меняемся (и десять причин, почему это так сложно)
Как мы меняемся (и десять причин, почему это так сложно)

Каждый из нас мечтает что-то поменять в своей жизни – избавиться от деструктивных привычек, чему-то научиться, стать более организованным или похудеть. Однако большинство так и не меняются. Психотерапевт и специалист в области психического здоровья Росс Элленхорн считает, что мы избираем неверный подход. Прежде всего нужно проанализировать, что нас удерживает от изменений. На примерах из своей практики автор подробно рассказывает о десяти основных причинах, которые не дают нам измениться. Вы сможете понять мотивы саморазрушительного поведения и вернуть веру в себя.Издание будет интересно всем, кто интересуется психологией и саморазвитием.На русском языке публикуется впервые.

Росс Элленхорн

Карьера, кадры / Управление, подбор персонала / Финансы и бизнес
Управление бизнесом по методикам спецназа. Советы снайпера, ставшего генеральным директором
Управление бизнесом по методикам спецназа. Советы снайпера, ставшего генеральным директором

Вас может удивить, что бывший снайпер подразделения «морских котиков» написал бизнес-книгу. Но в этом нет ничего странного. Бойцы отрядов особого назначения обладают навыками, которые, во-первых, помогают им успешно справляться с заданием, а во-вторых, чрезвычайно эффективны не только на войне, но и в бизнесе. Спецназовцев безжалостно тренируют, чтобы они научились приспосабливаться, могли решать проблемы нестандартно и при любых обстоятельствах. Брэндон Уэбб успешно применил опыт, полученный за время службы в ВМС США, когда создавал собственную медиасеть Hurricane Group, Inc. В своей книге он рассказывает об уроках, которые получил за время военной службы и которые помогут любому предпринимателю стать «спецназовцем от бизнеса».

Брэндон Уэбб , Джон Дэвид Манн

Карьера, кадры