Например, последовательность
Повторение
Сигналы ошибки, подобные этим, по-видимому, присутствуют во всех областях мозга. Нейроны коры адаптируются к повторяющимся и предсказуемым событиям и реагируют усиленным разрядом всякий раз, когда происходит нечто неожиданное. Единственное, что меняется от одного участка к другому, – тип противоречия, которое может быть обнаружено. В зрительной коре всплеск активности вызывают неожиданные образы291
. Речевые центры реагируют на необычные слова в предложении. Возьмем, к примеру, следующее предложение:Ваш мозг только что испустил волну N400 – сигнал ошибки, вызванный словом или изображением, несовместимым с предыдущим контекстом292
. Как следует из самого названия, это отрицательный отклик, который регистрируется примерно через четыреста миллисекунд после аномалии и зарождается в популяциях нейронов левой височной доли, чувствительных к значению слова. Зона Брока в нижней префронтальной коре реагирует на синтаксические ошибки – например, когда мозг предсказывает определенную категорию слов, а получает другую293, как в следующем предложении:Сразу после неожиданного слова «плохо» области вашего мозга, специализирующиеся на синтаксисе, испустили отрицательную волну, за которой немедленно последовала волна P600 – положительный пик, возникающий примерно через шестьсот миллисекунд. Этот ответ говорит о том, что ваш мозг обнаружил грамматическую ошибку и пытается ее исправить.
На сегодняшний день лучше всего изучены прогностические сигналы и сигналы ошибки в так называемой системе вознаграждения294
. Дофаминовая сеть не только реагирует на фактические вознаграждения, но и постоянно их предвосхищает. Дофаминергические нейроны, расположенные в небольшом скоплении клеток под названием «вентральная область покрышки», не просто чувствительны к удовольствию от секса, пищи или питья; они сигнализируют о расхождении между ожидаемым вознаграждением и полученным, т.е. об ошибке прогноза. Так, если животное получает награду без всякого предупреждения – скажем, неожиданную каплю подслащенной воды, – то этот приятный сюрприз приводит к нейронному возбуждению. Но если этой награде предшествует предсказывающий ее сигнал, тот же сладкий сироп не вызывает реакции. Теперь уже сам сигнал порождает всплеск активности в дофаминовых нейронах: научение сдвигает ответ ближе к сигналу, предсказывающему вознаграждение.Благодаря данному прогностическому механизму произвольные сигналы могут стать носителями вознаграждения и возбуждать дофаминовые нейроны. Этот вторичный эффект вознаграждения был продемонстрирован на примере денег у здоровых людей и одного вида шприца у наркоманов. В обоих случаях мозг предвосхищает будущие награды. Как мы видели в главе 1, такой прогностический сигнал чрезвычайно полезен для научения, ибо позволяет системе критиковать себя и предвидеть успех или неудачу, не дожидаясь внешнего подтверждения. Именно поэтому архитектуры «актор—критик», в которых одна искусственная нейронная сеть учится критиковать действия другой, сегодня повсеместно используются в искусственном интеллекте для решения самых сложных задач, таких как игра в го. Генерирование прогноза, обнаружение ошибки и самокоррекция – основы эффективного научения.
Обратная связь по ошибкам не синонимична наказанию