Читаем Models of the Mind полностью

Даян и Монтегю попытались проанализировать данные Шульца через призму алгоритмов обучения. Они сосредоточились на простейшем эксперименте Шульца, который заключался в том, что в нужном месте включался свет, и если животное тянулось к нему, то через полсекунды подавалась капля сока. Их интересовало, как изменяется реакция дофаминовых нейронов по мере того, как животное усваивает эту ассоциацию. Но их также интересовало особое обстоятельство после обучения: что происходит, когда сок не следует за светом. Если животные усвоили ассоциацию "свет-сок", они должны были знать, что ожидать этого, и если сок не появлялся, это было бы значительной ошибкой предсказания. Отразили ли это дофаминовые нейроны?

Нейроны, выделяющие дофамин, обычно производят около пяти всплесков в секунду, когда ничего особенного не происходит. В начале процесса обучения, сразу после того, как животное, сделав движение рукой, получило, как казалось, неожиданную порцию сока, этот показатель ненадолго подскочил примерно до 20 шипиков в секунду. Однако свет, предшествующий движению, ничего не вызывал. Но после достаточного количества пар, когда животное поняло, как связаны между собой свет, достижение и сок, эта картина изменилась. Нейроны дофамина перестали реагировать на сок. Это изменение полностью соответствует представлению о том, что они сигнализируют об ошибке предсказания, поскольку, как только животное может правильно предсказать появление сока, ошибки больше нет. И они начали реагировать на свет. Почему? Потому что свет стал ассоциироваться с вознаграждением, но - что очень важно - они не знали, когда он включится. Когда он появился, это была ошибка. Точнее, это ошибка в предсказанном значении состояния животного. Сидя в экспериментальном кресле и занимаясь своими делами, обезьяна ожидает, что следующий момент будет более или менее похож на текущий. Когда включается свет, это ожидание нарушается. Как если бы вы услышали первые несколько тактов песни "С днем рождения" в коридоре своего офиса - приятный сюрприз, но тем не менее сюрприз.

Последний анализ, проведенный при спорадическом отказе от сока после достижения, был направлен на то, чтобы увидеть, как кодируются неприятные сюрпризы. Если дофамин кодирует ошибки, то он должен указывать и на то, когда ситуация хуже, чем ожидалось. И когда сок отсутствовал, нейроны именно это и делали. У них наблюдался спад в стрельбе как раз в то время, когда сок должен был быть доставлен. Точнее, в ответ на свет нейроны сбрасывали от пяти до 20 импульсов в секунду; затем, когда животное протягивало руку, их количество возвращалось к пяти. Но примерно через полсекунды после протягивания руки, когда становилось ясно, что сок не поступает, они полностью отключались. Ожидание было нарушено, и дофаминовые нейроны давали об этом знать.

Это исследование показало, что срабатывание дофаминовых нейронов может сигнализировать об ошибках - как положительных, так и отрицательных - относительно прогнозируемых значений, которые необходимы для обучения. Таким образом, оно стало важным моментом в изменении понимания дофамина от молекулы удовольствия до педагогического.

Однако если смысл кодирования ошибки заключается в том, чтобы извлечь из нее уроки, то где происходит это обучение? Оказывается, это не так просто определить, потому что дофамин-выделяющие нейроны выделяют дофамин во многих уголках мозга; их проекции пронизывают мозг, как трубы, затрагивая близкие и далекие области.Тем не менее,сайте есть место, которое кажется особенно важным, - это стриатум. Стриатум - это группа нейронов, которая служит первичным входом для целого ряда областей мозга, участвующих в управлении движениями и действиями. Нейроны в стриатуме способствуют формированию поведения, связывая сенсорные сигналы с действиями или действия с другими действиями.

Как мы видели в главе 4, гебистское обучение - это простой способ закодировать ассоциации между идеями в связях между нейронами. По правилам Хеббиана, если один нейрон регулярно срабатывает раньше другого, вес связи от первого ко второму усиливается. Однако в обучении с подкреплением нам нужно не просто знать, что два события произошли в близкое время. Нам нужно знать, как эти события связаны с вознаграждением. В частности, мы хотим обновить вес связи между сигналом и действием (например, увидеть свет и потянуться к нему) только в том случае, если эта пара окажется связанной с вознаграждением.

Таким образом, нейроны в стриатуме не следуют базовому гебистскому обучению. Вместо этого они следуют модифицированной форме, при которой срабатывание одного нейрона перед другим укрепляет их связь только в том случае, если это происходит в присутствии дофамина. Таким образом, дофамин, который кодирует сигнал об ошибке, необходимый для обновления значений, также требуется для физических изменений, необходимых для обновления, которые происходят в синапсе. Таким образом, дофамин действительно действует как смазка для обучения.

Перейти на страницу:

Похожие книги

Мозг и разум в эпоху виртуальной реальности
Мозг и разум в эпоху виртуальной реальности

Со Ёсон – южнокорейский ученый, доктор наук, специалист в области изучения немецкого языка и литературы, главный редактор издательства Корейского общества Бертольда Брехта, исследующий связи различных дисциплин от театрального искусства до нейробиологии.Легко ли поверить, что Аристотель и научно-фантастический фильм «Матрица» проходят красной нитью через современную науку о мозге и философию Спинозы, объясняя взаимоотношения мозга и разума?Как же связаны между собой головной мозг, который называют колыбелью сознания, и разум, на который как раз и направлена деятельность сознания?Можно ли феномен разума, который считается решающим фактором человеческого развития, отличает людей от животных, объяснить только электрохимической активностью нейронов в головном мозге?Эта книга посвящена рассмотрению подобных фундаментальных вопросов и объединяет несколько научных дисциплин, которые развились в ходе напряженных споров о соотношении материи и разума, которые берут своё начало с древних времен и продолжаются по сей день. Данная работа не является простым цитированием ранее написанных исследований, направленным на защиту своей позиции, она подчеркивает необходимость появления нового исследования мозга, которое должно будет вобрать в себя как философские умозаключения, так и научную доказательную базу.В формате PDF A4 сохранен издательский макет.

Со Ёсон

Биология, биофизика, биохимия
Расширенный фенотип
Расширенный фенотип

«Расширенный фенотип» – одна из лучших книг известного учёного и видного популяризатора науки Ричарда Докинза. Сам автор так сказал про неё в предисловии ко второму изданию: «Думаю, что у большинства учёных – большинства авторов – есть какая-то одна публикация, про которую они говорили бы так: не страшно, если вы никогда не читали моих трудов кроме "этого", но "этот" пожалуйста прочтите. Для меня таким трудом является "Расширенный фенотип"». Помимо изложения интересной научной доктрины, а также весьма широкого обзора трудов других исследователей-эволюционистов, книга важна своей глубоко материалистической философской и мировоззренческой позицией, справедливо отмеченной и высоко оцененной в послесловии профессионального философа Даниэла Деннета.

Ричард Докинз

Биология, биофизика, биохимия