Сложная природа взаимодействий организма и среды требует особых механизмов, позволяющих не только распознавать стимулы, которые могут служить наградой или наказанием, но и на основании опыта спрогнозировать их появление в будущем. Многое из того, что нам известно о положительном подкреплении, открыл еще в начале XX века Иван Павлов (
Исследования дофаминергической системы показали, что она реагирует не только на саму награду, но и (даже сильнее) на стимулы, позволяющие ее ожидать. Многие годы психологи полагали, что для выработки условного рефлекса требуется одновременное (или почти одновременное) предъявление нейтрального условного стимула (сенсорного) и безусловного стимула (награды), позволяющее сформироваться ассоциации между теми и другими ощущениями. Согласно этим представлениям, всякий раз, когда стимулы предъявляются вместе, нейронная связь между ними усиливается до тех пор, пока не становится достаточно сильной, чтобы сказаться на поведении. Предполагалось, что сила условного рефлекса зависит исключительно от числа таких предъявлений.
Однако в 1969 году американский психолог Леон Кэмин совершил открытие, которое считается одним из важнейших, сделанных в этой области после Павлова. Кэмин установил, что животные научаются не просто тому, что нейтральный стимул предшествует награде, а тому, что он
Эти открытия позволяют предположить, отчего у людей и животных так легко вырабатываются условные рефлексы. По-видимому, все формы ассоциативного научения развились в ходе эволюции потому, что давали возможность отличать закономерно связанные события от случайно сочетающихся, тем самым позволив нам прогнозировать последствия. В итоге мы можем научиться, например, ожиданию вкуса изысканного красного вина уже тогда, когда подносим к губам бокал “Шатонеф-дю-Пап” и улавливаем аромат.
Научение происходит тогда, когда реальные последствия отличаются от прогнозируемых. Существует множество форм поведения, на которые влияет ожидание награды. Когда награда оказывается не такой, как ожидалось, эти формы поведения претерпевают долговременные изменения. Когда же награда соответствует ожиданиям, поведение остается прежним.
Физиологи продемонстрировали, что дофаминергические нейроны задействованы в разных формах научения, связанных с положительным подкреплением. Эти нейроны активируются не только при ожидании награды, но и при получении неожиданной награды, а также при ошибках в ожидании награды. На такие ошибки указывают колебания уровня дофамина в дофаминергической системе. Это привело к предположению, что дофамин играет роль
Механизм работы дофаминергических нейронов при научении выяснил Вольфрам Шульц, работающий в настоящее время в Кембриджском университете. Регистрируя активность клеток вентральной области покрышки и черной субстанции, Шульц обнаружил, что эти нейроны возбуждаются при неожиданном получении награды, при ожидании награды и при ошибках в ожидании награды. В последнем случае возбуждение наблюдается лишь тогда, когда награда оказывается лучше ожидаемой – в противном случае активность нейронов подавляется. Активность этих нейронов усиливается также при получении неожиданной награды, а подавляется при неполучении ожидаемой награды. Если же награда в точности соответствует ожиданиям, данные клетки на нее не реагируют.
Данные Шульца согласуются с представлениями Дарвина о полярной регуляции эмоций, основанной на стремлении и избегании (или на борьбе и бегстве). Дофаминергические нейроны активируются и при получении реальной награды (во время приема пищи, секса, употребления психотропных веществ), и при восприятии стимулов, позволяющих ожидать ее получения. Таким образом, поток дофамина запускается даже простейшим ожиданием удовольствия, хотя это удовольствие, может быть, и не удастся получить.
Как можно было предположить, вещества, усиливающие или продлевающие естественное действие дофамина, приносят нам большее удовольствие. Зависимость, вызываемая рядом психотропных веществ, например кокаином или амфетамином, связана именно с тем, что они сбивают с толку дофаминергическую систему, заставляя мозг думать, будто он получает награду, хотя никакой награды нет (