Вторая важная форма ассоциативного обучения наряду с классическим условным рефлексом — оперантный условный рефлекс. Он связан прежде всего с именем американского психолога Берреса Фредерика Скиннера. Если при классическом условном рефлексе новый стимул связывается с уже существующей реакцией, то при оперантном животное обучается тому, что, совершив изначально случайное действие, получает поощрение и таким образом добивается цели. Нагляднее всего эту форму обучения иллюстрируют исследования в так называемых ящиках Скиннера. Это специальные аппараты, где укреплен, например, рычаг, на который можно нажать, или шайба, которую можно клюнуть. Проводились исследования прежде всего на крысах и голубях. Животное, помещенное в ящик, выполнив такое действие, автоматически получает поощрение, например из специально открывающейся кормушки. Когда крысу впервые сажают в такой аппарат, она начинает бегать по нему взад и вперед, обследуя окружающую обстановку, и производит все возможные манипуляции. В какой-то момент она случайно давит на рычаг и в какой-то момент обнаруживает упаковку с кормом. Через некоторое время крыса запоминает, что между нажатием на рычаг и получением корма есть связь. И если первое нажатие на рычаг было случайным, то теперь уже крыса производит это действие целенаправленно, чтобы получить корм.
Поэтому оперантный условный рефлекс называется также обучением путем проб и ошибок либо обучением на успех. В принципе оно приводит к тому, что действие, связанное с поощрением, повторяется все чаще, в то время как другое действие, не получающее подкрепления, постепенно отходит на задний план. Чтобы между поведением и поощрением могла быть сформирована ассоциация, поощрение должно как можно быстрее следовать за действием. Если временна́я дистанция слишком велика, обучения не происходит. Скиннер обнаружил, что успех обучения резко сокращается, если между нажатием на рычаг и пищевым поощрением проходит больше восьми секунд.
Впрочем, существуют примечательные исключения. Так, если дикие крысы находят незнакомую пищу, то они отъедают от нее сначала лишь немножко и ждут, не станет ли им плохо. При этом они даже через несколько часов еще способны провести параллель между поеданием определенного корма и подступающей тошнотой. Если плохо им не становится, то в последующие ночи они поедают все больше этого корма, пока, наконец, не станут есть его в обычных для себя количествах. Однако если они почувствуют, что им становится нехорошо, то с этого момента они будут и в дальнейшем избегать этого корма.
Как показывают наблюдения, ассоциации между определенным действием и его последствиями в некоторых случаях могут быть сформированы и тогда, когда между двумя этими событиями проходит относительно длительное время. Кроме того, этот пример показывает, что за счет оперантного условного рефлекса животные учатся не только тому, какие действия приводят к поощрению, но и тому, каких неприятных ситуаций или опасностей им следует избегать. Как и при классическом условном рефлексе, успех обучения при оперантном через какое-то время требует закрепления. Представим, например, крысу, которая научилась нажимать на рычаг, чтобы получить пищевое поощрение. Она будет повторять то же действие и в том случае, если будет получать корм в ответ лишь на каждое второе, десятое или даже сотое нажатие. Однако если оно вообще перестанет сопровождаться поощрением, то крыса рано или поздно прекратит нажимать на рычаг.
Обучение за счет оперантных условных рефлексов имеет в жизни животных немаловажное значение. Оно играет решающую роль в поисках пищи, обучении социальным правилам, совершенствовании определенных поведенческих алгоритмов и освоении новых местообитаний. Наконец, эта форма обучения всегда задействована там, где определенные поведенческие алгоритмы должны быть опробованы впервые. Воспитание животных в неволе также по большей части базируется на выработке оперантных условных рефлексов.
Думают ли животные?