Более того, вторичные вознаграждения, ставшие результатом научения в одной ситуации, генерализуются, будучи «перенесенными» и на другие ситуации. Эстес (Estes, 1949) показал, что звук, ассоциируемый с питьем, подкрепляет реакцию даже в тех случаях, когда крыса испытывает голод, а не жажду. Именно таким образом у людей появляются «талисманы» (т. е. предметы, приобретшие ценность вознаграждения). Представим себе, что некий индивидуум в последний момент увернулся от мчащегося на него автомобиля. Возможно, что после этого случая он начнет связывать спасение от боли с одеждой, которую он носил в момент встречи с машиной. В результате у него появляется привычка носить «счастливую» одежду в любой опасной ситуации («талисман» помогает редуцировать драйв тревоги).
В первом ряду сформулированных Халлом принципов (Hull, 1943) стоит следующая закономерность: потенциал возбуждения, или склонность действовать, является функцией силы драйва и силы привычки, или времени пребывания без еды (депривации) и числа попыток пробежать по лабиринту. Однако с самого начала было ясно, что даже если сила драйва остается постоянной, размер вознаграждения также оказывает влияние на вероятность повторения реакции. Результаты одного из исследований подтверждают верность данного утверждения. В ходе этого исследования в качестве критерия склонности действовать использовалась скорость, с которой крысы преодолевали путь до пищи. Как мы видим из рис. 3.5, вознаграждение из 16 шариков побуждало крыс бежать гораздо быстрее, нежели 1 шарик пищи, а 256 шариков являлись более сильным, чем 16, подкреплением, несмотря на то что время депривации оставалось неизменным. Кроме того, в случае изменения размера вознаграждения изменялась и скорость бега крыс: те из них, кому вместо 256 шариков начинали давать 16, резко «сбавляли темп», а те, кто вместо одного шарика стали получать 16, наоборот, резко увеличивали скорость бега.
Учитывая влияние, которое размер вознаграждения оказывает на силу реакции, Халл добавил в свое уравнение новую переменную, обычно обозначаемую как К (поощрительное вознаграждение). Соответственно, измененное уравнение выглядит следующим образом:
Потенциал возбуждения (актуализация поведения)=Сила драйва х Сила привычки х Размер вознаграждения,
или
То есть на основании новых данных Халл предположил, что размер вознаграждения (
Рис. 3.5.
Скорость бега на длинную дистанцию как функция силы подкрепления. Во время первых 19 попыток различным группам крыс предъявлялись 1, 16 или 256 шариков еды (данные по эффективности научения группы, которой предъявляли 1 шарик, представлены с того момента, когда этой группе начали предъявлять 16 шариков). После 20-й попытки всем трем группам начали предъявлять по 16 шариков (Weiner, 1980а, after Crespi, 1942)[6]Кеннет Спенс (Spence, 1956, 1958а, 1958b) видоизменил уравнение Халла. Спенс был твердым сторонником идеи о том, что размер вознаграждения нужно рассматривать в качестве фактора, определяющего потенциал возбуждения, однако он считал, что уравнение должно выглядеть следующим образом:
С точки зрения Спенса, переменные