Читаем Мотивация человека полностью

Мотивация человека

Более того, вторичные вознаграждения, ставшие результатом научения в одной ситуации, генерализуются, будучи «перенесенными» и на другие ситуации. Эстес (Estes, 1949) показал, что звук, ассоциируемый с питьем, подкрепляет реакцию даже в тех случаях, когда крыса испытывает голод, а не жажду. Именно таким образом у людей появляются «талисманы» (т. е. предметы, приобретшие ценность вознаграждения). Представим себе, что некий индивидуум в последний момент увернулся от мчащегося на него автомобиля. Возможно, что после этого случая он начнет связывать спасение от боли с одеждой, которую он носил в момент встречи с машиной. В результате у него появляется привычка носить «счастливую» одежду в любой опасной ситуации («талисман» помогает редуцировать драйв тревоги).

Размер вознаграждения

В первом ряду сформулированных Халлом принципов (Hull, 1943) стоит следующая закономерность: потенциал возбуждения, или склонность действовать, является функцией силы драйва и силы привычки, или времени пребывания без еды (депривации) и числа попыток пробежать по лабиринту. Однако с самого начала было ясно, что даже если сила драйва остается постоянной, размер вознаграждения также оказывает влияние на вероятность повторения реакции. Результаты одного из исследований подтверждают верность данного утверждения. В ходе этого исследования в качестве критерия склонности действовать использовалась скорость, с которой крысы преодолевали путь до пищи. Как мы видим из рис. 3.5, вознаграждение из 16 шариков побуждало крыс бежать гораздо быстрее, нежели 1 шарик пищи, а 256 шариков являлись более сильным, чем 16, подкреплением, несмотря на то что время депривации оставалось неизменным. Кроме того, в случае изменения размера вознаграждения изменялась и скорость бега крыс: те из них, кому вместо 256 шариков начинали давать 16, резко «сбавляли темп», а те, кто вместо одного шарика стали получать 16, наоборот, резко увеличивали скорость бега.

Учитывая влияние, которое размер вознаграждения оказывает на силу реакции, Халл добавил в свое уравнение новую переменную, обычно обозначаемую как К (поощрительное вознаграждение). Соответственно, измененное уравнение выглядит следующим образом:

Потенциал возбуждения (актуализация поведения)=Сила драйва х Сила привычки х Размер вознаграждения,

или _sE_R = D х _SH_R х К.

То есть на основании новых данных Халл предположил, что размер вознаграждения (К), сила привычки (_sH_R) и сила драйва вместе определяют потенциал возбуждения, точно так же как сила драйва и сила привычки вместе детерминируют силу реакции. Если значение хотя бы одной из переменных, входящих в новое уравнение Халла, оказывается равным нулю, то исследуемое поведение характеризуется нулевым потенциалом актуализации (_SE_R). При отсутствии драйва животное не будет действовать, какой бы устоявшейся ни была его привычка и каким бы громадным ни было вознаграждение. При отсутствии всякой практики оно просто не сможет решить новую задачу, каким бы сильным ни был драйв и каким бы заманчивым ни было вознаграждение. Аналогично, при полном отсутствии вознаграждения животное останется пассивным, каким бы мощным ни был драйв и какой бы сильной ни была привычка.

Рис. 3.5. Скорость бега на длинную дистанцию как функция силы подкрепления. Во время первых 19 попыток различным группам крыс предъявлялись 1, 16 или 256 шариков еды (данные по эффективности научения группы, которой предъявляли 1 шарик, представлены с того момента, когда этой группе начали предъявлять 16 шариков). После 20-й попытки всем трем группам начали предъявлять по 16 шариков (Weiner, 1980а, after Crespi, 1942)[6]

Кеннет Спенс (Spence, 1956, 1958а, 1958b) видоизменил уравнение Халла. Спенс был твердым сторонником идеи о том, что размер вознаграждения нужно рассматривать в качестве фактора, определяющего потенциал возбуждения, однако он считал, что уравнение должно выглядеть следующим образом:

_sE_R = (D +К)х _SH_R

С точки зрения Спенса, переменные D и К необходимо объединить, потому что влияние К осуществляется прежде всего с помощью механизма описанной нами выше отдельной антиципаторной целевой реакции (r_g > s_g). Большое вознаграждение (большой кусок пищи) вызовет такие процессы типа r_g > s_g, которые будут существенно отличаться от аналогичных процессов, вызванных маленьким вознаграждением. Стимуляция, источником которой служит антиципаторная целевая реакция, будет направлять поведение животного и неизбежно объединяться со стимуляцией, источником которой выступает драйв. И уже затем суммарное воздействие двух видов стимулов умножается на силу привычки, вследствие чего происходит «запуск» соответствующего поведения. Данные исследований до сих пор не позволили нам однозначно ответить на вопрос о том, кто — Халл или Спенс — предложил наиболее корректное уравнение поведения.

Читаем Мотивация человека полностью

Мотивация человека

Размер вознаграждения

Похожие книги

Все жанры