Система вариабельного подкрепления лежит в основе всех азартных игр. Если бы вы, играя в рулетку, каждый раз выигрывали, то не стали бы играть.
Правило при вариабельном режиме таково: чем реже, непредсказуемей подкрепления, тем лучше.
Долговременная программа поведения
Иногда бывает необходимо использовать фиксированный и вариабельный режимы одновременно. Так бывает тогда, когда подкрепление в фиксированном режиме (т. е. когда обучаемый точно знает, когда и за что получает подкрепление) осуществляется через слишком большой промежуток времени. При этом часто проявляется феномен отсроченного начала, когда человек бесконечно откладывает начало какой-нибудь работы. В этих случаях нужно ввести подкрепление именно за старт либо разбить весь процесс на кусочки и давать за них подкрепления в вариабельном режима.
Карен Прайор рассказывает, что одно время она посещала вечерние занятия. Это требовало много времени, и каждый раз как приближался час занятий, у нее появлялось сильное желание не пойти. Тогда она разбила поездку на пять этапов: до метро, посадка, пересадка на другой поезд, путь до университета и, наконец, подъем в лифте до аудитории, и стала подкреплять их в вариабельном режиме кусочками шоколада. Через некоторое время она оказалась способной проделать весь путь без шоколада и без внутренней борьбы.
Чего можно добиться с помощью положительного подкрепления
Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мать девушки. Ока была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. «Не беспокойся, мама, - сказала дочь. - Поживем - увидим». Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей.
Процесс выработки поведения. Формирование высших форм поведения
Что такое процесс выработки? До сих пор мы говорили о том, как с помощью подкреплений закреплять поведение, которое уже имеется. Но как заставить своих подопечных делать то, чего они никогда не делают?
Оказывается, можно добиться и этого.
Нужно установить ряд последовательных целей (разбить задачу на этапы), найти какой-то элемент доведения, который осуществляется уже сейчас, и использовать его как первый шаг. Затем нужно шаг за шагом подвигаться к поставленной цели.
Вот, например, как К. Прайор обучила цыпленка вальсировать. Она давала ему подкрепление всякий раз, как он поворачивался налево. Скоро первая цель была достигнута: цыпленок стал поворачиваться часто. Тогда дрессировщица стала подкреплять только самые большие повороты и, наконец, только несколько поворотов сразу, т. е. она воспитала вальсирующего цыпленка.
Выработка поведения применяется при обучении большинству процессов физических и умственных навыков: при обучении печатанию на машинке, вязанию, обучении счету, письму и т. п.
Есть два аспекта выработки: способы и приемы, т. е. последовательность шагов, необходимых для выработки нового типа поведения, и закономерности, или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Десять правил выработки
1. Повышайте требования постепенно, небольшими градациями, чтобы у ученика всегда была реальная возможность получить подкрепление. Если вы повышаете критерий так сильно, что ученику надо совершить усилие значительно большее, чем он совершал ранее на занятиях, вы сильно рискуете. Поведение может быть сорвано.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Хорошие преподаватели оставляют данную задачу, как только в ней достигнут успех, и переходят к другой. Однако когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием.
Если задачу можно расчленить на отдельные компоненты и последовательно над ними работать, обучение пойдет гораздо быстрее.
3. Прежде чем повышать критерий, пользуйтесь вариабельной шкалой подкреплений имеющегося в данный момент результата.
4. Вводя новый критерий, временно ослабьте старые. В новых условиях естественно, когда начинают повторять старые ошибки. Ругать непедагогично.
5. Ведите ученика за собой. Планируйте программу выработки так, что если ученик совершит в обучении неожиданный скачок вперед, то вы будете знать, что подкреплять далее. Рывок эмоционально важен для ученика. Быть неготовым к нему и держать ученика на низком уровне обучения только потому, что вы не знаете, что делать дальше, - лучший способ потратить зря время, а в худшем случае можно отбить охоту и вызвать отвращение у обучаемого.
6. Не меняйте тренеров на полпути.