• Фиксированный режим, при котором точно определяются временные параметры подкрепления ответной реакции; при этом можно использовать:
- фиксированное соотношение (например, каждая шестая реакция);
- фиксированный интервал (первая ответная реакция, полученная после определенного промежутка времени);
- фиксированную продолжительность (после того, как животное воспроизводит желательную реакцию в течение определенного периода).
• Переменный режим, при котором время подкрепления реакции устанавливается произвольно.
• Дифференцированный режим, при котором время подкрепления реакции устанавливается по ее качественной характеристике.
В режиме прерывистого подкрепления независимо от степени проявления поведенческой реакции объем подкрепления, по определению, всегда меньше, чем в режиме непрерывного подкрепления. Следовательно, дрессировка может продолжаться дольше. На практике чаще используют либо переменный, либо дифференцированный режим, поскольку их легче применять для формирования четкого и стойкого изменения поведенческих реакций животного.
Режим прерывистого подкрепления для выработки требуемой поведенческой реакции
Если режим прерывистого подкрепления используют для того, чтобы выработать определенную модель поведения, то первоначально подкрепление производят часто, а затем, как только устанавливается стабильная ответная реакция, начинают применять все реже и реже. Так, на начальном этапе животное поощряют за исполнение любого действия, приближающегося к целевому поведению, а позднее только за наиболее четкое выполнение требований, с тем чтобы его поведение формировалось в заданном направлении. Этот процесс, называемый последовательным приближением, наиболее эффективен в тех случаях, когда в определенный отрезок времени работа ведется только с одним аспектом поведения. Например, если животное учат садиться по команде, то первоначально его вознаграждают каждый раз, когда оно выполняет команду (непрерывное подкрепление); как только ответная реакция становится стабильной, обычно переходят на дифференцированный режим, т.е. поощряют только те случаи, когда животное садится правильно и быстро.
Использование режимов прерывистого подкрепления позволяет также снизить частоту некоторых поведенческих проявлений или даже полностью устранить их. Это достигается путем дифференцированного подкрепления ослабленных проявлений проблемного поведения (ДПО), причем для успеха не требуется активного участия животного в программе дрессировки.
При ограниченном ДПО подкрепляется поведение, при котором частота или продолжительность нежелательных проявлений не превышают предварительно заданного уровня. Экспериментально установлено, что некоторые варианты метода позволяют устранять усвоенное нежелательное поведение быстрее, чем простым прекращением подкрепления (Zeiler, 1971).
Этот метод наиболее целесообразно применять на ранних этапах борьбы с чрезмерно громкими голосовыми сигналами животного, особенно если цель данного поведения — привлечь внимание хозяина. Успех зависит от характера голосовых сигналов, а также от того, насколько животное заинтересовано в получаемом от владельца вознаграждении.
• Первоначально вознаграждаются менее интенсивные проявления, благодаря чему животное быстро понимает, что предпочтительны более мягкие формы поведения.
• Затем требования становятся строже: поощряется еще более спокойное поведение.
• Даже после того, как реакции животного станут стабильно менее интенсивными, эту стратегию продолжают до тех пор, пока не достигнут допустимого уровня громкости, либо совсем перестают обращать на проблему внимание.
• В качестве альтернативы можно использовать раздельное ДПО, при котором подкрепляют реакции, разделенные определенным временным интервалом.
Одна из причин, почему эти методы очень полезны для коррекции некоторых типов поведения, направленного на привлечение внимания, состоит в том, что трудно ожидать от хозяина, чтобы он не обращал внимания на своего питомца каждый раз, когда тот пытается установить контакт,— ведь большинство живот-ных-компаньонов содержат именно ради радости общения с ними. Практичнее попросить владельца ограничивать свое внимание к животному и не проявлять его хотя бы в те минуты, когда животное оставляет его одного.
При использовании данных методов следует очень осторожно относиться к росту ожиданий животного, поэтому важно увеличивать объем вознаграждения лишь по мере улучшения поведения. Если же животное будет получать все большее вознаграждение при минимальном уровне требований к нему, успеха не будет. Исходя из этого, необходимо, чтобы клиент вел записи того, какой объем вознаграждения он использует каждый день.