Если все же прибегать к научению, то лучше всего, как выяснилось, использовать подражание. Мы выявили устойчивую прямую связь между долей, отводившейся в стратегии ходам НАБЛЮДАТЬ по сравнению с НОВАТОРСТВОВАТЬ, и успехами этой стратегии в состязании. Самые успешные стратегии разыгрывали ходы с научением не очень часто, но, когда делали это, почти всегда пользовались вариантом НАБЛЮДАТЬ. Однако за нехитрой на первый взгляд корреляцией между подражанием и успехом скрывалась более сложная зависимость, обнаруживаемая только при внимательном анализе. В целом самые успешные стратегии, прошедшие в меле второго этапа, объединяла общая закономерность: чем больше при научении использовалось НАБЛЮДАТЬ по сравнению с НОВАТОРСТВОВАТЬ, тем выше были результаты. При этом у стратегий, что выступили похуже, мы отмечали противоположное – чем больше доля подражания, тем ниже результаты. Из этого мы узнали кое-что весьма интересное: подражание не всегда благо. Подражание окупается, только если использовать его эффективно.
Стратегии-неудачницы пользовались подражанием себе в ущерб, поскольку, выбирая НАБЛЮДАТЬ, они пропускали ход ПРИМЕНЯТЬ с возможностью реализовать накопленный опыт, а простым разыгрыванием НАБЛЮДАТЬ пополнение репертуара агента новыми поведенческими моделями не гарантировано. На социальном научении это действительно сказалось очень сильно – на первом этапе турнира выбор хода НАБЛЮДАТЬ в 53 % случаев не вызывал нового поведения в репертуаре агента (в основном потому, что наблюдаемое поведение оказывалось ему уже известным). После хода НОВАТОРСТВОВАТЬ, напротив, всегда следовало новое поведение. Турнир подтвердил интуитивное предположение, с которого я начал эту главу: неудачное подражание к успеху не приведет. Повторю, чтобы подражание окупилось и увеличило индивидуальную приспособленность, оно
Следующей нашей задачей было вычленить те свойства выигрывающих стратегий, которые обусловливали их превосходство. Как обнаружилось, критическим фактором выступает выбор момента для научения. В успешных стратегиях периоды научения совпадали с переменами в окружающей среде. Как мы помним, именно успешные стратегии в большинстве раундов разыгрывали ПРИМЕНЯТЬ, раз за разом выбирая из своего репертуара модель поведения, обеспечивающую наибольшую отдачу. Но перемены в окружающей среде влекут за собой перемены и в окупаемости поведения, взятого однажды за образец, причем, как правило, это перемены к худшему. Поведенческие модели, которые прежде приносили дивиденды, перестают быть выгодными. Вот тогда-то и следует разыгрывать ход НАБЛЮДАТЬ, поскольку возникает вероятность перенять поведение с большей окупаемостью. Ведь агенты, имеющие в своем репертуаре поведенческие модели, подходящие для новых условий, продолжат ПРИМЕНЯТЬ, а значит и предоставлять для подражания свое выгодное в новом контексте поведение. Другие же агенты, отдача от поведения которых резко упала, напротив, переключаются на роль учеников и приступают к научению, а следовательно, их менее выгодное поведение окажется теперь недоступно для подражания. Приурочивая таким образом научение к переменам, успешные стратегии повышали шансы агентов приобрести поведенческие модели, подходящие для новых условий.
Проигрывающие стратегии, в отличие от лидеров, не только чересчур усердствовали с научением, но и выбирали для него неверные моменты. Если окружающая среда неизменна, подражание нередко вызывает воспроизведение поведенческих паттернов, которые уже существуют в репертуаре агента. Чем практиковать научение в неверный момент, лучше было бы разыгрывать ход НОВАТОРСТВОВАТЬ, он, по крайней мере, гарантирует новое поведение. В результате для менее успешных разработок характерна обратная зависимость между подражанием и приспособленностью.
Ну а победила в турнире стратегия, которой ее авторы дали название