История компьютерного соревнования, в котором победил «Павлов», выглядит поучительно, так как участвовавшие в турнире программы принимали решения на основе анализа действий
Рис. 18.2. Изменение доли разных стратегий при компьютерном моделировании «Дилеммы заключенного» в течение многих поколений «генетически» изменяю- щихся программ поведения. Доля стратегий определяется по среднему выигрышу, так что повышение этого показателя соответствует росту относительного числа стратегий, нацеленных на сотрудничество. Эволюция программ осуществляется аналогично дарвиновскому естественному отбору с учетом действий обоих партнеров и результатов последнего раунда. Можно отметить периоды нарастания общего духа сотрудничества, заканчивающиеся (в двух первых случаях) полным крахом системы взаимодействий. После третьего подъема устанавливается стационарный режим сотрудничества.
Изучив позднее этот отрезок компьютерной эволюции, Новак и Зигмунд с удивлением обнаружили набор сложных и неоднозначных событий. Оказалось, что после победы сотрудничества в популяции программ произошел переход от стратегии TFT к упоминавшейся более развитой стратегии «великодушной» TFT (GTFT), еще более поощряющей сотрудничество. Такая мягкость и доброта отношений привели к развитию обширной популяции очень доверчивых программ, которые быстро стали жертвами немногих оставшихся в популяции хищных обманщиков. После этого главенствующее положение в популяции занимали не безусловные обманщики, а программа, получившая у исследователей прозвище «Мрачный триггер», которая соглашалась на сотрудничество, но только до первого обмана со стороны. Понятно, что при наличии хотя бы небольшого шума в системе такое было неизбежным. После этого программа переходила к безусловному обману. Это напоминает Машину Судного дня из фильма
Примерно через 220 ООО поколений в популяции неожиданно вновь возникают программы, склонные к сотрудничеству, причем возрождение, как показано на рисунке, носит весьма длительный, возможно, постоянный характер. Это связано с победой возродившихся программ типа TFT (несколько модифицированных в сторону сближения с GTFT) над разновидностями программы «Павлов», причем интересно, что возникшая популяция сохраняет в себя некоторые мрачные особенности предыдущей, например, она склонна к оппортунизму и настроена жестко ко всем проявлениям обмана. В таком «обществе», образно говоря, уже можно жить, но его гражданам не следует забывать об опасности, исходящей от еще существующих, тщательно маскирующихся и кажущихся такими приятными «павловцев».
Возникающая ситуация в целом представляет собой интересное сочетание случайности и определенности. При достаточно долгом ожидании, по-видимому, можно всегда дождаться момента, когда в популяции программ доминирующее положение займут стратегии, направленные на развитие и поощрение сотрудничества. Очень часто победителями оказываются программы типа «Павлов» (примерно в четырех случаях из пяти), но это, в сущности, не представляет особого интереса. Наиболее важным и ярким результатом исследования выступает сам факт революционных преобразований системы, происходящих под воздействием внутренних факторов и генетических изменений программ. Возвращаясь к антропоморфным сравнениям, мы как бы наблюдаем возникновение и гибель структур, которые можно было бы сравнить с империями добра и зла в человеческом понимании их внутреннего устройства. Изучив более внимательно периоды относительной устойчивости таких образований (не важно, в каком состоянии) и их изменений, можно обнаружить, что каждая крайняя форма продолжает сохранять в себе некоторые особенности и характерные нормы другой.