Благодаря развитию компьютерных технологий в 2007 году
Хотя стратегия
И Тобиас Галла, физик из Манчестерского университета, и Дойн Фармер пытались выяснить, работает ли теория игр со сложными играми. Теория игр базируется на предположении, что все участники ведут себя рационально, иными словами, отдают себе отчет о последствиях принятых решений и выбирают наиболее благоприятные из них. В простых играх вроде крестиков-ноликов или в «дилемме заключенного» просчитать все имеющиеся варианты не трудно, поэтому их исход почти всегда определяется равновесием Нэша. Но что происходит в играх, устроенных более хитро?
В силу сложности шахмат и ряда вариантов покера ни игроки-люди, ни игроки-машины так и не нашли для них оптимальную стратегию. Подобная проблема существует и на финансовом рынке. Здесь можно получить доступ к огромному количеству важной информации – от стоимости акций до доходности облигаций, – но взаимоотношения банков и брокеров, от которых дрожит и сотрясается рынок, слишком запутаны, чтобы до конца их понять.
Покерные боты пытаются обойти эту проблему, перед началом игры «заучивая» набор стратегий. Но в реальной жизни игрокам приходится осваивать стратегии во время игры. Экономисты предположили, что при выборе стратегии люди руководствуются «мотивацией, основанной на опыте», – попросту повторяют те действия, которые в прошлом принесли им успех. Галла и Фармер заинтересовались: помогает ли модель обучения приблизиться к равновесию Нэша в сложных играх. Кроме того, им хотелось посмотреть, что происходит, если игра не «выравнивается» до оптимального результата. Какую модель поведения мы будем наблюдать в данном случае?
Галла и Фармер разработали игру, в которой двум участникам-компьютерам предлагался выбор из 50 возможных ходов. В зависимости от выпавшей комбинации каждый получал вознаграждение, определявшееся случайным образом перед началом игры. От размера вознаграждения зависело, насколько напряженной будет борьба. Приз присуждался либо по принципу нулевой суммы (потери одного игрока равнялись выигрышу второго), либо был одинаковым для обоих соперников. Память игроков настраивалась таким образом, чтобы в одних играх они «запоминали» все свои предыдущие ходы, а в других – только несколько последних.
Ученые увидели, что игроки с разными заданными уровнями конкуренции и памяти постепенно меняют стратегию и учатся делать все более выгодные ходы. Запрограммированные на слабую память, они снова и снова повторяли одни и те же решения и часто доходили до того, что принимались «обезьянничать» друг у друга. Но если игроки обладали хорошей памятью и играли в условиях жесткой конкуренции, то начинали происходить весьма любопытные события. Принимаемые соперниками решения не стремились к равновесию, напротив, бешено варьировались. Они вели себя непредсказуемо, как шарик рулетки, движение которого студентом пытался изучать Фармер. Ученые заметили: чем больше было число участников, тем чаще они принимали решения безо всякой системы. Судя по всему, в сложных играх предугадать выбор игроков практически невозможно.
Ученые отметили и другие поведенческие паттерны, в том числе те, что ранее наблюдались в реальных играх. Когда в начале 1960-х математик Бенуа Мандельброт изучал финансовые рынки, он обнаружил, что периоды увеличения или уменьшения волатильности (статистического показателя, характеризующего изменчивость цен) на рынках акций имеют тенденцию собираться в кластеры. «Большие изменения следуют за большими изменениями, – отметил он, – а мелкие – за мелкими». Возникновение «кластеризации волатильности» волнует умы экономистов и по сей день. Галла и Фармер наблюдали в своей игре тот же феномен. Они предположили, что этот паттерн – просто следствие того, что множество людей пытаются изучать сложную структуру финансовых рынков.