Проиграв матч, Ли Седоль начал четвертую партию в более свободной манере. Казалось, он избавился от тяжелого бремени надежды на победу и это позволило ему получать удовольствие от самой игры. Теперь Ли Седоль применил гораздо менее уравновешенную стратегию под названием «амаси», резко отличающуюся от тщательно продуманных, почти осторожных ходов, которые он делал в третьей партии. Один из комментаторов сравнил его с инвестором, который, не довольствуясь постепенным накоплением мелких заработков, ставит на карту сразу весь свой капитал.
Ли Седоль и его помощники не спали всю ночь с субботы на воскресенье, пытаясь восстановить принципы работы Alpha-Go по сыгранным партиям. Казалось, что программа не полагается на потенциальные последствия одного сложного хода, а последовательно делает ходы, постепенно увеличивающие вероятность ее победы. Ли Седоль наблюдал это поведение, когда AlphaGo предпочла ленивые ходы, позволившие ей выиграть третью партию. Стратегия, которую они выработали, должна была разрушить эту осмотрительную игру отдельными рискованными ходами. Предполагалось, что подобная стратегия игры ва-банк не позволит AlphaGo так легко накапливать преимущество.
AlphaGo это направление атаки, по-видимому, совершенно не беспокоило. К 70-му ходу комментаторы уже начали замечать, что AlphaGo снова одерживает верх. Об этом свидетельствовала и последовательность ее осторожных ходов, которые означали, что AlphaGo уверена в своем преимуществе. Чтобы снова перехватить инициативу, Ли Седолю нужно было придумать нечто необычное.
Если 37-й ход второй партии был моментом проявления творческого гения AlphaGo, то 78-й ход четвертой стал ответным ударом Ли Седоля. В течение 30 минут он сидел за доской, рассматривая картину своего поражения, а затем неожиданно поставил белый камень в необычное положение, между двумя черными камнями AlphaGo. Общее мнение по этому поводу выразил Майкл Редмонд, комментировавший игру на YouTube-канале: «Этот ход застал меня врасплох. Я уверен, что он застал бы врасплох большинство противников. Мне кажется, что он застал врасплох и AlphaGo».
Впечатление создалось именно такое. Ответный ход Alpha-Go был странным: казалось, что программа не заметила, что произошло в игре. Еще через несколько ходов AlphaGo поняла, что проигрывает. Сотрудники DeepMind, смотревшие за кулисами на свои экраны, наблюдали крах своего творения. Выглядело это так, будто 78-й ход вызвал в программе короткое замыкание. И это привело к полному распаду игры AlphaGo – она сделала целую серию губительных для себя ходов. По-видимому, это тоже характерно для программных алгоритмов игры в го. Как только они видят, что проигрывают, их поведение становится совершенно иррациональным.
Когда Силвер, главный программист, увидел очередной ход, который предложила AlphaGo, он даже вздрогнул: «По-моему, они будут смеяться». И действительно, корейские комментаторы принялись хихикать над ходами, которые делала Alpha-Go. Теперь ее ходы не удовлетворяли условиям теста Тьюринга. Никакой человек, обладающий хотя бы зачатками чувства стратегии, не играл бы таким образом. Игра продолжалась до 180-го хода, после чего AlphaGo вывела на экран сообщение о капитуляции. Весь пресс-центр взорвался аплодисментами.
Род человеческий отыграл одно очко. Счет в матче Alpha-Go – человечество стал 3: 1. Улыбка, сиявшая на лице Ли Се-доля на вечерней пресс-конференции этого дня, была красноречивее всяких слов. «Эта победа настолько ценна, что я не променял бы ее ни на что на свете». Журналисты бешено ликовали. «Ее обеспечили ваша поддержка и ваше сочувствие».
Гу Ли, комментировавший этот матч в Китае, приписал 78-й ход Ли Седоля «божественному вмешательству». Этот ход шел вразрез с традициями игры, и в конечном счете именно это придало ему такую потрясающую силу. Но именно этим и отличается подлинное человеческое творчество. Это хороший пример преобразовательного творчества по Боден, в рамках которого к новым идеям можно прийти путем взлома существующей системы.
На пресс-конференции Хассабис и Силвер не смогли объяснить, почему AlphaGo потерпела поражение. Чтобы понять, почему программа так бездарно ответила на 78-й ход Ли Се-доля, им нужно было проанализировать предыдущие данные.
Оказалось, что опыт игры против людей внушил AlphaGo, что о таком ходе не стоит даже думать. По оценке программы вероятность использования его в игре составляла не более одной десятитысячной. По-видимому, программа даже не озаботилась изучить возможные ответы на такой ход, так как придавала большее значение другим ходам, более вероятным и, следовательно, более достойным разработки ответной тактики.