Следить за счетом по мере развития шахматной партии гораздо легче. У каждой фигуры есть определенная, численно выражаемая ценность, и эти цифры позволяют в первом приближении понять, кто выигрывает. Шахматы – игра деструктивная. По ходу партии фигуры поочередно исчезают с доски, и положение на ней упрощается. Партия в го, напротив, становится по ходу игры все сложнее и сложнее. Это конструктивная игра. Комментаторы продолжали высказывать свои наблюдения, но до самых последних минут партии не могли с уверенностью сказать, кто из противников имеет преимущество.
Зато они довольно быстро смогли разгадать дебютную стратегию Ли Седоля. Поскольку программа AlphaGo училась играть по партиям, сыгранным в прошлом, Ли Седоль исходил из того принципа, что ему будет выгодно играть неожиданным для программы образом, используя ходы, не входящие в канонический репертуар игры. Проблема заключалась в том, что для этого Ли Седоль должен был вести нестандартную игру – игру, несвойственную ему самому.
Идея была хороша, но она не сработала. Любая обычная машина, запрограммированная на использование базы данных стандартных дебютов, не знала бы, как реагировать на такую игру, и, скорее всего, сделала бы ход, который привел бы к серьезным последствиям в долгосрочной перспективе – в масштабах всей партии. Но AlphaGo не была обычной машиной. Она умела оценивать новые ходы и находить правильный ответный ход, опираясь на то, чему она научилась, сыграв множество партий. Дэвид Силвер, ведущий программист AlphaGo, объяснял в преддверии матча: «AlphaGo разыграла миллионы партий между своими собственными нейронными сетями и, постепенно совершенствуясь, научилась изобретать новые стратегии». То, что Ли Седоль стал разыгрывать партию в непривычном стиле, ему не помогло, а скорее даже помешало.
Следя за игрой, я невольно сочувствовал Ли Седолю. Было видно, как его покидает уверенность в собственных силах и он постепенно осознает, что проигрывает. Он то и дело бросал взгляды на Хуана, представителя DeepMind, который делал ходы за AlphaGo, но выражение лица Хуана не давало ему никакой информации. К 186-му ходу Ли Седолю пришлось признать, что он не сможет преодолеть то преимущество, которое накопила на доске AlphaGo. Он положил камень на край доски, тем самым признав свое поражение.
К концу первого дня счет в матче AlphaGo – люди стал 1: 0. На пресс-конференции, проведенной в этот день, Ли Седоль признал: «Я был очень удивлен, так как никогда не подумал бы, что проиграю».
Но по-настоящему потрясла – не только Ли Седоля, но и всех людей, играющих в го, – вторая партия. В первой партии специалисты могли следить за ходом игры и понимали, почему AlphaGo делает тот или иной ход. Такие же ходы вполне мог делать человек. Но, когда я смотрел вторую партию, сидя дома перед своим лэптопом, случилось нечто странное. Ли Седоль сделал 36-й ход и ушел на крышу гостиницы покурить. Пока его не было, AlphaGo сделала 37-й ход: она побудила представлявшего ее человека, Хуана, поставить черный камень на пятую линию от края доски. Все были ошарашены.
Всем известно, что на начальных этапах игры камни следует ставить на четыре внешние линии. Третья линия позволяет накапливать кратковременное территориальное преимущество на краю доски, а камни, поставленные на четвертую линию, дают более сильную позицию в дальнейшей игре по мере продвижения к центру. Игрокам всегда приходится тщательно выбирать между игрой на третьей и четвертой линии. Игра же на пятой линии всегда считалась нерациональной, так как она дает противнику шанс занять территорию, обеспечивающую как краткосрочное, так и долгосрочное преимущество.
Программа AlphaGo разрушила эту догму, утвердившуюся в течение многих столетий соревнований. Некоторые из комментаторов назвали ее ход явной ошибкой. Другие высказывались более осторожно. Всем было интересно узнать, как воспримет этот ход Ли Седоль, когда вернется с перекура. Когда он сел за стол, было видно, как он буквально вздрогнул, увидев на доске новый камень. Этот ход, несомненно, потряс его, так же как и всех остальных. Он раздумывал над ним более двенадцати минут. Подобно шахматным матчам, игра проводилась с ограничением по времени. Целых 12 минут, потраченные на обдумывание одного хода, стоили очень дорого. То, что ответный ход занял у Ли Седоля столь долгое время, показывает, насколько неожиданной была игра программы. Ли Седоль не мог понять, что делает AlphaGo. Почему она вышла за пределы того участка доски, который они оспаривали до этого?
Было ли это ошибкой AlphaGo? Или же программа увидела в глубине игры нечто, чего не могли заметить люди? Фань Хуэй, назначенный одним из арбитров, тоже взглянул на доску. Его первая реакция была такой же, как и у всех остальных, – потрясение. А затем он начал понимать. «Это не человеческий ход. Я никогда не видел, чтобы человек так играл, – сказал он. – Такой красивый ход. Очень, очень красивый».