Возможно, Ли Седолю просто нужно было узнать своего противника. Возможно, в более долгом матче он сумел бы перехватить у AlphaGo инициативу. Сможет ли он сохранить свое преимущество в пятой, последней, партии? Проигрыш со счетом 3: 2 был бы совсем не тем же, что проигрыш со счетом 4: 1. Последняя партия все еще стоила приложения всех сил. Если бы он сумел выиграть вторую партию, это позволило бы усомниться в способности AlphaGo удержать превосходство.
Но AlphaGo извлекла из своего поражения ценный урок. Сейчас применение хода Ли Седоля, вероятность которого не превышает одной десятитысячной, в игре против ее алгоритма уже не дает победы. В этом и состоит сила алгоритмов такого рода. Они учатся на своих ошибках.
Это не значит, что алгоритм не может совершать новых ошибок. В некоторый момент в самом начале пятой партии казалось, что AlphaGo совершенно не знакома со стандартным набором ходов, который используется в формировавшейся на доске позиции. Хассабис, находившийся за кулисами, писал в твиттере: «#AlphaGo допустила серьезную ошибку на раннем этапе игры (она не знала хорошо известного
На этом этапе Ли Седоль был впереди. Игра шла полным ходом. Постепенно AlphaGo удалось выбраться из ловушки. Но до самого конца партии сотрудники DeepMind не были уверены, выигрывает ли их программа. Наконец, на 281-м ходу – после пяти часов игры – Ли Седоль сдался. На этот раз за кулисами ликовали. Хассабис триумфально воздел руки. Все члены команды жали друг другу руки и обнимались. Победа, которую Ли Седоль одержал в четвертой партии, неожиданно возродила в них дух соревнования. Им было важно не проиграть и эту партию.
Вспоминая этот матч, многие признают, насколько необычайным было это событие. Кое-кто сразу же объявил его переломным моментом в истории искусственного интеллекта. Конечно, эта машина всего лишь умела играть в настольную игру, и тем не менее в ее способности к обучению и адаптации внимательные наблюдатели увидели нечто принципиально новое. Хассабис подытожил достигнутый результат в сообщении, опубликованном в твиттере после победы в первой партии: «ПОБЕДА #AlphaGo!!!! Мы высадились на Луну». Сравнение было удачным. Высадка на Луну не дала нам какой-либо потрясающей новой информации о Вселенной, но ее дали технологии, которые мы разработали для получения этого результата. После финальной игры матча Южнокорейская ассоциация го удостоила программу Alpha-Go почетного девятого профессионального дана – высшей почести для игрока в го.
37-й ход второй партии был настоящим творческим достижением. Он был решением новаторским и, несомненно, неожиданным, и дальнейший ход игры доказал его ценность. Это необычайное творческое решение, раздвинувшее границы игры до новых пределов.
Один из важных аспектов игры го заключается в том, что ценность новаторского хода можно оценить объективно. Придумать нечто новое, творческое на вид, может кто угодно. Подлинное искусство – и по-настоящему трудная задача – состоит в изобретении чего-то не просто нового, но и ценного. В чем же состоит эта ценность? Она может быть очень субъективной и меняться со временем. Произведение, которое критики разносили в момент его появления, может быть признано следующими поколениями революционным творческим достижением. Слушатели XIX века не понимали Пятой симфонии Бетховена, а сейчас она входит в основной репертуар. При жизни Ван Гогу с трудом удавалось продавать свои картины – по большей части он обменивал их на еду или художественные принадлежности, – а теперь они покупаются за миллионы. В игре го есть более осязаемый и быстродействующий критерий ценности хода: помогает ли он выиграть партию? 37-й ход обеспечил AlphaGo победу во второй партии. У нас есть объективная мера, позволяющая определить ценность новизны этого хода.
Программа AlphaGo научила мир играть в древнюю игру по-новому. Проведенные после матча аналитические исследования привели к созданию новых тактик. Теперь на пятой линии начинают играть раньше, так как мы поняли, что это может иметь важные последствия в эндшпиле. А AlphaGo продолжила изобретать еще более новаторские стратегии. В начале 2017 года представители DeepMind объявили, что последняя версия программы анонимно играла в интернете против профессионалов высочайшего уровня, выступая под двумя псевдонимами – Мастер и Магис. Люди не знали, что они играют с машиной. За несколько недель программа сыграла шестьдесят полных партий. Во всех шестидесяти она выиграла.
Но подлинным откровением стал анализ этих игр. Сейчас эти партии считаются настоящей сокровищницей новых идей. В некоторых партиях AlphaGo использовала ходы, за которые начинающие игроки получили бы от своих наставников по го линейкой по рукам. Традиционно считалось, что нельзя ставить камень на пересечение третьего столбца и третьей строки. А программа AlphaGo показала способ использовать этот ход с выгодой для себя.