По плану перед пятой партией Ли и AlphaGo должны были тянуть жребий, чтобы определить, кто будет играть белыми, а кто черными. Но Ли попросил Хассабиса и Силвера позволить ему играть черными. Другими словами, он попросил поставить его в самые трудные условия. (В силу почтения, с которым к нему относились, Мастер не играл черными последние 30 лет.) Хассабис и Силвер согласились.
Поначалу казалось, что AlphaGo все еще сбита с толку, и эксперты отдавали преимущество Ли. AlphaGo решила атаковать небольшую группу камней Ли, позволив при этом крупной группе собственных камней погибнуть, что выглядело как промах. Это впечатление было ошибочным. Судя по всему мы, люди, просто не разбираемся в го достаточно хорошо для того, чтобы судить о замыслах машины. Как отмечал в своем комментарии Фань Хуэй, «согласно представлениям людей о поиске оптимальных ходов, выбор AlphaGo был глупым. Однако с глобальной точки зрения белые ни в коей мере не отстали». «Ошибки» программы вовсе не были ошибками. В сущности, они могут повлиять на то, как будут играть в го в течение будущих веков. Они показали, как много есть такого, о чем мы не знали, а также как много есть такого, о чем мы даже не знали, что не знали. Последняя партия была самой продолжительной в матче – 280 ходов, однако Ли проиграл.
Итоговый счет составил 4:1. Южнокорейская ассоциация го присвоила AlphaGo почетный разряд – девятый дан, такой же, как у Ли Седоля и Хонинбо Сусаи. Программа заняла второе место в перечне научных прорывов 2016 года, выбранных журналом
Ни у вас, ни у меня нет доступа к AlphaGo. Мы не можем купить проприетарное программное обеспечение, сыграть с ним и извлечь полезные уроки в комфортной домашней обстановке. Но один увлеченный любитель и масса его последователей, потратив около года компьютерного времени, разблокировали его возможности и выпустили их в мир. Они освободили AlphaGo.
Джан-Карло Паскутто говорил со мной из своего дома в Бельгии. Паскутто занимался компьютерными шахматами, но стечение обстоятельств, кульминацией которых стала компьютерная олимпиада 2008 года в Пекине, привело его в го. «Я подумал: “Что ж, раз мы едем в Китай, можно заодно и в соревнованиях по го поучаствовать”», – сказал он мне. Его программа Leela заняла достойное третье место.
Однако через несколько лет ситуация в этой области радикально переменилась. «Как и все, я услышал новости о том, что компания DeepMind разработала новую программу го, которая была значительно мощнее всех, что создавались ранее, а также сильнее любого человека, – сказал Паскутто. – Конечно, это было любопытно».
Когда эти новости только появились, технические подробности в пресс-релизах DeepMind освещались скупо. Позднее DeepMind раскрыла информацию о том, что в их разработке помимо стандартных процессоров, которые можно встретить в обычных компьютерах, использовалось такое аппаратное решение, как тензорные процессоры – специализированные чипы Google, предназначенные специально для машинного обучения[29]
. DeepMind включила 5000 таких чипов в свой игровой компьютер. Паскутто сел и подсчитал: выходило, что ему со своим персональным компьютером потребуется 1700 лет для воспроизведения исследований DeepMind. Требовалась помощь.«Я подумал, что подавляющую часть этих вычислений, ту, что выполнялась специализированными чипами, можно запросто распределить, – сказал Паскутто. – Так родилась идея найти в интернете достаточное количество заинтересованных людей и попробовать сообща воспроизвести результаты».
По аналогии с прошлыми знаменитыми проектами SETI@home (проект Калифорнийского университета в Беркли по поиску внеземной жизни) и Folding@home (проект Стэнфордского университета по изучению укладки белка) Паскутто прибег к возможностям интернета, чтобы решить немыслимо сложную задачу. Он обратился к заинтересованным добровольцам с просьбой предоставить личные компьютерные ресурсы, то есть свободное время на их машинах, чтобы всем вместе осилить гигантский объем работы. Затея стартовала в ноябре 2017 года. Меньше чем за год программа стала «очень, очень мощной». Leela Zero, являющаяся ныне одной из лучших программ для игры в го в мире, находится в свободном доступе и имеет открытый код.
«Я просил всех этих людей предоставить в мое распоряжение свои компьютеры, и теперь они получили достойную компенсацию», – сказал Паскутто. И хотя он фактически выпустил сверхъестественного игрока DeepMind из его корпоративной клетки, по его словам, это произошло без какого-либо взаимодействия с самой DeepMind и с Google[30]
. В совокупности поиск по дереву методом Монте-Карло, разработанный Реми Куломом, AlphaGo и Leela Zero произвели революцию в древней игре.Я спросил Мартина Мюллера, использовал ли кто-нибудь из профессионалов до появления AlphaGo и Leela Zero компьютеры для тренировок, как это десятки лет делали шахматисты.