И снова программисты DeepMind захотели бросить вызов сильнейшему игроку, чтобы посмотреть, насколько их программа совершенна. Выбор пал на игрока из Китая, необыкновенно одаренного Кэ Цзе, первого в мире; игру запланировали провести в рамках саммита «Будущее го» в китайском Вучжене — именно в Китае три тысячи лет тому назад зародилась го. Кэ Цзе было всего девятнадцать, и он хвастался побольше, чем Ли Седоль. Он взлетел на вершину славы и оттуда обрушился на Седоля с критикой за его проигрыш AlphaGo
, сказав, что на момент поединка с компьютером Ли уже был в не самой лучшей форме. Кэ был уверен в своих силах, бравировал тем, что докажет превосходство китайской го и восстановит гегемонию человечества.Master
разбил Кэ Цзе в пух и прах, одержав победу во всех трех играх.На финальной пресс-конференции юноша плакал, сняв очки в толстой оправе, утирал слезы и всем своим видом показывал, какая беспомощность охватила его во время игры; он сказал, что с самого начала поединка с Master
у него появилось новое и глубоко тревожное чувство. Его спросили, чем Master отличается от AlphaGo, и он, сам того не желая, заговорил о компьютерах так, словно они живые существа: «Master — бог го. Бог, способный сокрушить любого, кто бросит ему вызов. Я никогда не сомневался в себе. Всегда чувствовал, что у меня всё под контролем. Думал, что хорошо понимаю композицию и глубоко чувствую поле. Но Master смотрит на всё это и говорит, мол, что за чепуха? Он видит всю вселенную го, а я — только крохотный островок вокруг себя. Пожалуйста, пусть он изучает вселенную, а я останусь играть у себя на заднем дворе. Буду рыбачить у себя на прудике. Каких еще высот он достигнет через самообучение? Трудно сказать наперед, есть у него пределы вообще или нет. По-моему, будущее принадлежит искусственному интеллекту».Победив и Ли Седоля, и Кэ Цзе, Демис Хассабис и команда DeepMind покорили все мыслимые вершины, больше им было нечего доказывать в игре против людей. Хотя Хассабис и добился победы искусственного интеллекта над человеком, но последний вопрос Кэ Цзе — «Каких еще высот он достигнет через самообучение?
» — не давал ему покоя. Да, DeepMind подчинили себе игру, которую когда-то считали доступной только человеку, вершиной человеческой интуиции и творчества, непостижимой для компьютера. Но как далеко может зайти их самообучающийся алгоритм?Хассабис и программисты DeepMind пошли на крайние меры: они очистили Master
, следующее поколение AlphaGo, от человеческого знания, убрали миллионы игр, на основании которых программа училась изначально, краеугольный камень ее здравого смысла, уникальной способности оценивать каждую позицию на доске, вычислять шансы на победу и видеть поле, как увидел бы его человек. Остался только голый скелет. Они хотели создать более мощный и универсальный искусственный интеллект, не ограниченный в своих способностях к обучению одной лишь го; к тому же он не будет опираться на человеческое понимание и знания, как на костыль, когда начнет делать свои первые шаги в обучении. Они взяли свой алгоритм и начисто стерли все человеческие данные, которые он мог бы использовать для обучения, разорвали его единственную прямую связь со всем человеческим.Результат поразил всех.
Со счетом сто — ноль новая программа победила ту версию AlphaGo
, которая вынудила Ли Седоля уйти из го. Дальше — больше. Тот же алгоритм использовали для игры в шахматы, и он оказался одинаково сильным — за два часа он сыграл сам с собой больше партий, чем записано за всю историю игры; за четыре научился играть лучше любого человека; за восемь сумел победить искусственный интеллект Stockfish, действующего чемпиона по шахматам. «Он играет как человек в ударе», — заметил гроссмейстер из Англии Мэттью Садлер, впервые сразившись с новой программой. Садлер описывал ее стиль игры как крайне агрессивный, чем-то похожий на стиль гениального Гарри Каспарова, что позднее подтвердил и сам российский гроссмейстер. Покорив шахматы, система взялась за похожую японскую игру — сёги. Она отличается большей сложностью, фигуры не фиксированы и могут играть то за одного соперника, то за другого, создавая множество вариаций, чего никогда не бывает в шахматах. Новый алгоритм разобрался в сёги менее чем за двенадцать часов и победил сильнейшую программу Elmo в девяноста процентах игр.Ни в одной из этих игр алгоритм не использовал человеческий опыт. Ему задавали правила, и он играл сам с собой — сначала делал ходы наугад, а потом, в считаные мгновения, превратился в непобедимого соперника. Сегодня это сильнейший в мире игрок в го, шахматы и сёги.
Его имя — AlphaZero
.