С точки зрения Роберти, нарды напоминали финансовую деятельность. Он объяснил мне это так, как объясняет своим ученикам: «У вас есть позиция. У вас есть активы и пассивы. По сути, вы стараетесь увеличить свои активы и сократить имеющиеся пассивы в той степени, в какой вам позволяют выпавшие очки». По его словам, после каждого броска костей игрок должен оценивать свои потенциальные ходы и задаваться вопросом: «Так, что дает такая игра? Появляются ли у меня новые активы? Избавляюсь ли я от старых пассивов? Улучшается ли баланс моих фишек в концептуальном плане?»
Благодаря тренировкам и новому мировоззрению Роберти вскоре начал делать деньги в городских клубах. После семи лет работы и бессчетных бросков костей он победил на первом в своей жизни чемпионате мира. Это было в Монте-Карло в 1983 году. «В течение всего [финального] матча я добивался самых сложных позиций, какие только были возможны», – вспоминал Роберти. Через несколько лет после этого ему позвонил Джеральд Тезауро.
В октябре 1991 года Роберти прибыл в кабинет Тезауро на тот самый матч, включавший 31 партию. Они играли почти весь день, и Роберти тщательно конспектировал поединок. TD-Gammon захватила лидерство со старта, победив в первых двух партиях. Роберти ответил победами в шести партиях подряд. Состязание пошло.
Поворотный момент в матче наступил в 16-й партии. На этом этапе у Роберти было преимущество в 15 очков. После того как на начальной стадии поединка тьма фишек была выбита и снова возвращена на доску, игра приняла характер нападения против защиты. TD-Gammon удерживала большой отрыв в гонке, а Роберти выстроил баррикаду в секторе своего дома на доске. На 10-м ходу машина удвоила ставку, и Роберти принял удвоение. Игра все больше обострялась. Баррикада Роберти стала уже почти идеальной, однако TD-Gammon запирала три его фишки, находившиеся далеко от дома, и их нужно было высвободить. На 23-м ходу Роберти, уверенный в надежности своей защиты, повысил ставку вдвое еще раз, то есть учетверил ее. TD-Gammon приняла вызов. «Компьютеры не пугаются», – отметил Роберти в своих заметках. После еще четырех бросков костей в позиции, приведенной ниже, компьютер на своем ходу
«Опасно, но у меня много возможностей победить прямо на следующем броске», – записал Роберти. Если компьютер не сможет вывести из-под угрозы свою фишку, находящуюся на 18-м пункте, Роберти получит множество бросков, которые выбивают ее. А поскольку домашняя зона Роберти полностью защищена, эта фишка не сможет вернуться на доску, компьютер на какое-то время увязнет и почти наверняка проиграет. Роберти принял удвоение. Современные программы говорят, что это был правильный ход, и дают Роберти сорокапроцентную вероятность выигрыша. В итоге нечто вроде этого и произошло. Благодаря нехарактерной ошибке в вычислениях компьютер не смог сбросить свои фишки целыми и невредимыми, попал под удар и увяз. В создавшейся ситуации Роберти еще раз удвоил ставку – до
После 31 сыгранной партии Роберти опережал машину на 19 очков – в среднем 0,6 очка на партию. В своих заметках он записал: «В конечном счете мне повезло». И заключил, что выигрывай он со счетом около 0,2 очка на партию, это «сделало бы TD-Gammon сильнейшей среди всех программ игры в нарды».
«Она была неплохой, – сказал мне Роберти недавно. – Не такой сильной, как лучшие игроки, но ходы делала адекватные. Она ни разу не допустила глупости. Это, в общем-то, впечатляло». На следующий год он играл с ней снова. Программа была значительно усовершенствована и теперь называлась TD-Gammon 2.0. «Эта штука играла в нарды на мировом уровне, – говорил Роберти. – Я добился ничьей, но мне, можно сказать, повезло. Она играла очень хорошо. Я взял домой распечатку матча и, если честно, поменял кое-что в своей игре, особенно в дебюте, с тем чтобы она больше соответствовала тому, что делала TD-Gammon».