Классическим примером того, что хорошо умеет делать нейросеть, является распознавание цифр, написанных вручную. Эта задача актуальна, например, для почтовых отделений, где нужно быстро и точно маршрутизировать письма с использованием почтовых индексов. Каждая из рукописных цифр – 2 с плавными обводами, 4 с косой линией, 7 с перечеркиванием – поступает в компьютер в виде цифрового изображения. Поступившие во входной слой данные изображений просеиваются через многочисленные соединения и вычисления в скрытых слоях и в итоге попадают в выходной слой из 10 нейронов, каждый из которых соответствует определенной цифре. Чтобы считать рукописную 5 и выдать 5, машина должна научиться распознавать паттерны. Вначале программа почти ничего не может и предсказывает цифры не лучше, чем если бы делала это наугад. Однако она обучается и совершенствуется посредством так называемого алгоритма обратного распространения ошибки. Всякий раз, когда срабатывают сетевые синапсы, проводя числа через различные слои, и компьютер выдает
Она может делать практически то же самое, если ее задачей будет игра в шашки и кости. Такая нейронная сеть, как TD-Gammon, берет позицию в нардах, выполняет расчеты в скрытых слоях и включает «нейрон» на выходе, представляющий собой, как можно надеяться, оптимальный ход. Такие системы могут работать с биометрией, иностранными языками и городским ландшафтом: в наши дни нейросети являются «мозгом», стоящим за распознаванием лиц, машинным переводом, фильтрацией спама в электронной почте, беспилотными автомобилями и значительной частью того, что мы называем искусственным интеллектом. В подходе Тезауро к нардам явно имелся потенциал для универсального использования, который отсутствовал в более ранних исследованиях, посвященных шашкам и шахматам.
Тезауро стал публиковать результаты работы своей нейросети для нардов в научных журналах. В 1994 году он сообщал, что TD-Gammon стала играть на уровне мастера и что вместо создания бота, играющего все лучше, стоит пойти дальше. «Другие области применения могут включать стратегии торговли на финансовых рынках, стратегии боевых действий, а также такие управленческие задачи, как управление движением роботов, навигация и разработка траекторий движения», – писал он в журнале
В соответствии с корпоративной политикой IBM Тезауро не опубликовал свою программу нардов и ее исходный код. Он, однако, был готов раздавать записи партий, которые она сыграла. Кит Вулси, игрок мирового уровня как в нардах, так и бридже, нанес ему визит. Тезауро дал ему «большую пачку» записей партий, которые TD-Gammon сыграла сама с собой. «Он изучил все ходы до единого и, просто глядя на то, что делала программа, смог освоить новый подход к игре в нарды, который был лучше, чем все, что люди делали раньше», – сказал Тезауро.