— Другой пример, когда машина способна действовать лучше человека, — это распознавание письменного текста. Есть такая российская международная компания ParaScript, она, в частности, занимается распознаванием рукописного текса. Ее софт присутствует сегодня почти в любом приборе, которым мы пользуемся. Лет десять назад ParaScript получила задачку распознавать текст на конвертах для американской почты. У почты США тогда были гектары сортировочных бараков, где сидели тетеньки, читали конверты и раскладывали их по адресам. Ребята из ParaScript пришли и сказали: давайте мы вам это безобразие ликвидируем — 10 процентов экономии нам. И с 2002 по 2007 год они оптимизировали американскую почту, получали огромные деньги. Потом, правда, деньги им платить почти перестали, так как нечего стало экономить. Машина стала распознавать рукописный текст лучше, чем человек. Сейчас это направление шагнуло еще дальше. Появились технологии распознавания музыки, голоса, предметов на экране камеры. Машина уже способна отличить, например, котенка от шарика. А это уже шаг в сторону роботов-навигаторов, благодаря которым машины даже без водителя будут понимать, куда ехать.
— «Яндекс» умеет работать с большими объемами данных. И это наше базовое умение, наш ежедневный хлеб. Я просто привел примеры того, как машины учатся на больших объемах данных и в конце концов делают что-то лучше людей. Дело идет к тому, что на этом направлении случится примерно такая же революция, как в эпоху индустриализации, когда машины стали заменять человеческую физическую силу. Экскаватор копает быстрее, чем человек лопатой, а мы лопатой копаем быстрее, чем руками, — это нормально. Лифт нас поднимает на двадцатый этаж, мы к этому привыкли, нам не кажется, что машины нас поработили. То же самое сейчас начинается в области замены человеческой головы. Машины будут лучше нас переводить, распознавать и делать еще много чего.
— По всей видимости, да. Потому что именно поисковые технологии сидят сегодня на больших объемах данных и умеют с ними работать.
— Это почти не является преувеличением. Большие массивы информации в совокупности с технологиями их обработки — это огромный возобновляемый ресурс.
— Во всяком случае, для этого у нас сейчас есть все возможности. Поиск оказался на переднем крае всего машинного обучения. А машинное обучение открывает огромные возможности для развития национальных экономик. Похоже, что картинки из фантастических фильмов, когда приборы с тобой разговаривают и тебя понимают, скоро станут явью. Мы спокойно будем относиться к тому, что за нас думают и угадывают наши желания. Это огромная индустрия.
— Во всяком случае, в эту сторону мы сейчас активно копаем. Мы ищем сферы применения своей технологии обработки данных. И видим, что это огромные непаханые поля. Когда-то человечество научилось экономить на замене ручного труда, и случилась промышленная революция. Теперь мы почти научились экономить на замене труда умственного. Что-то огромное из этого обязательно вырастет.