То, как алгоритм производит ранжирование, позволяет ему учиться на собственных ошибках по восходящей схеме и уточнять свои параметры – как бы подкручивать регуляторы настройки своих функций. Тонкость заключается в том, чтобы определить такие оптимальные положения регуляторов, которые позволяют найти правильный ответ в максимальном количестве разных контекстов. Представьте себе вопрос: «С какой страной у Чили самая протяженная сухопутная граница?» Границы с Чили есть у двух стран – Аргентины и Боливии. Как бы вы ранжировали эти два потенциальных ответа? Можно решить присвоить более высокий рейтинг тому варианту, который чаще упоминается. В этом случае более высоко будет оценена Боливия, потому что между Чили и Боливией возникало много споров о границах и о них сообщалось в новостях. Но если рассмотреть материалы, больше связанные с географией, и подсчитать упоминания каждой из этих стран в таких документах, то более высокий рейтинг окажется у Аргентины, что на самом деле и соответствует правильному ответу.
Когда Дженнингсу объяснили, как работает Watson, он был чрезвычайно поражен. «Оказалось, что методика, которую компьютер применяет для расшифровки заданий Jeopardy! в точности совпадает с моей», – сказал он. Дженнингс выделяет в задании ключевые слова, а потом выискивает в своей памяти (Watson имел в своем распоряжении 15-терабайтную базу данных человеческих знаний) кластеры ассоциаций с этими словами. Затем он тщательно рассматривает главных претендентов на роль правильного ответа в свете всей контекстуальной информации, какую только может собрать: содержащиеся в задании намеки на время, место, пол, тематическую область – например, спорт, литературу или политику. «У человека, играющего в Jeopardy! все это происходит мгновенно и интуитивно, но я уверен, что за кадром мой мозг делает более или менее то же самое».
Зачем IBM понадобилось проделывать всю эту работу? Победы в играх могут показаться целью довольно бессмысленной, но для компаний, подобных IBM и DeepMind, они служат очень ясным показателем успеха. В игре можно либо выиграть, либо проиграть. Тут не может быть никакой неоднозначности. Игры служат великолепной рекламой для компании, стремящейся продавать свою продукцию, потому что все обожают напряжение поединка между человеком и машиной. Это своего рода подиум для алгоритмов, на котором компания может похвастаться своими алгоритмическими талантами.
Алгоритм Watson компании IBM уже изменил наши представления о том, на что способны компьютеры: он победил лучших игроков в Jeopardy! а теперь используется для постановки медицинских диагнозов. Что отличает Watson? Что в нем особенного? Большое преимущество Watson состоит в способности разбираться в неструктурированных данных. Мы обучаем этому алгоритм. Кроме того, просто беспорядочно загружая в Watson текст, люди на самом деле формируют систему, которая может понять, что в этом тексте важнее и достовернее всего. Перед выступлением в Jeopardy! Watson загрузил в себя все содержимое Википедии и сохранил эти данные на своих носителях. Люди могут сказать алгоритму, что один источник информации достовернее другого. Такой переход от жесткого планирования к обучению – одна из причин, по которым IBM называет эту деятельность когнитивной информатикой[106]
.В будущем мы будем меньше полагаться на механические вычисления и больше – на взаимодействие и обучение. Система достаточно умна, чтобы понимать, что небольшое количество дополнительной информации может позволить ей отбросить один из ответов или повысить уверенность в одном из тех ответов, которые она уже предлагает. Когда Watson в одном из своих нынешних приложений сталкивается с трудным вопросом, он выдает набор возможных ответов – но также может и задавать уточняющие вопросы. Системы вопросов и ответов по большей части запрограммированы на работу с вопросами определенных типов – получить от них ответ можно только в том случае, когда им задают вопросы определенного рода, сформулированные определенным образом. Watson работает с произвольными вопросами по общей эрудиции, то есть о чем угодно. Используя технологии обработки естественного языка, он разбирает введенные в него слова, чтобы понять, о чем на самом деле задан вопрос, даже если он был задан в необычной форме.
Компания IBM даже опубликовала очень полезные «Вопросы и ответы» об алгоритме Watson и своем проекте DeepQA, основной технологии, которую Watson использует для выработки гипотез. Все это больше всего напоминает компьютер из «Звездного пути». Эту вымышленную компьютерную систему можно считать интерактивным диалоговым агентом, способным отвечать на вопросы и выдавать точную информацию по любой теме.