Мне кажется крайне маловероятным, что машины вообще когда-либо достигнут человеческого уровня в области перевода, понимания прочитанного и подобных задач, если будут учиться исключительно на онлайн-данных, не обладая пониманием обрабатываемого языка. Язык опирается на понимание мира на уровне здравого смысла. Гамбургеры с кровью не должны хрустеть. Чересчур широкий стол не проходит в дверной проем. Если вылить всю воду из кувшина, то кувшин опустеет. Язык также опирается на здравый смысл людей, с которыми мы взаимодействуем. Человек, который заказывает гамбургер с кровью, а получает пережаренный, не будет доволен. Если человек говорит, что фильм “на его вкус немного мрачноват”, значит, фильм ему не понравился. Хотя машинная обработка естественного языка прошла большой путь, я не верю, что машины смогут в полной мере понимать человеческий язык, пока у них не будет такого же, как у людей, здравого смысла. При этом системы обработки естественного языка все глубже проникают в нашу жизнь – транскрибируют речь, анализируют тональность текстов, переводят документы и отвечают на наши вопросы. Можно ли сказать, что недостаток человеческого понимания мира приводит к хрупкости, ненадежности и уязвимости этих сложных систем? Ответа на этот вопрос не знает никто, и нам стоит об этом задуматься.
В последних главах книги я разберу, что люди понимают под “здравым смыслом”, и перечислю психические механизмы, которые люди задействуют для понимания мира. Я также опишу несколько попыток исследователей ИИ наделить машины таким пониманием и здравым смыслом и расскажу, насколько эти методы приблизили появление систем ИИ, способных преодолеть “барьер понимания”.
Глава 14
О понимании
“Интересно, сможет ли ИИ преодолеть барьер понимания и когда это произойдет?”[314] Размышляя о будущем ИИ, я снова и снова возвращаюсь к этому вопросу, заданному математиком и философом Джан-Карло Ротой. Выражение “барьер понимания” точно описывает идею, которая легла в основу этой книги: люди обладают глубоким и сущностным
В настоящей главе я кратко опишу, как ученые – психологи, философы и исследователи ИИ – сегодня представляют себе человеческое понимание. В следующей главе я расскажу о ярких попытках внедрить компоненты человеческого понимания в системы ИИ.
Компоненты понимания
Представьте, что вы ведете машину по многолюдной улице города. На светофоре впереди горит зеленый сигнал, и вы собираетесь повернуть направо. Вы смотрите вперед и видите ситуацию, показанную на рис. 44. Какие когнитивные способности нужны вам, человеку за рулем автомобиля, чтобы понять такую ситуацию?[315]
Начнем с начала. Люди обладают ценным запасом изначальных знаний – примитивным здравым смыслом, который мы получаем при рождении или усваиваем на ранних этапах жизни[316]. Так, даже малышам известно, что мир состоит из объектов, что составные части объектов обычно двигаются вместе и что, если фрагменты объектов скрыты из виду (например, как ноги мужчины, который переходит дорогу позади коляски на рис. 44), они остаются частью этих объектов. Это жизненно необходимые знания! Но нельзя сказать наверняка, что, скажем, сверточная нейронная сеть сможет усвоить эти факты, даже имея в своем распоряжении огромный набор фотографий и видео.
Рис. 44. Ситуация, с которой вы можете столкнуться, когда ведете машину
В раннем детстве мы, люди, многое узнаем о поведении объектов в мире. Во взрослом возрасте мы воспринимаем эти знания как должное и даже не сознаем, что они у нас есть. Если толкнуть объект, он подвинется, если он при этом не слишком тяжел и не заблокирован другим объектом; если уронить объект, он упадет и остановится, отскочит или разобьется при столкновении с землей; если поместить маленький объект позади большого, маленький объект окажется скрыт; если поместить объект на стол и отвернуться, а затем повернуться обратно, объект по-прежнему будет на столе, если только кто-нибудь его не уберет или он не умеет двигаться сам. Этот список можно продолжать бесконечно. Главное, что младенцы постепенно постигают причинно-следственную структуру мира: например, они начинают понимать, что, когда кто-то толкает объект (например, коляску с рис. 44), объект движется не случайно, а