Мы с коллегами разрабатываем программу
Рис. 48. Четыре очевидных примера ситуации “прогулка с собакой”
Рис. 49. Четыре нестандартных примера ситуации “прогулка с собакой”
“Мы еще очень, очень далеко”
Текущая эпоха искусственного интеллекта определяется господством глубокого обучения с триумвиратом глубоких нейронных сетей, больших данных и сверхбыстрых компьютеров. Тем не менее в стремлении к созданию надежного и общего интеллекта глубокое обучение, возможно, натыкается на стену: имеющий первостепенную важность “барьер понимания”. В настоящей главе я кратко описала некоторые разработки, направленные на преодоление этого барьера. Я рассказала, как исследователи (включая и меня) пытаются наделить компьютеры здравым смыслом и человеческими способностями к построению абстракций и аналогий.
Размышляя на эту тему, я особенно оценила любопытный и информативный пост в блоге Андрея Карпатого, специалиста по глубокому обучению и компьютерному зрению, который руководит развитием ИИ в
Карпатый перечисляет множество вещей, которые понимают люди, но которые не под силу понять лучшим современным программам компьютерного зрения. Например, мы понимаем, что на снимке есть люди, а еще есть зеркала, поэтому некоторые человеческие фигуры – это зеркальные отражения. Мы понимаем, что действие происходит в раздевалке, и нас удивляет, что в раздевалке собралась целая группа людей в костюмах.
Кроме того, мы понимаем, что человек стоит на весах, хотя весы составлены из белых пикселей, которые сливаются с фоном. Мы понимаем, как отмечает Карпатый, что “Обама слегка надавливает ногой на весы”, и без труда описываем ситуацию в трехмерном пространстве, которое достраиваем сами, а не в двумерном пространстве фотографии. Интуитивное знание физики позволяет нам сделать вывод, что из-за ноги Обамы весы переоценят вес стоящего на них человека. Интуитивное знание психологии говорит нам, что человек на весах не знает, что Обама также поставил на них ногу: мы делаем такой вывод, замечая направление его взгляда и зная, что у него нет глаз на затылке. Мы также понимаем, что человек, вероятно, не чувствует, как Обама легонько надавил на весы. Наша теория психики позволяет нам предположить, что человек на весах не обрадуется, когда весы покажут ему больший вес, чем он ожидал.
Рис. 50. Фотография, обсуждаемая в блоге Андрея Карпатого
Наконец, мы понимаем, что Обама и другие люди, наблюдающие за происходящим, улыбаются, и делаем вывод, что всем понравилась шутка, которая, возможно, стала еще смешнее из-за статуса президента. Мы также понимаем, что все смеются по-доброму и ожидают, что мужчина на весах тоже рассмеется, когда узнает о шутке. “Вы делаете выводы о настроении людей и их представлении о настроении другого человека, – отмечает Карпатый. – И выходите на пугающий метауровень”.
В общем, “поразительно, что все вышеперечисленные выводы [люди] делают, просто взглянув на двумерную конфигурацию [пиксельных] значений”.