Приведу два реальных примера. В марте 2016 года на северо-востоке США прогнозировали сильную метель, и в
Компании, развивающие технологию беспилотного вождения, прекрасно осведомлены о проблеме длинного хвоста: их сотрудники обсуждают возможные “хвостовые” сценарии и активно разрабатывают дополнительные обучающие примеры, а также особым образом запрограммированные стратегии поведения во всех маловероятных ситуациях, которые приходят им в голову. Тем не менее невозможно обучить или запрограммировать систему на верное поведение абсолютно в любой возможной ситуации.
Обычно для решения этой проблемы системам ИИ предлагается использовать обучение с учителем на небольших объемах размеченных данных, а все остальное узнавать, применяя обучение без учителя. Термином “обучение без учителя” обозначается большая группа методов, которые позволяют системе узнавать категории и действия, не имея размеченных данных. К таким методам относятся кластеризация изображений на основе сходства или обнаружение новой категории по аналогии с известными. Как я опишу в одной из последующих глав, люди великолепно справляются с выявлением абстрактных сходств и аналогий, но пока не существует достаточно успешных ИИ-методов для такого обучения без учителя. Даже Ян Лекун признает, что “обучение без учителя остается темной материей ИИ”. Иными словами, для создания общего ИИ почти все обучение должно проходить без учителя, но пока никто не предложил эффективных алгоритмов для осуществления обучения без учителя.
Люди совершают ошибки постоянно, даже (или особенно) при вождении, и любой из нас мог столкнуться с городским автобусом, объезжая мешки с песком. Но люди при этом обладают важнейшей способностью, которой не хватает современным системам ИИ: они умеют пользоваться здравым смыслом. Мы обладаем огромными фоновыми знаниями о мире – физическом и социальном. Мы хорошо представляем, как обычно ведут себя объекты – живые и неживые, – и активно пользуемся этими знаниями, решая, как действовать в конкретной ситуации. Мы можем понять, почему на дороге рассыпана соль, даже если ни разу в жизни не ездили в снегопад. Мы понимаем, как взаимодействовать с другими людьми, а потому можем пользоваться зрительным контактом, жестами и языком тела, если светофоры перестают работать после отказа электроснабжения. Обычно мы уступаем дорогу большому городскому автобусу, даже если по правилам имеем преимущество. Я использовала примеры из дорожного движения, но мы, люди, пользуемся здравым смыслом – обычно бессознательно – на каждом шагу. Многие полагают, что пока системы ИИ не обретут здравый смысл, доступный людям, мы не сможем позволить им полную автономность в сложных реальных ситуациях.
Чему научилась моя сеть?
Несколько лет назад Уилл Ландекер, который тогда был аспирантом в моей исследовательской группе, обучил нейронную сеть классифицировать фотографии по двум категориям: “содержит животное” и “не содержит животное”. Сеть обучалась на фотографиях, подобных изображенным на рис. 15, и очень хорошо справлялась с задачей при классификации тестового набора. Но чему она научилась на самом деле? Тщательно изучив ее, Уилл пришел к неожиданному выводу: сеть научилась отправлять изображения с размытым фоном в категорию “содержит животное”, даже если животного на изображении не было[139]. Фотографии природы в тренировочном и тестовом множествах подчинялись важному правилу фотографии: объект должен быть в фокусе. Когда объектом фотографии выступает животное, оно оказывается в фокусе, а фон размывается, как на рис. 15 A. Когда объектом фотографии выступает
Рис. 15. Иллюстрация к задаче на классификацию по категориям “есть животное” и “нет животного”. Обратите внимание на размытый фон на левом изображении