Сразу возникает препятствие: набор из двенадцати тренировочных примеров до смешного мал для обучения сверточной нейронной сети, которой, возможно, не хватит и двенадцати сотен. Само собой, отчасти именно это Бонгард и показал на примере задач: мы, люди, без труда определяем искомые понятия, имея всего двенадцать примеров. Какой объем тренировочных данных необходим СНС, чтобы она научилась решать задачу Бонгарда? Хотя никто пока не проводил систематического исследования решения задач Бонгарда с помощью сверточных нейронных сетей, одна группа исследователей проанализировала работу современных СНС с задачей на выявление “одинаковых и разных” форм, используя изображения наподобие приведенного на рис. 47[350]. В класс 1 вошли изображения с двумя фигурами одинаковой формы, а в класс 2 – изображения с двумя фигурами разных форм. Для тренировки сети исследователи использовали не 12, а по 20 000 примеров для класса 1 (“одинаковые”) и класса 2 (“разные”). После тренировки каждая сверточная нейронная сеть тестировалась на 10 000 новых примеров. Все примеры генерировались автоматически с использованием множества разных форм. Обученные СНС справлялись с задачей лишь немногим лучше, чем при случайном угадывании, в то время как доля верных ответов у людей, протестированных авторами, стремилась к 100 %. Иными словами, современные сверточные нейронные сети прекрасно справляются с выявлением признаков, необходимых для распознавания объектов ImageNet и выбора ходов в го, но не обладают способностью к построению абстракций и аналогий, необходимой даже для решения идеализированных задач Бонгарда, не говоря уже о задачах реального мира. Похоже, тех типов признаков, которые могут усвоить эти сети, недостаточно для построения таких абстракций, на каком бы количестве примеров ни проходило обучение сети. Этот недостаток свойственен не только сверточным нейронным сетям: ни одна из существующих систем ИИ не обладает никаким подобием этих фундаментальных способностей человека.
Активные символы и построение аналогий
Прочитав книгу “Гёдель, Эшер, Бах” и решив заняться исследованиями ИИ, я связалась с Дугласом Хофштадтером, надеясь, что смогу работать над чем-то вроде задач Бонгарда. К счастью, он поддался на мои уговоры и позволил мне присоединиться к его исследовательской группе. Хофштадтер объяснил, что его группа создает компьютерные программы, ориентируясь на то, как люди понимают ситуации и проводят аналогии между ними. Защитив диссертацию по физике (дисциплине, где идеализация – например, пренебрежение силой трения при движении – служит основной движущей силой), Хофштадтер был уверен, что лучше всего изучать феномен (здесь – построение аналогий человеком) в идеализированной форме. В исследованиях ИИ часто используются так называемые микромиры – идеализированные области вроде задач Бонгарда, в которых исследователь может развивать свои идеи, прежде чем тестировать их в более сложных областях. Для своего исследования об аналогиях Хофштадтер создал микромир, который был идеализирован еще сильнее, чем задачи Бонгарда: задачи на аналогию с алфавитными последовательностями. Вот пример:
Задача 1. Допустим, последовательность букв abc меняется на abd. Как изменить последовательность pqrs “аналогичным образом”?
Большинство людей дает ответ pqrt, выводя примерно такое правило: “Крайняя правая буква заменяется на следующую за ней букву алфавита”. Само собой, можно вывести и другие правила, и тогда ответ будет другим. Вот несколько альтернатив:
pqrd: “Крайняя правая буква меняется на d”.
pqrs: “Все c меняются на d. В pqrs нет c, поэтому ничего не меняется”.
abd: “Любая последовательность меняется на последовательность abd”.
Может показаться, что в альтернативных ответах задача трактуется чересчур буквально, но нет никакого строго логического аргумента, который говорил бы, что эти ответы неверны. Более того, можно вывести бесконечное число других правил. Почему большинство людей считает, что один из ответов (prqt) лучше всех остальных? Похоже, наши ментальные механизмы абстрагирования – которые развивались, чтобы обеспечивать нам выживание и воспроизводство в реальном мире, – работают и в этом идеализированном микромире.
Вот другой пример:
Задача 2. Допустим, последовательность abc меняется на abd. Как изменить последовательность ppqqrrss “аналогичным образом”?