Математики и специалисты в области вычислительной техники уже приступили к разработке алгоритмов, которые позволят машинам усваивать подобную иерархию правил, метаправил и метаметаправил. В этих иерархических алгоритмах каждый эпизод обучения ограничивает не только параметры низкого уровня, но и знания самого высокого уровня, абстрактные гиперпараметры, которые, в свою очередь, управляют последующим обучением. Хотя таким системам еще далеко до экстраординарной эффективности, присущей человеческому мозгу при овладении речью, они показывают неплохие результаты. Например, на цветной иллюстрации 4 представлен новейший алгоритм, который, подобно искусственному ученому, ищет лучшую модель внешнего мира33
. Данная система обладает набором абстрактных примитивов, а также грамматикой, позволяющей генерировать бесконечное число структур более высокого уровня посредством рекомбинации этих элементарных правил. Например, она может определить линейную цепочку как последовательность тесно связанных точек, описываемую правилом «с каждой точкой соседствуют две другие точки – одна слева, другая справа», и совершенно самостоятельно обнаружить, что такая цепочка является наилучшим способом представления множества целых чисел (от нуля до бесконечности) или политических взглядов (от ультралевых до ультраправых). Вариант той же грамматики дает двоичное дерево, где каждый узел имеет одного родителя и двух потомков. Такая древовидная структура выбирается автоматически, когда систему просят представить живые существа; машина, подобно искусственному Дарвину, заново открывает древо жизни!Другие комбинации правил порождают плоскости, цилиндры и сферы, и алгоритм определяет, как такие структуры приближенно выражают географию нашей планеты. Более сложные версии того же алгоритма могут выразить еще более абстрактные идеи. Например, американские специалисты в сфере вычислительной техники Ной Гудман и Джош Тененбаум разработали систему, способную открыть принцип причинности34
, согласно которому одни события вызывают другие. Его формулировка носит весьма абстрактный и математический характер: «В направленном ациклическом графе, связывающем различные переменные, существует подмножество переменных, от которых зависят все остальные». Хотя это определение почти невозможно понять, оно прекрасно иллюстрирует тип абстрактных внутренних формул, которые эта ментальная грамматика способна выразить и проверить. Система тестирует тысячи таких формул, но сохраняет только те из них, которые согласуются с входящими данными. В результате она быстро выводит принцип причинности (если, конечно, некоторые из получаемых ею сенсорных сигналов являются причинами, а другие – следствиями). Это еще одно доказательство в пользу дара абстракции: принятие такой высокоуровневой гипотезы значительно ускоряет процесс обучения, ибо радикально сужает объем правдоподобных гипотез, среди которых осуществляется поиск. Вот почему из поколения в поколение дети неустанно спрашивают «почему?» и ищут объяснений, тем самым подпитывая бесконечную погоню нашего вида за научными знаниями.Согласно данной точке зрения, научение состоит в анализе обширного набора утверждений, выраженных на языке мышления, и выборе того, которое наилучшим образом согласуется с данными. Как мы увидим далее, эта модель отлично описывает все, что происходит в мозге любого ребенка. Подобно начинающим ученым, дети формулируют теории и сравнивают их с внешним миром. Отсюда следует, что ментальные представления детей гораздо более структурированы, нежели представления современных искусственных нейросетей. С самого рождения мозг ребенка уже должен обладать двумя ключевыми составляющими: всеми механизмами, позволяющими генерировать множество абстрактных формул (комбинаторным языком мышления), и способностью выбирать из этих формул наиболее правдоподобные.
Таково наше новое видение мозга35
: мозг – это огромная генеративная модель, в значительной степени структурированная и способная формулировать бесчисленное множество гипотетических правил и структур, но постепенно ограничивающаяся теми, которые максимально точно описывают реальность.Учиться – значит рассуждать как ученый
Как мозг выбирает наиболее подходящую гипотезу? По каким критериям он принимает или отвергает модель внешнего мира? Оказывается, для этого существует идеальная стратегия. Она лежит в основе одной из самых современных и продуктивных теорий научения – гипотезы о том, что мозг ведет себя как ученый. Согласно данной теории, учиться – значит рассуждать как хороший специалист по статистике, выбирающий из нескольких альтернативных теорий ту, у которой больше всего шансов оказаться верной. А какая теория вероятнее станет таковой? Разумеется, та, которая наилучшим образом объясняет имеющиеся данные.