К середине 1980-х подобные проблемы, чего и следовало ожидать, привели к наступлению «зимы искусственного интеллекта». В обществе укоренилось мнение, что ИИ идет в никуда. Но Гудман убежден, что в глубине души люди все-таки сохраняли веру в ИИ. «Он просто ушел куда-то в подполье», – говорит ученый.
Первые проблески весны относятся к концу 1980-х, когда ученые стали активно изучаться нейронные сети. Идея ошеломляла своей простотой. Успехи нейробиологии позволили создать упрощенные модели нейронов и их взаимодействий. А тут еще и невиданный прогресс в разработке алгоритмов. Все это дало специалистам возможность конструировать искусственные нейронные сети (ИНС), способные обучаться и на первый взгляд напоминавшие по характеру своей работы человеческий мозг. Воодушевившись, ученые-компьютерщики принялись грезить об искусственных нейронных сетях с миллиардами или даже триллионами нейронов. Однако вскоре стало очевидно, что наши модели нервных клеток чересчур упрощенны. Исследователи не могли даже определить, какие из свойств нейронов особенно важны, не говоря уж о том, чтобы моделировать эти свойства, строя какие-то там ИНС.
Впрочем, нейронные сети в некоторой степени помогли заложить основу для нового ИИ. Некоторые специалисты, разрабатывавшие ИНС, в конце концов осознали: можно представить, что такие сети осмысливают мир в понятия статистики и вероятностей. Заговорили не о синапсах и импульсных пиках, а о параметризации и случайных переменных. «Теперь это уже походило не на большой мозг, а на большую вероятностную модель», – говорит Тененбаум.
А потом, в 1988 году, Джуд Перл из Калифорнийского университета в Лос-Анджелесе написал книгу «Вероятностные рассуждения в интеллектуальных системах», ставшую важной вехой в развитии науки об искусственном интеллекте и подробно описывавшую принципиально новый подход к ИИ. По сути, в ее основе лежала теорема Томаса Байеса, английского математика и священника, жившего в XVIII веке. Теорема связывает условную вероятность события Р (того, что событие P произойдет при условии, что произошло событие Q) и условную вероятность события Q (того, что событие Q произойдет при условии, что произошло событие P). Иными словами, появился метод, как бы позволяющий переключаться между причиной и следствием. «Если вы при помощи такого метода опишите все те различные вещи, которые вас интересуют, то байесианская математика подскажет вам, каким образом наблюдать следствия и как рассуждать, двигаясь вспять – к вероятностям различных причин», – старается объяснить Тененбаум.
Ключевую роль здесь играет байесианская сеть – модель, выстроенная на основе различных случайных переменных, причем вероятностное распределение для каждой зависит от всех других переменных. Изменяя значение одной из них, вы тем самым измените распределение вероятностей для всех прочих. Если вам известно значение хотя бы одной переменной, байесианская сеть позволяет предположить, каково вероятностное распределение для других переменных – иными словами, каковы их вероятные значения. Допустим, эти переменные являются отражением симптомов, болезней и результатов клинического анализа. Исходя из результатов анализа (выявлена вирусная инфекция, пока неизвестно, какая именно) и симптомов (высокая температура, кашель), можно сделать заключение о вероятности причин (грипп – весьма вероятно; пневмония – маловероятно).
К середине 1990-х некоторые исследователи, в том числе и Рассел, стали разрабатывать алгоритмы для байесовских сетей, способных обрабатывать существующие данные и обучаться на их основе. Во многом подобно тому, как человек при обучении в значительной мере полагается на уже достигнутое понимание и существующее (априорное) знание, эти новые алгоритмы могли выстраивать гораздо более сложные и точные модели на основании гораздо меньшего количества данных (по сравнению со своими предшественницами). Это стало огромным шагом вперед: в первых ИНС не было места априорному знанию, и для каждой новой проблемы они начинали обучение заново.
Так собирались кусочки мозаики, которая могла бы в конечном счете позволить создать искусственный интеллект, способный действовать в реальном мире. Параметрами для байесианской сети являются вероятностные распределения, и чем больше система знает о мире, тем полезнее для нее эти распределения. Но, в отличие от систем, основанных на логике первого порядка, цепочка рассуждений здесь не рушится перед лицом неполного знания.
Впрочем, логика не собиралась никуда уходить. Оказывается, самих по себе байесовских сетей недостаточно: они не позволяют строить произвольные сложные конструкции из простых элементов. Шум вокруг нового ИИ возник как раз благодаря синтезу логического программирования и байесовских сетей в рамках новой сферы – вероятностного программирования.
«Удивительный мир» (с) Консорциум Прессы, 1994
Александр Макаров-Кротков , Алексей Буторов , Алексей Вячеславович Буторов , Виктор Прусаков , Михаил Игоревич Костин , Михаил Костин , П. Кресников , Юрий Георгиевич Симаков
Публицистика / Альтернативные науки и научные теории / Прочая научная литература / Образование и наука / Документальное