Рассмотрим пример, схожий по духу с тем, на котором преподобный Байес основал свою теорию в XVIII веке. Предположим, я вижу, как кто-то подбрасывает монетку. Если монетка правильная (симметричная), вероятность выпадения орла и решки одинаковая: пятьдесят на пятьдесят. Исходя из этой предпосылки, классическая теория вероятностей подсказывает нам, как вычислить вероятность того или иного исхода (например, вероятность выпадения пяти решек подряд). Байесовская теория позволяет двигаться в противоположном направлении – от наблюдений к причинам. Она дает нам возможность ответить на вопросы вроде «после того как я подброшу монету несколько раз, должен ли я изменить свои представления о ней?». По умолчанию предполагается, что монета симметрична. Но если решка выпадет двадцать раз подряд, я поступлю разумно, если пересмотрю свои изначальные допущения: с этой монетой явно что-то не так. Очевидно, моя первоначальная гипотеза стала неправдоподобной, но насколько? Как именно мне обновлять мои убеждения после каждого наблюдения? В рамках теории каждому допущению присваивается номер, соответствующий степени правдоподобия или уровню доверия. С каждым последующим наблюдением это число изменяется на величину, пропорциональную степени невероятности наблюдаемого исхода. Как и в науке, чем невероятнее экспериментальное наблюдение, тем сильнее оно нарушает прогнозы первоначальной теории и с тем большей уверенностью мы можем отвергнуть эту теорию и искать альтернативные интерпретации.
Байесовская теория невероятно эффективна. Во время Второй мировой войны британский математик Алан Тьюринг (1912–1954) использовал ее для расшифровки кода «Энигмы». Как известно, немецкие военные сообщения шифровались с помощью машины под названием «Энигма» – хитроумного устройства из шестеренок, роторов и электрических кабелей. После каждой буквы конфигурации, количество которых превышало один миллиард, менялись. Каждое утро шифровальщик задавал машине особые настройки, которые были запланированы на этот день. Затем он набирал текст, и «Энигма» выдавала на первый взгляд случайную последовательность букв, которую мог расшифровать только обладатель шифровального ключа. Всем остальным текст казался полностью лишенным какого-либо порядка. Однако гениальный Тьюринг обнаружил, что если две машины были настроены одним и тем же образом, то это приводило к небольшой погрешности в распределении букв, в результате чего возрастала вероятность того, что два сообщения будут похожи. Эта погрешность была настолько мала, что одной буквы было недостаточно, чтобы сделать какой-то точный вывод. Тем не менее, анализируя букву за буквой, Тьюринг смог доказать, что одна и та же конфигурация действительно использовалась дважды. С помощью устройства, которое назвали «бомбой» (большой тикающей электромеханической машины, которая стала прототипом наших компьютеров), он и его команда регулярно взламывали код «Энигмы».
Но какое отношение это имеет к живому мозгу? Что ж, похоже, точно так же рассуждает и наша кора больших полушарий37
. Согласно этой теории, каждая область мозга формулирует одну или несколько гипотез и посылает соответствующие прогнозы в другие отделы. Таким образом, каждый модуль ограничивает предположения следующего, обмениваясь вероятностными предсказаниями о внешнем мире. Эти сигналы называются «нисходящими»: они зарождаются в областях высокого уровня – например, в лобных долях – и спускаются в сенсорные области более низкого уровня, такие как первичная зрительная кора. Теория предполагает, что эти сигналы выражают набор гипотез, которые наш мозг считает правдоподобными и хочет проверить.В сенсорных областях нисходящие допущения вступают в контакт с «восходящей» информацией из внешнего мира – например, из сетчатки. Теория гласит: как только модель соприкасается с реальностью, мозг вычисляет сигнал ошибки – расхождение между тем, что предсказывала модель, и тем, что наблюдалось фактически. Байесовский алгоритм определяет, как использовать этот сигнал ошибки для изменения внутренней модели мира. Если ошибки нет, значит, модель правильная. В противном случае сигнал ошибки движется вверх по цепочке мозговых центров и по пути корректирует соответствующие параметры. В результате алгоритм относительно быстро приходит к ментальной модели, которая согласуется с внешним миром.