Априорная вероятность определяется состоянием дел до поступления новых данных. Допустим, вы живете в Лас-Вегасе, и тогда априорная вероятность ночного дождя очень невелика. Априорная вероятность, что вы забудете выключить полив, будет зависеть от того, как часто вы используете разбрызгиватель и насколько вы забывчивы. Она тоже невелика, но все же выше, чем априорная вероятность дождя.
Условная вероятность — это (если брать в широком смысле) противоположность апостериорной. Она формализует рассуждение «направленное вперед», от причин к следствию: если ночью будет дождь или останется включенным разбрызгиватель, какова вероятность того, что газон будет мокрым? Как и априорные вероятности, условные тоже могут варьироваться, но пока давайте исходить из того, что и дождь, и оставленный разбрызгиватель в равной степени способны увлажнить газон.
Байесовский метод представляет собой правило комбинирования априорных и условных вероятностей и выведения апостериорной вероятности для каждой гипотетической комбинации. Само правило простое[127]
: апостериорная вероятность — это априорная вероятность, умноженная на условную и деленная на маргинальную вероятность (то есть «предшествующую данным» — в нашем случае это предшествующая вероятность мокрого газона и сейчас она нас не интересует, поскольку будет одинаковой для каждой гипотезы).Увидев поутру за окном мокрый газон, Истинный Байесовец должен выбрать гипотезу с высочайшей апостериорной вероятностью, которая и будет наиболее вероятным объяснением имеющихся данных. Поскольку в нашем примере априорная вероятность ночного дождя ниже, чем вероятность незапланированного орошения разбрызгивателем, апостериорная вероятность дождя тоже окажется ниже. Таким образом, Истинный Байесовец выберет гипотезу разбрызгивателя. Эта гипотеза и будет наиболее вероятным предположением Байесовца о причинах наблюдаемых данных, или «выводом наилучшего объяснения».
Если вам кажется, что это все и так понятно и ничего, кроме обычного житейского здравого смысла, для таких выводов не нужно, я соглашусь, но лишь потому, что наш пример большего и не требует. Однако есть множество других ситуаций, в которых байесовский вывод будет отличаться от того, что может предложить обычный здравый смысл. В частности, нам ничего не стоит ошибочно заподозрить у себя коварную болезнь на основании положительного медицинского анализа — из-за общей склонности завышать априорную вероятность развития редких болезней[128]
. Даже если анализ обладает 99-процентной точностью, положительный результат может лишь немного повысить апостериорную вероятность наличия у вас соответствующего заболевания, если его распространенность среди населения довольно низка.Давайте вернемся к сценарию с мокрым газоном и немного его разовьем. Рассмотрев как следует собственный газон, вы оглядываетесь на соседский — и видите, что он тоже мокрый. Это значимая новая информация. Теперь условная вероятность для каждой из гипотез будет разной: для подтверждения гипотезы разбрызгивателя мокрым должен быть только ваш газон, для подтверждения гипотезы дождя мокрыми должны быть оба газона. (Условная вероятность, напомню, направлена от предполагаемых причин к наблюдаемым данным.) Вы, как Истинный Байесовец, обновляете свои апостериорные вероятности, и теперь наилучшим объяснением для увиденного оказывается прошедший ночью дождь, поэтому вы меняете мнение.
Крупное преимущество байесовского вывода заключается в том, что при обновлении наиболее вероятных предположений он принимает в расчет надежность информации. Надежная (оцененная как надежная) информация имеет для байесовского убеждения больший вес, чем информация (оцененная как) ненадежная. Представьте, что окно в вашей спальне давно не мыто, а очки вы потеряли. Соседский газон вроде бы мокрый, но зрение у вас слабое, а окно грязное, поэтому новая информация очень ненадежна, и вы это знаете. В этом случае, хотя гипотеза дождя кажется при взгляде за соседский забор чуть более вероятной, в фаворитах может остаться изначальная гипотеза незапланированного полива.
Во многих ситуациях обновление наиболее вероятных байесовских предположений по мере получения свежих данных происходит снова и снова, и процесс вывода приобретает характер бесконечного цикла. В каждой итерации прежняя апостериорная вероятность становится текущей априорной, на ее основе трактуется новая порция данных и формируется новая апостериорная вероятность — новое наиболее вероятное предположение, затем цикл повторяется. Если ваш газон окажется мокрым и на следующее утро, то в этот раз вы в своем наиболее вероятном предположении о причинах будете отталкиваться от вчерашнего наиболее вероятного предположения, и так далее, с каждым новым днем.