Может показаться, что в основе теоремы Байеса лежит просто здравый смысл и обычная интуиция, однако посмотрим, как сложится игра в следующем раунде. Интересно, какой кубик выберет мистер Прайс на этот раз? Итак, он снова бросает кубик и называет число 5. Ситуация становится неопределенной, поскольку это число может быть на любом из двух кубиков. Будут ли в этом случае обе гипотезы правдоподобны в равной степени? Преподобный Байес считал, что нет, и разработал собственные методы статистических вычислений для решения проблемы индукции равновероятных событий, когда две, несколько или бесконечное количество гипотез или моделей соответствуют данным наблюдений. Как в этом случае сделать правильный выбор?
Ключевым моментом в статистическом методе Байеса является принцип правдоподобия. Первым на эту идею обратил внимание Гарольд Джеффрис в книге по теории вероятностей, опубликованной в 1939 году[444], а в дальнейшем она получила развитие в работах других сторонников байесовской статистики[445]. В основе байесовского подхода лежит принцип бритвы Оккама, поскольку предпочтение отдается простым моделям, а сложные отбрасываются. Мы можем легко в этом убедиться, если продолжим игру и посмотрим, как на этот раз будут соотноситься априорная и апостериорная вероятности. Байес снова исходит из того, что априорные вероятности обеих гипотез составляют 0,5. Для шестидесятигранного кубика условная вероятность, что выпадет число 5, ничем не отличается от условной вероятности, что выпадет число 29 – в обоих случаях вероятность составляет 1/60, или 0,016. Если умножить это значение на априорную вероятность, апостериорная вероятность снова составит 0,008.
Однако, если выполнить те же вычисления для шестигранного кубика, окажется, что условная вероятность, что выпадет число 5, будет значительно выше и составит 1/6 или 0,16. Это объясняется тем, что шестигранный кубик проще в том смысле, что на нем меньше чисел. Байес умножает априорную вероятность 0,5 на 0,16 и получает апостериорную вероятность 0,08. Это в 10 раз больше, чем апостериорная вероятность для шестидесятигранного кубика. Таким образом, вероятность того, что число 5 выпадет на шестигранном кубике, в десять раз превышает вероятность для шестидесятигранного кубика. Благодаря новому методу статистических вычислений Байес снова угадывает и снова побеждает в игре.
Принцип правдоподобия обеспечивает байесовскую статистику собственной встроенной бритвой, с помощью которой отсекается лишнее и остаются только простые модели с более высокой вероятностью получения результатов. Для наглядности возьмем пространство параметров, представляющее собой диапазон возможных значений для каждой модели или гипотезы, или диапазон наблюдаемых результатов, получаемых при использовании такой модели или гипотезы. Посмотрите на спираль чисел на рис. 39. В маленьком кружочке в центре находятся те числа (от 1 до 6), которые могут выпасть, если бросить шестигранный кубик, – это параметрическое пространство для шестигранного кубика. Больший по площади кружок очерчивает пространство параметров для шестидесятигранного кубика, а все остальное пространство, уходящее в бесконечность, заполнено числами, которые не могут выпасть ни на одном из них. Обратите внимание на то, что пространство параметров шестидесятигранного кубика включает меньшее пространство значений шестигранного кубика. Обведенное в кружок число 5 находится в обоих пространствах, поскольку может выпасть на любом кубике. Однако оно может выпасть и если в распоряжении мистера Прайса будет кубик с семьюдесятью гранями, восьмьюдесятью или бесконечным количеством граней. Итак, мы вновь подошли к главной проблеме науки, о которой не раз говорили на страницах этой книги, – проблеме выбора модели. При наличии множества моделей, каждая из которых объясняет интересующее нас явление, как сделать правильный выбор? Суть байесовской бритвы в том, что выбор делается в пользу той теории, гипотезы или модели, на область числовых значений которой (число 5 в нашем примере) приходится наибольшая доля пространства параметров (шестигранный кубик) и которая, таким образом, обладает наибольшей прогностической способностью. Это неизменно самая простая модель: бритва Оккама.
Рис. 39.