Байес затеял эту игру по той простой причине, что она моделирует многие решения, которые мы принимаем в жизни. В примере с испытаниями лекарства положение первого мяча представляет собой истинную эффективность лекарства, а то, что говорится о втором мяче, представляет собой информацию о пациенте. Положение первого мяча может также обозначать интерес к фильму, качество изделия, умение водить машину, усердную работу, упрямство, талант, способность — да что угодно, что определяет успех либо неудачу того или иного предприятия. Сообщения о втором мяче в таком случае обозначали бы наши наблюдения либо полученные нами данные. Теория Байеса демонстрирует, как производить оценку и согласовывать ее при наличии новой информации.
В наше время байесовский анализ широко применяется и в науке, и на производстве. К примеру, в модели, с помощью которых рассчитываются страховые тарифы для автомобилей, заложена математическая функция, описывающая в единицах времени за рулем вероятность для вас лично попасть в аварию однажды, не один раз, ни одного раза. В нашем случае достаточно рассмотреть упрощенную модель, согласно которой все водители распределяются на две категории: высокого риска, к которой относятся водители, в среднем попадающие в одну аварию в год, и малого риска, к которой относятся водители, в среднем попадающие в менее чем одну аварию в год. Допустим, в момент обращения за страховкой вы предоставляете данные, согласно которым проездили без единой аварии аж двадцать лет, либо предоставляете данные, согласно которым за двадцать лет побывали в тридцати семи авариях. Страховая компания четко определит для себя, к какой категории вас отнести. Однако если вы сели за руль недавно, к какой категории вас отнести: малого риска (водитель не превышает скорость и не употребляет ни капли спиртного за рулем) или высокого риска (водитель гонит по шоссе, отхлебывая из уже полупустой бутылки вина)? У страховой компании нет на вас никаких данных — ни малейшего представления о «положении первого мяча», — поэтому вас могут отнести с равной априорной вероятностью и к той, и к другой категории, либо, на основании известных данных о начинающих водителях, сразу приписать к категории высокого риска, скажем, 1 к 3. В таком случае компания применит к вам смешанную оценку — одна треть высокого риска и две трети малого риска — и возьмет с вас одну треть платы, которую берет с водителей категории высокого риска, и две трети платы, которую берет с водителей категории малого риска. Далее после года наблюдений — то есть, после броска одного из вторых байесовских мячей, — компания будет располагать другими данными, чтобы переоценить модель, привести в соответствие ранее рассчитанные пропорции в одну треть и две трети и определить новую ставку. Если у вас не было ни одной аварии, соотношение малого риска и следовательно низкого тарифа возрастет; если у вас произошло две аварии, соотношение снизится. Точные размеры соответствия даются теорией Байеса. Таким же образом страховая компания может периодически приводить в соответствие свои оценки в последующие годы, отражая факт того, что у вас не было аварии или же вы дважды попали в аварию, когда ехали по улице с односторонним движением не в ту сторону, Да еще одной рукой прижимали к уху мобильный телефон, а в другой держали пончик. Вот почему страховые компании могут назначать скидки так называемым «примерным водителям»: отсутствие аварий повышает апостериорную вероятность того, что водитель входит в категорию малого риска.
Очевидно, что многие детали байесовской теории довольно сложны. Но как я уже говорил, во время анализа задачи про двух дочерей я использовал новые данные для «урезания» пространства элементарных событий и соответственной выверки вероятностей. В задаче с двумя дочерьми пространство элементарных событий изначально было таким: (мальчик, мальчик), (мальчик, девочка), (девочка, мальчик), (девочка, девочка), однако оно сокращается до следующих параметров: (мальчик, девочка), (девочка, мальчик), (девочка, девочка), если вы узнаете, что один из детей — девочка, что шансы на семью из двух девочек составляют 1 из 3. Попробуем применить эту несложную стратегию и посмотрим, что выйдет при условии, если вам станет известно следующее: один из детей — девочка по имени Флорида.
В задаче про девочку по имени Флорида нас интересует помимо пола детей еще и имя, поскольку речь о девочках. Наше первоначальное пространство элементарных событий должно включать в себя все вероятности, поэтому список содержит и пол, и имя. Обозначим девочку по имени Флорида как «девочка Ф», а девочку по имени не Флорида как «девочка не Ф». Обозначим пространство элементарных событий: (мальчик, мальчик), (мальчик, девочка Ф.), (мальчик, девочка не Ф.), (девочка Ф., мальчик), (девочка не Ф., мальчик), (девочка не Ф., девочка Ф.), (девочка Ф., девочка не Ф.), (девочка не Ф., девочка не Ф.), (девочка Ф., девочка Ф.).