Байесовские модели: использовать с умом
Понимание условий применения и пределов моделей решений возвращают нас к вопросу о базовых ставках, обсуждавшемуся в главе 6. В примерах с такси и медицинскими исследованиями мы видели: люди не думают в терминах условных вероятностей. Они не часто обращают внимание на общую численность населения, высказывая суждения о конкретных событиях.
В тех примерах нам были представлены все недостающие факты, так что для расчета условных вероятностей требовалось просто взять формулу и подставить цифры. Но, как мы знаем, очень часто у нас нет данных: их требуется найти, и они не фиксированные, а изменчивые. В таких случаях мы можем включать в наши модели новую информацию в рамках байесовского процесса обновления.
Но давайте будем осторожны. То, что помогает точно предсказывать температуру или прогнозировать результаты баскетбольной команды, может оказаться не особенно полезным в других случаях. Иные временные рамки и события, в которых мы заинтересованы, могут повлиять на обновление модели.
Рассмотрим прогноз погоды. Проводя измерения каждый день, мы можем обновлять наши модели так, чтобы с течением времени они становились все точнее и точнее. Постоянное улучшение прогнозирования температуры – в начале 1970-х средняя ошибка составляла 6 градусов, в 1990-е годы 5 и всего 4 градуса в 2010-м – явно свидетельствует о пользе обновления моделей.[273]
Здесь мы не только располагаем большим объемом данных, но и имеем дело с тем, на что не можем непосредственно влиять (по крайней мере, во временных рамках прогноза – как мы узнали, со временем климатВ книге «Сигнал и шум» Нейт Сильвер использует интересный пример, дающий представление о том, насколько полезными могут быть условные вероятности и байесовские обновления. Предположим, вы женщина, живете с приятелем и по возвращении из командировки обнаруживаете в ящике комода чужое нижнее белье – явно женское. Поэтому вы начинаете думать, что у вашего друга есть связь на стороне.[274]
Сильвер объясняет: если мы рассчитаем три базовые ставки – исходную вероятность без учета доказательств, истинную положительную частоту и ложную положительную частоту, – то теорема Байеса может обеспечить хорошую начальную оценку.[275]
Во-первых, нужно сделать оценку вероятности без учета текущего доказательства, что партнер завел интрижку. При отсутствии другой информации мы можем использовать общую базовую ставку неверности, которую Сильвер принимает за 0,04. Во-вторых, мы должны оценить вероятность, что белье могло появиться вследствие его измены, что Сильвер принимает за 50 %, или 5,33.[276]В-третьих, вероятность, что белье появилось, но он не изменял, Сильвер оценивает в 5 % или 0,05. Мы не знаем наверняка, правильны ли эти показатели, но они хорошая отправная точка для оценки того, что нас интересует, – вероятности измены, с учетом того, что обнаружено нижнее белье. Идея байесовского обновления в том, что если мы сделаем первичный расчет, а затем длительное время, скажем, полгода, будем собирать дополнительные данные, то, периодически пересматривая свою модель, мы получим все более точные оценки.
До сих пор все шло хорошо. Применив теорему Байеса, как в примере с такси и медицинским исследованием, мы получим цифры, представленные в табл. 9.1. Существуют две вероятности появления белья: одна – что партнер
Рис. 9.1. Была ли интрижка
Учитывая явную улику, это явно меньше, чем вы себе представляли, но так говорят цифры. А как насчет остальных 70,6 %? Расслабьтесь. Тут нет никакого жульничества: просто ошибка прачечной, или белье осталось после приезда родственницы, или другое невинное объяснение.
Забавный пример, приводящий преподобного Байеса, так сказать, в спальню. Но не лучший способ показать, как с помощью постоянного обновления модели становятся все более и более точными. В нем не учитывается ни важность быстрого обновления, ни то, как факт измерений может повлиять на вероятность будущих событий.