Читаем Левое полушарие–правильные решения. Мыслить и действовать: как интуиция поддерживает логику полностью

<p>Байесовские модели: использовать с умом</p></span><span>

Понимание условий применения и пределов моделей решений возвращают нас к вопросу о базовых ставках, обсуждавшемуся в главе 6. В примерах с такси и медицинскими исследованиями мы видели: люди не думают в терминах условных вероятностей. Они не часто обращают внимание на общую численность населения, высказывая суждения о конкретных событиях.

В тех примерах нам были представлены все недостающие факты, так что для расчета условных вероятностей требовалось просто взять формулу и подставить цифры. Но, как мы знаем, очень часто у нас нет данных: их требуется найти, и они не фиксированные, а изменчивые. В таких случаях мы можем включать в наши модели новую информацию в рамках байесовского процесса обновления.

Но давайте будем осторожны. То, что помогает точно предсказывать температуру или прогнозировать результаты баскетбольной команды, может оказаться не особенно полезным в других случаях. Иные временные рамки и события, в которых мы заинтересованы, могут повлиять на обновление модели.

Рассмотрим прогноз погоды. Проводя измерения каждый день, мы можем обновлять наши модели так, чтобы с течением времени они становились все точнее и точнее. Постоянное улучшение прогнозирования температуры – в начале 1970-х средняя ошибка составляла 6 градусов, в 1990-е годы 5 и всего 4 градуса в 2010-м – явно свидетельствует о пользе обновления моделей.[273] Здесь мы не только располагаем большим объемом данных, но и имеем дело с тем, на что не можем непосредственно влиять (по крайней мере, во временных рамках прогноза – как мы узнали, со временем климат можно изменить). То же касается моделей, которые прогнозируют производительность баскетбольной команды. Наша цель – составить прогноз на то, на что мы не влияем ни прямо (не гоним мяч в лунку и не бьем), ни косвенно (Никс и Лейкерс не знают, что прогнозирует наша модель). Поскольку каждую неделю проводится несколько игр, мы можем постоянно совершенствовать свои модели. Правильно считать, что они находятся в состоянии разработки и регулярно дополняются, чтобы с течением времени становиться точнее.

В книге «Сигнал и шум» Нейт Сильвер использует интересный пример, дающий представление о том, насколько полезными могут быть условные вероятности и байесовские обновления. Предположим, вы женщина, живете с приятелем и по возвращении из командировки обнаруживаете в ящике комода чужое нижнее белье – явно женское. Поэтому вы начинаете думать, что у вашего друга есть связь на стороне.[274]

Сильвер объясняет: если мы рассчитаем три базовые ставки – исходную вероятность без учета доказательств, истинную положительную частоту и ложную положительную частоту, – то теорема Байеса может обеспечить хорошую начальную оценку.[275] Во-первых, нужно сделать оценку вероятности без учета текущего доказательства, что партнер завел интрижку. При отсутствии другой информации мы можем использовать общую базовую ставку неверности, которую Сильвер принимает за 0,04. Во-вторых, мы должны оценить вероятность, что белье могло появиться вследствие его измены, что Сильвер принимает за 50 %, или 5,33.[276]

В-третьих, вероятность, что белье появилось, но он не изменял, Сильвер оценивает в 5 % или 0,05. Мы не знаем наверняка, правильны ли эти показатели, но они хорошая отправная точка для оценки того, что нас интересует, – вероятности измены, с учетом того, что обнаружено нижнее белье. Идея байесовского обновления в том, что если мы сделаем первичный расчет, а затем длительное время, скажем, полгода, будем собирать дополнительные данные, то, периодически пересматривая свою модель, мы получим все более точные оценки.

До сих пор все шло хорошо. Применив теорему Байеса, как в примере с такси и медицинским исследованием, мы получим цифры, представленные в табл. 9.1. Существуют две вероятности появления белья: одна – что партнер не завел интрижку (5 % от 96, или 4,8 %) и вторая – что он ее завел (50 % от четырех, 2 %). Вероятность интрижки с учетом таинственного белья рассчитывается следующим образом: 0,02 / (0,02+ + 0,048) = 294, или 29,4 %.

Рис. 9.1. Была ли интрижка

Учитывая явную улику, это явно меньше, чем вы себе представляли, но так говорят цифры. А как насчет остальных 70,6 %? Расслабьтесь. Тут нет никакого жульничества: просто ошибка прачечной, или белье осталось после приезда родственницы, или другое невинное объяснение.

Забавный пример, приводящий преподобного Байеса, так сказать, в спальню. Но не лучший способ показать, как с помощью постоянного обновления модели становятся все более и более точными. В нем не учитывается ни важность быстрого обновления, ни то, как факт измерений может повлиять на вероятность будущих событий.

Перейти на страницу:

Похожие книги