Читаем Цифры врут. Как не дать статистике обмануть себя полностью

Эту врезку читать необязательно, но, если вы хотите поподробнее узнать, как работает формула распределения Пуассона, не пропускайте ее.

Маловероятно, что в каждой школе США число онкологических заболеваний совпадет со среднестатистическим. В реальности оно будет колебаться вокруг среднего: где-то больных будет больше, где-то – меньше. Это колебание на графике похоже на нормальное распределение, которое мы обсуждали в главе 3. Но для того чтобы выяснить, насколько часто конкретный результат появится в заданный промежуток времени, рассмотрим несколько иное распределение – распределение Пуассона.

В 1837 году французский математик Симеон Дени Пуассон опубликовал статью о вероятности тех или иных судебных решений. Он изучал, сколько несправедливо осужденных следует ожидать во французских судах при заданных значениях некоторых переменных, таких как число судей на заседании, вероятность ошибки каждого из них и априорная вероятность виновности подозреваемого.

Для этого требовалось решить такую задачу: если некое событие происходит в среднем Х раз в год (или в час, или в любой заданный промежуток времени), какова вероятность, что оно произойдет Y раз в год? На графике распределение Пуассона выглядит так; кривая получается за счет соединения точек.

По мере уменьшения среднего кривая становится выше и сдвигается влево; при увеличении среднего кривая уплощается и сдвигается вправо. По оси Y указана вероятность, до максимального значения – 1, а по оси X – количество событий. Надо найти на оси X, сколько раз случилось искомое событие, тогда на оси Y будет указана его вероятность.

Допустим, вам известно, что в среднем в данном школьном округе ежегодно заболевают раком 15 учеников; какова вероятность, что в этом году их будет 20? Подставив эти числа (или просто, как сделали мы, воспользовавшись онлайн-калькулятором), вы получите 4 %, или 0,04.

Но это вероятность того, что случаев окажется ровно 20. Вы так же удивитесь, если их окажется 21 или 22, поэтому вас может заинтересовать вероятность того, что в какой-то заданный год их будет не менее 20.

На первый взгляд кажется, что такие расчеты займут много времени: сначала надо вычислить вероятность для 20, потом – для 21, 22 и так далее до бесконечности и сложить их все. К счастью, есть путь покороче.

Можно воспользоваться свойством, которое называется взаимной исключительностью. Это значит, что некоторые события не могут произойти одновременно – либо то, либо другое. Например, если вы бросили кость и выпало 6, то не могло одновременно выпасть 5 или 3. Если известно, что один из исходов обязателен, то сумма их вероятностей равна единице. Если 6 выпадает с вероятностью 1/6 (0,167), то вероятность того, что шестерка не выпадет, – 5/6 (0,833). Вероятность того, что выпадет или шестерка, или не шестерка, 6/6, то есть единица.

Перейти на страницу:

Похожие книги

Управление мировоззрением. Подлинные и мнимые ценности русского народа
Управление мировоззрением. Подлинные и мнимые ценности русского народа

В своей новой книге автор, последовательно анализируя идеологию либерализма, приходит к выводу, что любые попытки построения в России современного, благополучного, процветающего общества на основе неолиберальных ценностей заведомо обречены на провал. Только категорический отказ от чуждой идеологии и возврат к основополагающим традиционным ценностям помогут русским людям вновь обрести потерянную ими в конце XX века веру в себя и выйти победителями из затянувшегося социально-экономического, идеологического, но, прежде всего, духовного кризиса.Книга предназначена для тех, кто не равнодушен к судьбе своего народа, кто хочет больше узнать об истории своего отечества и глубже понять те процессы, которые происходят в стране сегодня.

Виктор Белов

Обществознание, социология