В США чиновников из сферы здравоохранения просят расследовать больше тысячи подозрительных кластеров заболеваемости раком каждый год. Хотя история знает о заметных кластерах случаев рака, вызванного взаимодействием с промышленными токсинами, подавляющее большинство заявленных происшествий абсолютно случайны. Существует более 400 000 компаний, где числится 50 и более сотрудников. Очень велика вероятность того, что горстка людей получит один и тот же неутешительный диагноз.
Зная об ошибке игрока, не стоит ждать, что краткосрочный результат всегда будет совпадать с долгосрочными ожиданиями. Справедливо и обратное: не стоит основывать долгосрочные ожидания на маленьком наборе краткосрочных результатов.
Возможно, вам известно выражение
Не стоит думать, что результат, основанный на небольшой выборке, будет типичным. Он не отразит результат ни для любой другой маленькой выборки, ни для гораздо большей. Как и единичные случаи, небольшие выборки очень мало сообщают вам помимо того, что случившееся может произойти. Хотя первое впечатление и бывает точным, нужно относиться к нему скептически. Дополнительные данные помогут отличить вероятное событие от аномалии.
Кривая нормального распределения
Когда имеете дело с большим количеством данных, используйте графики и сводную статистику, чтобы бороться с
Вы постоянно используете сводную статистику, даже не понимая этого.
Если кто-то спросит вас: «Какова температура здорового человека?» – вы, скорее всего, ответите, что 98,6 °F или 37 °C. На самом деле это сводная статистика, которая называется нормой
, что, как мы только что объяснили, является другим названиемВозможно, вы даже не помните, когда впервые узнали об этом факте, и еще вероятнее, что вы даже не знаете, откуда взялась эта цифра. Чтобы высчитать эту статистику, немецкий доктор Карл Вундерлих в XIX веке собрал и проанализировал больше миллиона температур, замеренных подмышкой у 25 000 пациентов (очень много подмышек).
И все же 98,6 °F – это не какая-то волшебная температура. Во-первых, более свежие данные отмечают более низкую норму, ближе к 98,2 °F (36,8 °C). Во-вторых, вы могли заметить, что «нормальная» температура у вас или члена вашей семьи отклоняется от этого среднего значения. На самом деле женщины в среднем немного теплее мужчин, и для них температура до 99,9 °F (37,7 °C) считается нормой. В-третьих, температура человеческого тела естественным образом меняется в течение дня, повышаясь в среднем на 0,9 °F (0,5 °C) с утра до вечера.
Если вы просто скажете, что 98,6 °F – это нормальная температура, вы не учтете всех этих нюансов. Вот почему ряд сводных статистик или графиков часто используется для каждого случая в отдельности, чтобы обобщить данные. Норма (среднее или ожидаемое значение) показывает
Для температуры тела, простое указание центральной тенденции типа нормы временами бывает слишком простым. Это подводит нас ко второму распространенному набору сводных статистических данных, которые измеряют