Проблема в том, что сначала нужно изучить относительную распространенность каждой категории, иначе невозможна значимая оценка вероятности. Например, если 99,99 % населения не поддерживают экстремизм, тогда – даже если каждый отдельно взятый экстремист злобен – неэкстремистов, отличающихся злобностью, почти наверняка окажется больше.
Эта ошибка называется игнорированием базового уровня
{161}, поскольку не учитывает пропорциональное соотношение обсуждаемых явлений. В повседневной жизни она чаще всего наблюдается в форме стереотипного неприятия национальных меньшинств: «Мой дом ограбили. Наверняка это дело рук кого-то из иммигрантов – почти все они преступники». Нередко такого рода выводы опровергаются статистикой, поскольку – независимо от уровня криминализованности немногочисленной этнической группы – общее число преступников, не принадлежащих к этой группе, намного больше.Эта ошибка наблюдается в сферах финансов и бизнеса, когда сосредоточение на цели получения большой прибыли путем продажи дорогих, но редко приобретаемых товаров приводит к пренебрежению более важным показателем совокупных продаж.
В общем виде эта логическая ошибка выглядит следующим образом:
Большинство А являются С; немногие В являются С; Х – С; вероятно, Х есть также А.
ИНФОРМАЦИЯ К РАЗМЫШЛЕНИЮ.
Почему, на ваш взгляд, так легко игнорировать базовый уровень, размышляя о явлении с участием больших и малых групп? Как бы вы объяснили эту проблему другому человеку?От игнорирования базового уровня к теореме Байеса
Для успешного обучения и научной работы особенно важно уметь распознавать одну из разновидностей ошибки игнорирования базового уровня, которая может возникнуть при анализе редких или маловероятных событий.
Прочтите следующий абзац, посвященный сдаче анализа на редкое (вымышленное) заболевание – назовем его вымышлит. С учетом имеющейся информации, каковы шансы, что я страдаю вымышлитом?
Я прохожу обследование по поводу вымышлита, заболевания, поражающего одного человека из миллиона. У меня отсутствуют симптомы, но я читал об этом недуге в интернете и хочу убедиться, что со мной все в порядке. Врач говорит, что если вымышлит имеется, то анализ всегда безошибочно выявляет его. Если человек здоров, то анализ точен на 99,9 %. Прекрасно! Я сдаю анализ и через пять минут получаю результат. Он положительный. Анализ показал, что у меня вымышлит. Ну почему мне так не везет!
Интуиция подсказывает, что мне впору перепугаться. В данном случае наиболее распространенной реакцией, даже со стороны некоторых специалистов, будет оценить вероятность наличия у меня вымышлита в 99,9 %. Это ошибочное суждение, не учитывающее крайне низкую базовую распространенность недуга и эффект данного показателя в сочетании с точностью анализа. Фактически я с вероятностью около 99,9 % не болен вымышлитом. Как же так?
Чтобы ответить на этот вопрос, попробуем разобраться, что произойдет, если проверить на вымышлит миллион человек. Мы знаем, что это заболевание в действительности встречается лишь у одного из миллиона, а также что анализ с гарантией выявит больного. Данный анализ по определению не может быть ложноотрицательным
{162}. Итак, мы имеем один гарантированный положительный результат из миллиона. Но это лишь начало логической цепочки.Мы также знаем, что остальные 999 999 человек не больны и что для них анализ на 99,9 % верен. Это означает, что он даст отрицательный результат у 999 человек из каждой 1000, но 1 на 1000, ошибочный, окажется ложноположительным
{163}. Таким образом, протестировав 999 999 человек, мы получим еще 1000 положительных результатов – все ошибочные.