Представьте себе, что появился некий опасный вирус АВС, вызывающий опасную для жизни болезнь у одного человека из тысячи. Разработан тест, позволяющий точно определить, что у человека, больного этой болезнью, наличествует вирус АВС. Предположим теперь, что тест работает с положительной погрешностью в 5 процентов, то есть он показывает у пяти процентов людей наличие вируса, когда они такового не имеют.
Некто был протестирован и тест показал, что у этого человека наличествует вирус АВС. Какова вероятность, что этот человек действительно болен АВС (предположим для простоты, что нам не известно ничего о его личной жизни и его история болезни нам недоступна)?
Наиболее частый ответ — 95%. Правильный ответ — примерно 2%. Здесь также опрошенные переоценивают наглядный результат теста и недооценивают базовую вероятность. Снова перед применением формулы немного логики, чтобы увидеть решающее значение базовой вероятности. У нас есть данные о том, что из тысячи человек страдает от АВС в действительности один. Это означает, что если остальные 999 человек будут протестированы на АВС, тест покажет, что больны примерно 50 человек (0,5 * 999), поскольку тест имеет пятипроцентную погрешность. Таким образом, у 51 человека тест показывает наличие вируса АВС, но только один из них действительно болен — примерно 2%. Рассчитаем теперь по Байесу:
Р(Н/D) = Р(Н) * Р(D/Н) / [Р(Н) * Р(D/Н) + Р(~Н) * Р(D/~Н)]
Р(Н/D) = (0,001)*(1,0) / [(0,001) * (1,0) + (0,999) * (0,05)] = 0,0198
В принципе люди не должны обязательно знать наизусть формулу Байеса (хотя это, конечно, никому и не вредит). Желательно, однако, мыслить в направлении Байеса. В частности, делая спонтанные предположения о вероятностных явлениях, не забывать о значении базовой вероятности.
Научиться думать «по-Байесовски» можно, хотя это и не столь просто. Мы с вами рассмотрели
Р(Н/D) Р(D/Н) Р(Н)
----------- = ---------- * -------------
Р(~Н/D) Р(D/~Н) Р(~Н)
Теперь мы имеем дело с тремя отношениями:
- апостериорная вероятность основной гипотезы (Н) после получения новых данных (D);
- так называемое
- априорная вероятность основной гипотезы.
Априорная вероятность: Р(Н/D) / Р(~Н/D).
Отношение правдоподобия: Р(D/Н) / Р(D/~Н).
Апостериорная вероятность: Р(Н) / Р(~Н).
Что нам всё это даёт? Очень часто, оценивая отношение правдоподобия, люди недооценивают вероятность того, что основная гипотеза ложная. Эта неспособность «думать от противного» приводит к серьёзным ошибкам рациональности — неспособности увидеть, что истинной является альтернативная гипотеза.
Дохерти и Майнэтт (Doherty, M. E., Mynatt, C. (1990). Inattention to P(H) and to P(D/~H): A converging operation. Acta Psychologica, 75, 1-11.) предлагали испытуемым представить, что они являются медиками и исследуют пациента, страдающего от красной сыпи. Испытуемые должны были установить, болеет ли пациент «Дигирозой». Они могли получить для этого карточки со следующей информацией:
- Процент людей, страдающих Дигирозой.
- Процент людей, не болеющих Дигирозой.
- Процент людей, страдающих Дигирозой и имеющих красную сыпь.
- Процент людей, не страдающих Дигирозой и имеющих красную сыпь.
Эта информация соответствует четырём основным элементам формулы Байеса: Р(Н), Р(~Н), Р(D/Н), Р(D/~Н). Поскольку Р(Н) и Р(~Н) дополняют друг друга, для расчёта апостериорной вероятности требуется только три элемента. Однако Р(D/~Н) — процент людей, не страдающих Дигирозой и имеющих красную сыпь — необходимо выбрать для расчёта по формуле Байеса. Тем не менее, 48% испытуемых её не выбирали! Не принятие во внимание Р(D/~Н) не являются простым упущением мышления. Если Ваш врач не рассматривает альтернативные гипотезы, Ваши шансы на излечение ничтожно малы…
Проблема альтернативных гипотез является актуальной не только для врачей. Рассмотрим ещё одно исследование Майнэтта, Дохэрти и Дрэгэна (Mynatt, C. R., Doherty, M. E., Dragan, W (1993). Information relevance, working memory, and the consideration of alternatives. Quarterly Journal of Experimental Psychology, 46A, 759-778.). Ситуация выглядит следующим образом (попытайтесь решить самостоятельно):