В общей сложности мы получим 1 + 1000 = 1001 положительный результат на 1 000 000. Нам известно, что только один из них принадлежит человеку действительно больному вымышлитом, но не известно, кто он, иначе не потребовалось бы делать анализы. Отличить один истинно положительный результат
{164} от 1000 ложноположительных невозможно.В общем, приходится заключить, что мой положительный результат, имеющий 1000 шансов из 1001, скорее всего, является ложноположительным: я почти на 99,9 % могу быть уверен, что не болен вымышлитом.
Вы все еще удивлены? Статистические выкладки становятся более наглядными на примере, позволяющем интуитивно оценить вероятность события.
Я писатель. Каковы шансы того, что я продал больше 10 млн книг?
Очевидно, это крайне маловероятно. Притом что лишь один из нескольких тысяч человек является профессиональным писателем, произведения лишь очень немногих из них настолько хорошо продаются (замечу, что сам я к таковым не отношусь). Вам же не придет в голову, что достаточно быть писателем, чтобы гарантированно продавать книги миллионами! Намного вероятнее, что я обычный скромный литератор.
Данный пример не имеет принципиальных отличий от примера медицинской тематики. Также наблюдается ничтожное меньшинство «положительных результатов» – миллионных продаж; правда, в данном случае люди не страдают, а, напротив, наслаждаются своей редкой «патологией». Вероятность того, что я одновременно являюсь писателем и имею на счету 10 млн проданных книг, намного ниже вероятности того, что я просто писатель. Если вы узнали, что я занимаюсь литературным трудом, то можете с огромной долей уверенности предположить, что я отношусь к категории «не продавших 10 млн книг».
Самый полезный метод решения подобных проблем предлагает теорема Байеса
{165}, названная в честь ее автора, английского философа и священника XVIII в. Томаса Байеса. Его интересовала тема, которую он именовал «проблемой доктрины шансов», – какого пересмотра требуют текущие представления о вероятности в свете новых свидетельств[38].Теорема Байеса начинается с наблюдения, что мы всегда отталкиваемся от исходного ожидания – базового уровня
{166} – возможности чего-либо. В «медицинском» примере базовое ожидание заключается в том, что человек, случайным образом выбранный из населения в целом, имеет один шанс из 1 000 000 страдать вымышлитом. При отсутствии дополнительной информации можно сказать, что мои шансы заболеть вымышлитом составляют один на 1 000 000, то есть вероятность этого равна 0,000001.Установив базовый уровень, можно провести исследование с целью получения новой информации. В данном случае исследование принимает форму сдачи анализа. Если нам посчастливилось получить на 100 % точный тест, то информация, которую он приносит, – положительный или отрицательный результат – позволяет перейти от обоснованного мнения к убежденности. Чаще всего, однако, приходится иметь дело с различными степенями неопределенности.
В первоначальном сценарии отрицательный результат обеспечивает полную уверенность. Описанный мной анализ не может быть отрицательным, если человек, сдавший его, действительно болен вымышлитом (в отличие от многих реальных тестов). Но положительный результат лишь повышает уровень нашей уверенности. Чтобы точно рассчитать это повышение, нужно взять только что полученную информацию – мой положительный результат конкретного анализа – и пересмотреть ожидания с учетом знания обо всех задействованных вероятностях. Вот что мы получим.
Теорема Байеса имеет следующую общую форму, где А есть первый фактор, интересующий нас (наличие вымышлита), а В – дополнительный фактор, влияние которого мы хотим учесть (положительный результат анализа):
Подставив числовые показатели, получим уточненную вероятность того, что, с учетом положительного результата анализа, я действительно болен вымышлитом:
Эти числа сложны для восприятия из-за большого количества разрядов. В другом примере мы можем работать со значительно более удобными показателями. Попробуйте самостоятельно заполнить пропуски.
Курс «Критическое мышление» изучает 1000 студентов, и я знаю, что 50 из них взяли экземпляр моего учебника в библиотеке. К сожалению, работая в библиотеке, я забыл в одном из учебников заметки для своей будущей книги «Подлинно критическое мышление». Я только что натолкнулся на одну из студенток, посещающих данный курс. Если у нее есть этот учебник, какова вероятность того, что в нем найдутся мои записи?