Кластеры действительно встречаются
. Вы, наверное, читали в газетах (или видели репортаж по телевизору) о том, что в некоем регионе отмечена повышенная заболеваемость редкой формой рака. Возможно, причиной тому является вода, расположенная поблизости атомная электростанция или вышка сотовой связи. Разумеется, любой из перечисленных факторов может реально обусловить развитие столь опасной болезни. (В последующих главах я постараюсь показать, как с помощью статистики можно идентифицировать подобные причинно-следственные связи.) Однако этот кластер (совокупность) случаев заболеваний также может оказаться результатом чистой случайности, даже когда количество заболевших подозрительно велико. Да, вероятность того, что пять человек в одном и том же учебном заведении, или церковном приходе, или на одном предприятии заболеют одной и той же редкой формой лейкемии, может составлять один шанс из миллиона, однако не следует забывать, что существуют миллионы учебных заведений, церковных приходов и предприятий. Не так уж маловероятно, что пять человек могут заболеть одной и той же редкой формой лейкемии в одном из этих мест. Мы просто забываем о всех школах, церковных приходах и предприятиях, где этого не случилось. Возьмем другую разновидность того же исходного примера – вероятность выигрыша в мгновенной лотерее; хотя она может составлять 1 шанс из 20 миллионов, никто из нас не удивляется тому, что кому-то удается выиграть: действительно, что же здесь удивительного, если были проданы миллионы билетов! (Несмотря на мое недоверие к лотереям в целом, меня восхищает лозунг иллинойсской мгновенной лотереи: «Кто-то должен выиграть; возможно, этим человеком окажетесь вы!». И впрямь, почему бы и нет?)Ниже описан эксперимент, который я провожу со своими студентами, чтобы подтвердить этот базовый постулат. Чем больше аудитория, тем лучше. Я предлагаю каждому из присутствующих вынуть монетку и встать. Затем все подбрасывают монетку, и те, у кого выпадает решка, садятся. Допустим, в аудитории находится 100 студентов; примерно 50 из них займут свое место после первого подбрасывания. Потом мы выполняем это упражнение еще раз, в результате чего останутся стоять примерно 25 студентов. И так далее. Чаще всего после пяти или шести подбрасываний остается всего один человек, у которого пять или шесть раз подряд выпал орел. Я спрашиваю этого уникума: «Как вам это удалось?», или «Вам, наверное, известна какая-то особая методика тренировок, позволяющая достигать определенного результата?», или «Вы, возможно, придерживаетесь какой-то особой диеты, помогающей добиться такого исхода?» Все присутствующие, конечно, воспринимают это как шутку, поскольку наблюдали процесс подбрасывания монетки собственными глазами, к тому же неплохо знают друг друга и понимают, что у человека, которому удалось пять раз подряд поймать монетку орлом вверх, нет никаких особых талантов в этом занятии, а результат, которого он добился, не более чем случайное совпадение. Однако каждый раз, когда мы видим какое-либо аномальное событие вне конкретного контекста, в котором оно произошло, у нас поневоле возникает подозрение, что здесь, помимо чистой случайности, замешано что-то еще.
Ошибка прокурора
. Допустим, в суде вы услышали показания, которые сводятся к следующему: 1) образец ДНК, найденный на месте преступления, совпадает с результатами анализа ДНК обвиняемого и 2) существует лишь один шанс из миллиона, что образец ДНК, найденный на месте преступления, совпадет с образцом ДНК, взятым у кого-либо другого (не у обвиняемого). (Ради простоты будем полагать, что вероятности, на которые опирается обвинение, соответствуют действительности.) Готовы ли вы вынести вердикт «виновен» на основе таких доказательств?Надеюсь, вы не станете торопиться.
Ошибки обвинения случаются, когда контекст статистических доказательств игнорируется. Ниже описаны два сценария, каждый из которых может объяснить доказательства виновности обвиняемого, базирующиеся на результатах анализа ДНК.
Обвиняемый 1
. Этот обвиняемый – влюбленный, отвергнутый своей жертвой, – был схвачен полицией за три квартала от места преступления; при нем было найдено орудие убийства. После ареста у него был взят образец ДНК, который совпал с образцом ДНК, взятым с волоска, найденного на месте преступления.Обвиняемый 2
. Этот обвиняемый был осужден несколько лет назад за аналогичное преступление, совершенное в другом штате. Когда суд признал его виновным, у него взяли образец ДНК, который был включен в общенациональную базу данных ДНК (в ней хранятся образцы ДНК более миллиона опасных уголовных преступников). Образец ДНК, взятый с волоска, найденного на месте преступления, сравнили с образцами, хранящимися в базе данных, и обнаружили совпадение с ДНК обвиняемого 2. Однако следствию не удалось обнаружить какую-либо связь последнего с жертвой преступления.