Умение осознавать свои ошибки важно не только для статистиков, но и для всех нас. Многие важные решения принимаются, исходя из предположений о причинно-следственной зависимости. Правительство решает сократить расходы, потому что сокращение расходов приводит к уменьшению государственной задолженности. Курильщик бросает курить, потому что врачи утверждают, что иначе он заболеет раком легких. А в дни пандемии COVID-19 мы научились держаться друг от друга на расстоянии полутора метров, поскольку правительство и ВОЗ говорит нам, что это помешает вирусу распространяться. Идея состоит в том, что, если мы знаем, чем вызвано то или иное явление, мы можем повлиять на него.
Но корреляцию не следует путать с причинно-следственной зависимостью. Мы уже видели такую ошибку, когда политики утверждали, что цвет кожи человека определяет его уровень IQ. А также когда психолог Эми Кадди заявляла, что некоторые позы влияют на гормональный уровень.
Но нигде ошибочные заключения о причинно-следственных зависимостях не встречаются чаще, чем в новостях на медицинские темы. Джин с тоником облегчает симптомы сенной лихорадки[196]
, вероятность заразиться венерическими заболеваниями выше при сбритых лобковых волосах[197], а черный шоколад полезен для сердца[198] – и это лишь немногие примеры из потока сообщений, захлестывающего нас каждый день. Такие утверждения часто бывают преувеличенными. В этом виноваты не только СМИ, любящие публиковать раздутые сообщения; на самом деле проблема часто берет свое начало в пресс-службах университетов, распространяющих информацию о медицинских исследованиях. Исследователь Петрок Самнер и его коллеги просмотрели пресс-релизы в области биологии, медицины и здравоохранения, опубликованные двадцатью британскими университетами в 2011 году. Выяснилось, что приблизительно в 33 процентах этих релизов содержались преувеличенные заявления о причинно-следственных связях[199], а около 80 процентов новостных сообщений воспроизвели эти преувеличения.Но если мы, потребители новостей, больше не можем полностью доверять журналистам и ученым, как же отделить факты от вымысла? Как узнать, например, вызывает ли курение рак легких? Книга «Как лгать при помощи статистики» дает нам кое-какие советы на эту тему. Хафф описывает в ней три типа того, что я называю «зазнавшимися корреляциями», – корреляций, которые притворяются бо́льшим, чем они есть на самом деле: причинно-следственными зависимостями.
Поваренная книга. Именно она была источником, который доктор Джонатан Шёнфельд и доктор Джон Иоаннидис использовали в своем анализе исследований рака[200]
. Они выбрали несколько случайных рецептов из «Поваренной книги Бостонской кулинарной школы» (The Boston Cooking School Cook Book) и выписали 50 первых ингредиентов, встретившихся им в этих рецептах. Вооружившись этим списком, они отправились на сайт архива медицинских исследований PubMed. Первый результат оказался довольно любопытным: 40 из 50 ингредиентов назывались причиной рака в одной или нескольких исследовательских работах. «Действительно ли все, что мы едим, связано с раком?» – задумались исследователи.Следующий результат оказался и вовсе странным. Про многие из ингредиентов утверждалось, что они как увеличивают, так и уменьшают вероятность возникновения раковых заболеваний. Например, если в одном исследовании выяснялось, что вино полезно для вашего здоровья, то можно было найти и другое, которое утверждало, что вам лучше даже не прикасаться к стоящему перед вами бокалу.
Корреляции между заболеваемостью раком и употреблением разных продуктов и напитков
Источник: Schoenfeld and Ioannidis (2013)
Шёнфельд и Иоаннидис решили ограничить свое исследование 20 ингредиентами, по которым имелось не менее десяти исследовательских работ. Для 17 ингредиентов из этих двадцати, от помидоров до чая, от кофе до говядины, они нашли противоречащие друг другу выводы.
Все эти результаты не могут быть правильными, но как именно авторы этих исследований пришли к своим выводам? Возможное объяснение дает первая «зазнавшаяся корреляция», описанная Хаффом: