Я не в состоянии доказать отсутствие причинно-следственной связи между диагностикой аутизма и продажами органических продуктов питания, равно как и убедительно обосновать то, что рост продаж видеоигр за последние 40 лет способствовал увеличению населения Индии. Можно, однако, с уверенностью предположить, что оба этих факта имеют лучшие объяснения – как и множество других свидетельств, которые нельзя объяснить данными теориями каузальности.
Кроме того, я глубоко убежден, особенно с учетом способности компьютеров вести поиск среди огромных объемов данных и строить графики, что буквально ничего не стоит найти миллионы показателей с высокой степенью корреляции, не имеющих ни малейшей причинной обусловленности. Ниже приводится знаменитый график, где число фильмов, в которых Николас Кейдж снялся в определенные годы, коррелирует с количеством американцев, утонувших вследствие падения в бассейн.
Пример с Николасом Кейджем и утопленниками абсурден, но весьма показателен: при взгляде на любой подобный график очень легко предположить, не потрудившись вникнуть в детали, что две представленные на нем переменные должны быть связаны, просто потому что они таковыми выглядят. Визуальный образ оказывает мгновенное и мощное воздействие: вы видите только то, что вас хотят заставить увидеть, не замечая тысячи других факторов, проигнорированных ради обнаружения корреляции.
Вышеприведенные примеры невозможно принять всерьез, однако не придется долго смотреть любой выпуск новостей или изучать информационный ресурс, чтобы понять: если два важных события происходят одно за другим, первое зачастую автоматически трактуется как причина второго. Представьте, что вы читаете эту статью через час после выступления премьер-министра Великобритании.
Разочарование невысокой оценкой перспектив производственного сектора, прозвучавшее в речи премьер-министра, вылилось в резкое падение рынков после ее выступления.
Весьма вероятно, что вовсе не речь премьер-министра стала причиной падения рынков. Рынками управляет множество очень сложных факторов, но статья о них привлечет слишком мало читателей. Допустим теперь, что рынки отыграли назад и стремительно выросли через три часа после этой публикации. Тогда тот же новостной источник заявит:
Несмотря на первоначальное падение, рынки восстановились и продемонстрировали стремительный рост после выступления премьер-министра, вдохновленные ее взвешенной и последовательной политикой в отношении производства.
Может быть, истинность этого умозаключения более вероятна, чем предыдущего? Да ничего подобного. Перед нами жонглирование словами на основе чрезмерно упрощенного и крайне избирательного восприятия сложной ситуации. Однако подобные словесные упражнения бывают намного более убедительными, чем попытка тщательно описать реальное положение дел.
Обучение с умом: когда корреляция не означает каузальности
Зачастую каузальность путают с корреляцией. Это весьма распространенная ошибка: на основе наблюдений над двумя переменными, которые ведут себя очень похоже, или при сопоставлении событий, следующих вплотную одно за другим, делается вывод, что одно является причиной другого. Прежде чем выдвинуть предположение о наличии причинной обусловленности, убедитесь, что вы рассмотрели и отвергли все прочие возможности.
1. Третий фактор
: одна из самых распространенных ошибок в восприятии корреляции возникает, когда скрытой причиной двух явлений, кажущихся тесно взаимосвязанными, является какой-либо третий фактор. Например, стоимость вашего автомобиля и размер дома могут иметь близкую корреляцию, но это не означает, что одно обусловлено другим. Скорее всего, обе эти характеристики зависят от третьего, обусловливающего их фактора – уровня вашего благосостояния.