Подход учебников по статистике к вмешивающимся переменным совершенно иной, он опирается на идею, наиболее активно защищаемую Р. Э. Фишером: рандомизированное контролируемое исследование. Ученый был совершенно прав в этом подходе, но не в его основаниях. РКИ — это действительно замечательное изобретение, но до недавнего времени поколения статистиков, следуя за Фишером, неспособны были доказать, что то, что они получали благодаря РКИ, было именно тем, что они хотели получить. У них не было языка, с помощью которого можно было бы записать то, что они хотели найти, а именно каузальное воздействие
Эта глава также покажет, что каузальные диаграммы позволяют переключаться с конфаундеров на деконфаундеры (
Это переключение внимания — основной путь, по которому Революция Причинности позволяет нам продвинуться дальше фишеровских экспериментов и выявить причинно-следственные связи из неэкспериментальных исследований. С помощью него реально определить, какие переменные должны быть скомпенсированы, чтобы стать деконфаундерами. Этот вопрос десятилетиями терзал как теоретиков, так и практиков статистики; десятилетиями здесь скрывалась ахиллесова пята всей отрасли знания. Так происходило потому, что он не имеет никакого отношения ни к данным, ни к статистическим методам. Конфаундеры — это причинностная концепция, она находится на второй ступени Лестницы Причинности.
Графические методы, возникнув в 90-е годы прошлого века, полностью упростили проблему конфаундеров. В частности, скоро мы познакомимся с методом критерия черного хода, который недвусмысленно определяет, какие переменные в каузальной диаграмме являются деконфаундерами. Если исследователь в состоянии получить данные по этим переменным, он может скорректировать их влияние и предсказать результаты действия, даже не осуществляя его.
На самом деле Революция Причинности идет дальше. В некоторых случаях мы вправе ввести поправку по конфаундерам даже тогда, когда у нас нет данных по достаточному массиву деконфаундеров. В этих случаях целесообразно использовать другие формулы корректировки — не общепринятые, которые работают только с критерием черного хода — и убрать всю систематическую ошибку. Эти впечатляющие разработки мы прибережем для главы 7.
Хотя вмешивающиеся переменные известны очень давно во всех областях науки, понимание, что эта проблема требует каузальных, а не статистических решений, пришло относительно недавно. Даже совсем недавно, в 2001 году, рецензенты отклонили мою статью, настаивая на том, что «проблема вмешивающихся переменных целиком лежит в плоскости традиционной статистики». К счастью, за последнее десятилетие число таких редакторов резко сократилось. Теперь образовался практически всеобщий консенсус, по крайней мере среди философов, эпидемиологов и представителей общественных наук, в том, что: 1) проблема конфаундеров нуждается в каузальном решении и такое решение есть; 2) каузальные диаграммы — это полный и систематический метод для нахождения таких решений. Эпоха сложностей с конфаундерами подошла к концу!
Леденящий ужас конфаундеров
В 1998 году в статье, опубликованной в «Медицинском журнале Новой Англии», сообщалось, что обнаружена связь между регулярными занятиями спортивной ходьбой и снижением смертности среди мужчин-пенсионеров. Исследователи использовали данные программы «Здоровье сердца» в Гонолулу, которая наблюдала за здоровьем 8 тысяч мужчин японского происхождения с 1965 года.
Исследователи во главе с Робертом Эбботом, специалистом по биологической статистике, хотели выяснить, живут ли дольше мужчины, занимающиеся физкультурой более регулярно. Они взяли выборку в 707 человек из более крупной группы в 8 тысяч, в которой все были достаточно здоровы физически для пеших прогулок. Группа Эббота выяснила, что за 12-летний период уровень смертности был в два раза выше среди мужчин, которые в день проходили менее мили (далее «малоходящие») по сравнению с теми, кто проходил больше 2 миль в день («многоходящие»). Точнее, среди малоходящих умерло 43,0 %, в то время как среди многоходящих — только 21,5 %.