Как и раньше, данные (рис. 47 [a]) не скажут вам, кому верить, — именно к такому выводу приходят Вайнер и Браун. Однако диаграмма причинности (рис. 47 [
На этой диаграмме
Подводя итог, скажем, что для нас главный урок парадокса Лорда в том, что он не более парадоксален, чем парадокс Симпсона. В одном из них ассоциация становится обратной, а в другой исчезает. И в обоих случаях диаграмма причинности подскажет, какую процедуру нужно использовать. Однако статистикам, обученным «традиционной» (т. е. не учитывающей модели) методологии и избегающим оптики причинности, представляется глубоко парадоксальным тот факт, что вывод, верный в одном случае, будет неверным в другом, при том, что данные выглядят совершенно одинаково.
Теперь, хорошо проработав коллайдеры, осложнители и опасности, которыми они грозят, мы наконец-то готовы пожать плоды нашего труда. В следующей главе мы начнем подъем по Лестнице причинности, начав со второго уровня — интервенции.
Рис 47. Обновленная версия парадокса Лорда по Вайнеру и Браун и соответствующая диаграмма причинности.
Глава 7. За пределами поправок: покорение горы интервенции
В этой главе мы, наконец, храбро предпримем восхождение на второй уровень Лестницы Причинности, уровень интервенций — святой Грааль каузального мышления с древнейших времен до наших дней. Этот уровень задействован в попытках предсказать эффекты еще не испытанных действий и стратегий, от способов лечения до социальных программ, от экономической политики до личного выбора. Конфаундеры были основным препятствием, заставлявшим нас путать
Однако не во всех случаях эти пути доступны, поэтому опытному скалолазу эта глава предоставляет универсальный инструмент картирования, так называемое
Самый простой путь: формула поправки черного хода
Для многих исследователей самый (или единственный) известный метод предсказания эффектов интервенции — поправки по конфаундерам по соответствующей формуле. Этот метод разумно использовать, когда вы уверены, что у вас есть данные по достаточному набору переменных (снимающих осложнения), чтобы заблокировать все черные ходы между интервенцией и результатом. Для этого мы должны измерить средний каузальный эффект интервенции, вначале оценив ее эффект на каждом уровне или страте, снимающих осложнение переменной. Затем мы исчисляем среднее взвешенное этих страт, где каждая из них определена в соответствии со своим распространением в популяции. Если, например, переменная, по которой вводится поправка, — это пол, мы прежде всего оцениваем каузальный эффект для мужских и женских особей отдельно, затем усредняем его, если в популяции, как чаще всего бывает, соотношение полов один к одному. Если соотношения иные, скажем особей мужского пола —, а женского —, тогда для оценки среднего каузального воздействия нужно взять соответствующим образом средние взвешенные.