Вот процедурное определение, известное под пугающим названием «несхлопываемость». Оно появилось в статье 1996 года норвежского эпидемиолога Свена Хернберга: «Формально можно сравнить грубый относительный риск и относительный риск после поправок на потенциальные конфаундеры. Наличие разницы означает, что конфаундеры реально присутствуют, и в этом случае следует использовать скорректированную оценку риска. Если разницы нет или она пренебрежимо мала, конфаундеров нет и предпочтительнее использовать грубую оценку». Другими словами, чтобы узнать, есть ли влияние конфаундеров, попробуйте вводить по ним поправки или не вводить; если есть разница, есть и конфаундер. Конечно, Хернберг был далеко не первым, кто предложил такой подход; почти столетие он путал эпидемиологов, экономистов, социологов и до сих царит в некоторых областях практической статистики. Я выбрал определение Хернберга только потому, что он написал об этом неожиданно подробно и в 1996 году, когда Революция Причинности уже шла полным ходом.
Самое популярное из декларативных определений образовалось за некоторый промежуток времени. Альфредо Морабиа, автор книги «История методов и концепций в эпидемиологии», называет его «классическим эпидемиологическим определением конфаундеров» и оно состоит из трех частей. Конфаундером X
(экспериментального воздействия) и Y (результата) называется переменная Z, которая: 1) ассоциирована с X в популяции в целом и 2) ассоциирована с Y среди тех, кто не получал экспериментального воздействия X. В последние годы к этому добавилось третье условие: Z не должно находиться на каузальном пути от X к Y.Обратите внимание, что вся терминология в классической версии (1 и 2) чисто статистическая. В частности, допускается только, что Z
ассоциировано с X и Y, а не является причиной их обеих. Эдвард Симпсон в 1951 году предложил довольно невразумительное условие: «Y ассоциируется с Z среди неэкспонированного». С каузальной точки зрения похоже, что идеей Симпсона было исключить ту часть корреляции Z с X, которая возникает благодаря каузальному воздействию X на Y; другими словами, он хотел сказать, что Z воздействует на Y независимо от его воздействия на X. Единственное, что ему удалось придумать для выражения этого исключения, сосредоточив внимание на контрольной группе (X = 0), было введение поправок по X. Статистический словарь, лишенный слова «воздействие», не оставлял ему возможности сказать это иначе.Вам кажется, что это все сбивает с толку? Так оно и есть. Насколько проще было бы, если бы он мог просто нарисовать каузальную диаграмму, вроде той, что на рис. 26, и сказать «Y
ассоциирована с Z через пути, не проходящие через X». Но у него не было этого инструмента, и он не мог говорить о путях, концепция которых была тогда под запретом.У «классического эпидемиологического определения» конфаундеров есть и другие недостатки, как показывают следующие два примера:
1) X
→ Z → Yи
2) X
→ M → Y↓
Z
В первом примере Z
удовлетворяет условиям (1) и (2), но это не конфаундер. Такие переменные называют медиаторами или опосредующими переменными: они объясняют каузальное воздействие X на Y. Если вы пытаетесь определить каузальное воздействие X на Y, попытка вводить поправки по фактору Z приведет к неудаче. Если брать только тех индивидов как в контрольной, так и в опытной группе, для которых Z = 0, вы полностью блокируете воздействие X, потому что оно работает посредством изменения Z. Из этого вы делаете неверный вывод, что X не влияет на Y. Именно это имел в виду Эзра Кляйн, когда говорил: «Иногда в итоге вы выравниваете выборку как раз по тому фактору, который хотите измерить».Во втором примере Z
— это опосредованная переменная для медиатора M. Статистики очень часто используют опосредованные переменные, когда истинная каузальная переменная не поддается измерению: так, принадлежность к политической партии может быть использована как опосредованная переменная для политических взглядов. Поскольку Z не является точной мерой M, некоторая часть влияния X на Y способна просочиться, если вы вводите поправки по Z. Тем не менее это все еще ошибочно; хотя смещение будет меньшим, чем если вы вводите поправки по M, оно никуда не денется.По этой причине позднее статистики, среди которых стоит отметить Дэвида Кокса с его учебником «Планирование исследований» (1958), предупреждали, что вводить поправки по Z
стоит только в том случае, если вы «заранее имеете серьезные причины предполагать», что на Z не влияет X. Эти «заранее известные серьезные причины» — не что иное, как каузальное допущение. Он добавляет: «Выдвигать такие гипотезы совершенно нормально, однако ученый должен четко осознавать, когда именно к ним апеллировать». Напомню, что это 1958 год, разгар запрета на обсуждение причинности. Кокс открыто говорит, что при введении поправок по конфаундерам вполне допустимо украдкой глотнуть запретного — главное, не говорить об этом святошам. Дерзкое предложение! Я никогда не упускаю случая отдать должное его храбрости.