Следует помнить также, что поправки, основанные на регрессии, работают только для линейных моделей, что означает значительные допущения при выборе модели. В случае линейных моделей мы теряем возможность передавать нелинейные взаимодействия, например, когда воздействие
Подводя итоги, отметим, что формула поправок черного хода и критерий черного хода как две стороны одной монеты. Критерий черного хода сообщает нам, какие переменные следует использовать, чтобы снять осложнения. Формула поправок непосредственно снимает их. В простейшем случае линейной регрессии коэффициенты частичной регрессии осуществляют поправку черного хода имплицитно. В непараметрических случаях нам придется выполнять поправки эксплицитно либо с помощью формулы поправок черного хода прямо с исходными данными, либо с какой-либо их экстраполированной версией.
Вы могли подумать, что наше восхождение на гору Интервенцию на этом закончилось полнейшим успехом. Однако, к сожалению, поправки не работают совсем, если имеется путь через черный ход, который мы не в состоянии заблокировать, потому что у нас нет требующихся для этого данных. Однако даже в этом случае мы можем использовать определенные приемы. Далее я расскажу вам об одном из моих любимых методов, называемом поправкой парадного входа. Хотя он был описан более 20 лет назад, только горстка исследователей за это время воспользовалась этой короткой дорогой на гору Интервенцию, и я убежден, что его потенциал еще предстоит раскрыть.
Критерий парадного входа
Дебаты о каузальном воздействии курения происходили по крайней мере за два поколения до того, как каузальные диаграммы могли бы в них поучаствовать. Мы уже рассмотрели, как неравенство Корнфилда помогло уверить исследователей, что ген курильщика, или конституциональная гипотеза, — очень неправдоподобное предположение. Однако более радикальный подход с использованием каузальных диаграмм пролил бы больше света на гипотетический ген и, вероятно, полностью исключил его из дальнейшего обсуждения.
Рис. 41. Гипотетическая каузальная диаграмма для связи курения и рака легких, подходящая для поправок парадного входа
Предположим, что исследователи прошлого смогли измерить отложения смол в легких курильщиков. Еще в 1950-х это называлось в качестве одной из промежуточных стадий в развитии рака легких. Предположим также, что мы, совсем как министр здравоохранения, хотим исключить гипотезу Р. Э. Фишера о том, что ген курильщика является конфаундером по отношению к привычке курить и раку легких. Тогда ситуацию выше описывает каузальная диаграмма на рис. 41.
Рисунок 41 включает два очень важных допущения, которые будут важны для целей нашего примера. Первое: ген курильщика не оказывает никакого воздействия на формирование отложений смол, которые зависят исключительно от физического действия сигаретного дыма (это допущение отражено на схеме отсутствием стрелки между геном курильщика и смолой; оно, однако, не исключает случайные факторы, не имеющие отношения к гену курильщика). Второе значительное допущение состоит в том, что курение ведет к раку только через накопления отложений смол. Таким образом, на схеме нет прямой стрелки от курения к раку и нет также других непрямых путей.