Игры 1–3 взяты из статьи 1993 года под названием «В поисках более ясного определения конфаундеров», написанной Кларис Вайнберг, заместителем начальника Национальных институтов здравоохранения. Она вышла в переходный период между 1986 и 1995 годами, когда статья Гренланда и Робинса уже была доступна, но о каузальных диаграммах еще не было широко известно. Поэтому Вайнберг была вынуждена немало потрудиться, арифметически доказывая взаимозаменяемость в каждом из приведенных примеров. Хотя для передачи обсуждаемых сценариев она и использовала графику, логика диаграмм для различения конфаундеров и переменных, устраняющих осложнения, не применялась. Кроме нее я не знаю никого, кому бы это удалось. Позже, в 2012 году, она стала соавтором дополненной версии статьи, где те же примеры проанализированы с помощью каузальных диаграмм и подтверждено, что все ее выводы 1993 года верны.
В обеих статьях Вайнберг медицинское применение приведенных схем было в выяснении влияния курения (X
) на выкидыши, или «спонтанное прерывание беременности» (Y). В игре 1 фактор A — это нарушения, вызываемые курением; это ненаблюдаемая переменная, потому что мы не знаем, в чем эти нарушения состоят. Фактор B представляет собой историю предыдущих выкидышей. Для эпидемиолога будет большим искушением обратить внимание на число предшествовавших выкидышей и ввести поправку по этой переменной, оценивая вероятность будущих выкидышей. Но в данном случае это как раз неправильно! Поступив так, мы частично деактивируем механизм, по которому действует курение, и, таким образом, истинное влияние курения окажется недооцененным.Игра 2 — более сложная версия, в которой курение разделено между двумя разными переменными: X
показывает, курит ли беременная сейчас (в начале второй беременности), а A — курила ли она во время первой беременности. B и E — скрытые (ненаблюдаемые) нарушения развития, вызываемые курением, D — физиологические причины этих нарушений. Обратите внимание, что эта диаграмма допускает вариант, при котором женщина изменила свое поведение между беременностями, начав или бросив курить, но другие физиологические причины нарушений остаются прежними. Многие эпидемиологи захотят ввести поправки по предшествовавшим случаям выкидышей, но это плохая идея, если одновременно не ввести поправки по курению в предыдущей беременности (A).Игры 4 и 5 взяты из статьи, опубликованной в 2014 году Эндрю Форбсом, биостатистиком из Университета Монаша в Австралии, вместе с несколькими соавторами. Он интересовался влиянием курения на развитие астмы у взрослых. В игре 4 переменная X
— это отношение индивида к курению, Y — болел ли он астмой во взрослом возрасте. Фактор B обозначает заболевание астмой в детском возрасте, и это фактор-коллайдер, потому что на него влияют одновременно A, курение родителей и C — скрытая (и ненаблюдаемая) предрасположенность к астме. В игре 5 у переменных те же значения, но Форбс добавил две стрелки для пущего реализма (смысл игры 4 был только в том, чтобы представить читателям М-образный граф).На самом деле в полной модели Форбса было еще несколько переменных и она выглядела так, как на рис. 27. Обратите внимание, что игра 5 «погружена» в эту модель, в том смысле, что у переменных A, B
, C, X и Y ровно те же взаимоотношения. Следовательно, наши рассуждения остаются верными и в этом случае, и нам следует ввести поправки по A и B или по C, но C — ненаблюдаемая и, следовательно, невыравниваемая переменная. Вдобавок к этому у нас появляются еще четыре вмешивающиеся переменные: D — астма у родителей, E — хронический бронхит, F — пол и G — социально-экономический статус. Читатель для своего удовольствия может самостоятельно вывести, что нам нужно вводить поправки по E, F и G, но не нужно по D. Таким образом, достаточный набор переменных для устранения смещения оценки — это A, B, E, F и G.
Рис. 27. Модель связи курения (X
) и астмы (Y), созданная Эндрю Форбсом
В конце концов Форбс обнаружил, что в необработанных данных у курения есть небольшая и статистически незначимая ассоциация с астмой среди взрослых, а после введения поправок по конфаундерам этот эффект становился еще незаметнее и менее достоверным. Нулевой результат не должен, однако, уводить внимание от того факта, что его статья — модельная работа по «искусному допросу Природы».
И последний комментарий по поводу этих игр: когда переменными становятся такие явления, как курение, выкидыши и т. д., это уже совершенно определенно не игры, а серьезное дело. Я назвал их играми, потому что радость от возможности получить их решение быстро и осмысленно очень похожа на удовольствие, которое ребенок получает, обнаружив, что щелкает как орехи те задачи, что раньше вводили его в ступор.