Даже для читателей, совсем не владеющих математическим языком, можно сделать несколько интересных замечаний об уравнении (2). Первое и самое важное: в нем нигде нет переменной
К этому моменту, я уверен, многие читатели гадают, насколько этот вымышленный сценарий близок к реальности. Неужели жаркий спор о курении и раке разрешился благодаря одной работе на основе наблюдений и одной каузальной диаграмме? Если мы предположим, что рис. 41 точно отражает причинностный механизм возникновения рака, ответом будет абсолютное «да». Однако то, насколько наши допущения справедливы для реального мира, требует дополнительного обсуждения.
Дэвид Фридман, мой старый друг, занимающийся статистикой в Калифорнийском университете в Беркли, серьезно раскритиковал меня по этому вопросу. Он утверждает, что модель на рис. 41 нереалистична по трем причинам. Во-первых, если ген курильщика» существует, он должен влиять и на то, как тело избавляется от чужеродных веществ в легких, и, таким образом, люди с этим геном будут более склонны к возникновению отложений смол, а люди, лишенные его, — более устойчивы к нему. Поэтому он бы нарисовал стрелку от гена курильщика к смоле, и в этом случае формула парадного входа окажется непригодной. Фридман считает также маловероятным, чтобы курение влияло на возникновение рака только через отложения смол. С уверенностью можно предположить и другие механизмы: не исключено, что курение ведет к хроническому воспалению, которое, в свою очередь, способствует развитию рака. Наконец, говорит он, отложения смол в легких живого человека все равно нельзя измерить со сколь-либо приемлемой точностью, поэтому предложенную мной работу на основе наблюдений не провести в реальном мире.
Я не возражаю против критики Фридмана в этом конкретном примере. Я не специалист по раку, и мне всегда придется оставлять на усмотрение эксперта в данном вопросе, насколько подобная диаграмма адекватно отражает процессы, происходящие в реальном мире. На самом деле одно из самых значительных достижений метода каузальных диаграмм в том, что они делают допущения прозрачными и открытыми для обсуждения экспертами и политиками.
Тем не менее цель моего примера была не в том, чтобы предложить новый механизм для воздействия курения на организм, а в том, чтобы продемонстрировать, как математика в определенной ситуации способна устранить воздействие конфаундеров, даже если данных по самому конфаундеру нет. Подобную ситуацию легко распознать. В ситуациях, когда каузальное воздействие
К счастью, достоинства поправок парадного входа не остались не оцененными. В 2014 году Адам Глинн и Константин Кашин, оба политологи из Гарварда (Глинн впоследствии перешел в Университет Эмори), написали получившую премию работу, которую следовало бы сделать обязательным чтением для всех ученых, занимающихся исчислениями в области общественных наук. Они применили новый метод к массиву данных, ранее тщательно изученных представителями общественных наук, — исследованию по Закону о партнерстве в области профессиональной подготовки (
Рис. 42. Базовые условия для применения критерия парадного входа