Однако если бы та же диаграмма была сделана как диаграмма причинности, то и замысел, который лежал бы в ее основе, и пути интерпретации изменились бы. На этапе создания нужно рассмотреть каждую переменную, скажем С
, и спросить себя, какие другие переменные она «слушает», прежде чем выбрать значение. Цепочка A → B → C означает, что B слушает только A, C слушает только B и A не слушает; т. е. она определяется внешними силами, которые не входят в нашу модель.Эта метафора слушания обобщает все знания, которые передает причинная сеть; остальные можно вывести, иногда для этого понадобятся данные. Обратите внимание, что, если мы изменим порядок стрелок в цепочке, таким образом получив A ← B ← C
, причинное прочтение структуры резко изменится, но условия независимости останутся прежними. Отсутствие стрелки между A и C по-прежнему будет означать, что A и C независимы, если нам известно значение B, как в исходной цепочке. Из этого вытекают два чрезвычайно важных следствия. Во-первых, причинные допущения не изобретаются по нашей прихоти; они подвергаются тщательной проверке данными и могут быть сфальсифицированы. Например, если наблюдаемые данные не показывают, что A и C являются независимыми при наличии B, то мы вправе с уверенностью сделать вывод, что модель цепочки несовместима с данными и ее необходимо отбросить (или исправить). Во-вторых, графические свойства диаграммы определяют, какие модели причинно-следственных связей различают по данным, а какие навсегда останутся неразличимыми, независимо от объема данных. Так, мы не в состоянии отличить вилку A ← B → C от цепочки A ← B ← C только по данным, потому что две диаграммы подразумевают одинаковые условия независимости.Еще один удобный способ осмыслить каузальные модели — представить их в виде гипотетических экспериментов. Каждую стрелку можно считать утверждением об итоге гипотетического эксперимента. Стрелка от А
к С означает, что если мы в силах повлиять только на А, то будем ожидать, что вероятность С изменится. Отсутствующая стрелка от А к С означает, что в том же эксперименте мы не увидим изменений в С, если сохраним родителей С неизменными (другими словами, В в примере выше). Обратите внимание на то, что в первом случае мы рассуждали в терминах вероятности («если нам известно значение В»), а теперь в терминах причинно-следственных связей («если мы сохраним В неизменным»), а это подразумевает, что мы физически оградим В от изменений и отключим стрелку от А к В.Причинные рассуждения, необходимые для создания каузальной сети, конечно же, дадут результат, расширив группу вопросов, на которые она может ответить. В то время как байесовская сеть способна всего лишь рассказать, насколько вероятно одно событие, если мы наблюдаем другое (информация первого уровня), диаграммы причинности в состоянии ответить на вопросы об интервенции и контрфактивные вопросы. Например, вилка A ← B → C
однозначно сообщает нам, что, если «пошевелить» А, это не окажет никакого эффекта на С, каким бы интенсивным ни было шевеление. Однако байесовская сеть не рассчитана на учет шевелений и не позволяет увидеть разницу между наблюдением и действием или в самом деле отличить вилку от цепочки. Другими словами, и вилка, и цепочка показали бы, что наблюдаемые изменения в А ассоциируются с изменениями в С, не давая предсказаний об эффекте воздействия на А.Теперь мы переходим ко второму, возможно, более важному эффекту байесовских сетей на причинный вывод. Открытые нами отношения между графической структурой диаграммы и данными, которые она представляет, теперь помогают нам моделировать шевеления, не делая этого физически. В частности, последовательно используя обусловливание, мы предскажем эффект действий или интервенций, не проводя собственно эксперимент. Чтобы это продемонстрировать, снова рассмотрим причинную вилку A ← B → C
, для которой мы сочли корреляцию A и C ложной. Это реально подтвердить экспериментом, в котором мы шевелим A и не находим корреляции A и C. Но можно все сделать лучше. Для этого нужно попросить диаграмму эмулировать эксперимент и сказать нам, способно ли ограничение по определенному параметру воспроизвести корреляцию, которая будет преобладать в эксперименте. Ответ последует положительный: «Корреляция между А и С, измеренная после ограничения по В, окажется равной корреляции, которую мы увидим в эксперименте». Эту корреляцию можно оценить, использовав данные, и в приведенном случае она будет нулевой, что адекватно подтверждает наш интуитивный вывод: пошевелив А, мы не окажем никакого воздействия на C.