Комиссия работала над отчетом больше года, и одной из самых больших проблем для нее оказалось слово «причина». Членам комиссии пришлось отказаться от детерминистских концепций причинности родом из XIX века, а также отложить в сторону статистику. Как они (вероятно, Кохран) писали в отчете, «статистические методы не могут доказать существование причинно-следственных отношений в ассоциации. Каузальное значение ассоциации — это вопрос суждения, которое выходит за рамки любой оценки статистической вероятности. Чтобы судить о каузальной значимости ассоциации между признаком, или агентом, и заболеванием, или воздействием на здоровье, нужно использовать целый ряд критериев, ни один из которых не является необходимым и достаточным основанием для такого суждения». Комиссия использовала пять таких критериев: согласованность (многие исследования в различных популяциях показывают похожие результаты); сила ассоциации (включая эффект «доза — ответ»: большее потребление табака ведет к большему риску); специфичность ассоциации (конкретный агент должен производить конкретный эффект, а не длинный список разных эффектов); временные отношения (эффект должен следовать за причиной); непротиворечивость (биологическая правдоподобность и согласованность с другими типами доказательств, такими как лабораторные эксперименты и временные ряды).
В 1965 году Остин Бредфорд Хилл, не состоявший в комиссии, попытался просуммировать эти аргументы таким образом, чтобы их можно было применять к другим проблемам общественного здоровья, и добавил к списку еще четыре критерия: в результате весь список из девяти критериев стал известен как «критерии Хилла». На самом деле Хилл называл их позициями, не требованиями, и подчеркивал, что каждая из них может отсутствовать в конкретном случае: «Ни одна из девяти моих позиций не может дать неопровержимого доказательства или опровержения гипотезы причинно-следственной связи, и ни одна не является обязательным условием», — писал он.
Действительно, несложно найти аргументы против каждого из критериев как из списка Хилла, так и из более короткого списка экспертной комиссии. Согласованность сама по себе ничего не доказывает: если 30 исследований игнорируют один и тот же конфаундер, все они легко могут оказаться со смещенной оценкой. Сила ассоциации уязвима по той же причине; как упоминалось ранее, размер обуви детей сильно коррелирует с их умением читать, но не связан с ним каузально. Специфичность всегда была особенно противоречивым критерием. Она имеет четкий смысл в контексте инфекционных болезней, когда один возбудитель, как правило, вызывает одно заболевание, но уже сильно размыта в случае средовых влияний. Курение повышает риск целого ряда других недугов, таких как эмфизема и сердечно-сосудистые заболевания. Снижает ли это надежность данных, что оно вызывает рак? Временная связь тоже не лишена исключений, например, рассвет наступает не из-за пения петуха, хотя петух поет всегда перед рассветом.
Наконец, согласованность с известными теориями и фактами, конечно, желательна, но в истории науки масса опровергнутых теорий и ошибочных лабораторных открытий.
Положения Хилла все еще полезны в качестве описания того, как научная дисциплина подходит к принятию каузальной гипотезы, используя различные типы подтверждений, но методология, которая позволила бы их применять, отсутствует. Так, биологическое правдоподобие и согласованность с экспериментальными данными, вероятно, хорошие, нужные вещи. Но как именно нам следует определять вес подобных подтверждений? Как именно мы вставим имевшиеся ранее знания в новую картину? Очевидно, на эти вопросы каждый ученый должен отвечать самостоятельно. Однако интуитивные решения могут быть ошибочными, особенно если в игру вступают политическое давление, финансовые выгоды или же если исследователь находится в зависимости от вещества, которое изучает.
Конечно, ни один из этих комментариев не предполагал хоть в чем-то принизить работу комиссии. Ее состав сделал все возможное в условиях отсутствия механизмов для обсуждения причинности. Их вывод о том, что нужны и нестатистические критерии, был огромным шагом вперед, а сложные личные решения, принятые курящими членами комитета, подтвердили серьезность их заключений. Лютер Терри, куривший сигареты, перешел на трубку. Леонард Шуман объявил, что бросает курить. Уильям Кохран признал, что, бросив курить, снизил бы риск заболеть раком, но чувствует, что ощущение комфорта, которое доставляют сигареты, оправдывает риск. Печальнее всего было то, что у Луиса Физера, выкуривавшего четыре пачки в день, обнаружили рак легких меньше чем через год после отчета. Он писал комиссии: «Вы, вероятно, помните, что, хотя меня и полностью убедили приведенные доказательства, я продолжал много курить во время всей работы комиссии, находя обычные оправдания… Мой собственный случай кажется мне убедительней любой статистики». Потеряв одно легкое, он все-таки бросил курить.