Задача науки — отставить догадки в сторону и приглядеться к фактам. В 1948 году Долл и Хилл объединили усилия в поисках причин эпидемии рака. Хилл был главным по статистике в очень успешном рандомизированном контролируемом эксперименте, результаты которого были опубликованы ранее в том же году; было доказано, что стрептомицин — один из первых антибиотиков — эффективен против возбудителя туберкулеза. Эта работа, одна из самых значительных вех в истории медицины, не только познакомила врачей с «чудо-лекарствами», но и подкрепила репутацию РКИ, которые вскоре стали стандартом клинических исследований в эпидемиологии.
Рис. 28. Графики потребления сигарет на душу населения в США (черным) и смертности от рака легких среди мужчин (серым) удивительным образом совпадают: кривая раковых заболеваний практически повторяет кривую курения с запаздыванием примерно в 30 лет. Тем не менее это свидетельство не доказывает причинно-следственную связь. На графике отмечены некоторые ключевые даты, в том числе дата публикации статьи Ричарда Долла и Остина Бредфорда Хилла в 1950 году, которая первой привлекла внимание многих профессионалов мира медицины к ассоциации между курением и раком легких (источник: график Маян Харел с использованием данных Американского общества по борьбе с раком, Центра борьбы с заболеваниями и архива Министерства здравоохранения США)
Конечно, Хилл понимал, что РКИ в этом случае провести невозможно, но он знал о преимуществах сравнения опытной группы с контрольной группой. Поэтому он предложил сравнить пациентов, у которых уже диагностировали рак, с контрольной группой здоровых волонтеров. В каждой группе участников опрашивали, выясняя их привычки в прошлом и истории болезней. Чтобы не создавать системной ошибки, проводящим опрос не говорили, у кого из испытуемых есть рак, а у кого нет.
Результаты исследования были шокирующими: из 649 опрошенных пациентов с раком легких все, кроме двоих, курили. Случайность этого была настолько статистически невероятна, что Долл и Хилл не смогли удержаться от того, чтобы ее не подсчитать; 1,5 миллиона к одному. Кроме этого, пациенты с раком легких в среднем были более заядлыми курильщиками, чем входящие в контрольную группу, но (противоречие, которое впоследствии очень педалировал Фишер) меньший процент из них при этом вдыхал дым.
Этот тип исследования сегодня называется «случай — контроль», потому что в нем сравниваются «случай» (люди с заболеванием) и контрольная группа. Это явный прогресс по сравнению с серийными данными за определенное время, потому что специалисты могут вносить поправки по конфаундерам, таким как возраст, пол и испытанное воздействие загрязнений окружающей среды. Тем не менее в дизайне «случай — контроль» есть некоторые очевидные недостатки. Он ретроспективен, это значит, что мы изучаем людей, о которых известно, что у них рак, и обращаем взгляд в прошлое, пытаясь понять, почему он возник. Логика вероятностей также направлена в противоположную сторону. Данные сообщают нам вероятность того, что больные раком в прошлом курили, хотя нас интересует вероятность того, что курящий заболеет раком. Именно эта последняя вероятность имеет значение для человека, которому решать, курить ему или нет.
Кроме этого, в исследованиях типа «случай — контроль» возможно еще несколько источников искажений. Один из них — «ошибка памяти». Хотя Долл и Хилл позаботились о том, чтобы опрашивающие ничего не знали о диагнозах испытуемых, сами пациенты знали наверняка, есть у них рак или нет. Это так или иначе влияло на их воспоминания. Другая проблема — ошибка отбора. Госпитализированные пациенты, больные раком, никоим образом не должны считаться репрезентативной выборкой всей популяции или даже курящей ее части.
Короче говоря, результаты Долла и Хилла были очень наглядны, но все же не могли считаться строгим доказательством того, что курение вызывает рак. Двое исследователей вначале осторожно называли корреляцию связью. Устранив несколько конфаундеров, они осмелились на более уверенное утверждение: курение является фактором, и важным фактором в развитии карциномы легкого.
За несколько последующих лет 19 исследований «случай — контроль», проведенных в различных странах, пришли практически к тому же заключению. Однако, как злорадно указал Р. Э. Фишер, эксперименты с искаженной оценкой ничего не доказывают, даже если повторить их 19 раз, — оценка остается искаженной. В 1957 году Фишер писал, что эти исследования «лишь повторяли свидетельства одного и того же типа, и необходимо попытаться выяснить, достаточно ли свидетельств этого типа для научного заключения».