Однако есть и серьезный недостаток. Для расчета фактора Байеса необходимо знать вероятность наблюдения данных при условии, что верна альтернативная гипотеза. В клинических экспериментах ситуации, похожие на пример с беременностью, возникают редко, и мы неизбежно сталкиваемся с необходимостью определять этот параметр на основе предположений. Это вносит в расчеты ту субъективность, за которую критикуют байесианские методы. Пока их применение в медицинских экспериментах ограниченно, а между сторонниками и противниками идут горячие споры[220]
.Какие бы критерии выбора в пользу нулевой или альтернативной теории мы ни использовали, сам факт признания того, что различия между группами не случайны, содержит мало информации для врачей и не дает достаточно оснований применять метод лечения. Как правило, он ничего не говорит о силе эффекта. Поэтому мало отметить, что различия статистически значимы, важно рассчитать такие показатели, как индекс потенциальной пользы[221]
, показывающий, сколько человек нужно пролечить, чтобы предотвратить один нежелательный исход (например смерть или инфаркт), и индекс потенциального вреда, с помощью которого можно описать распространенность побочных эффектов. В РКИ эти показатели не менее важны, чем в наблюдательных исследованиях.Если мы используем расчет
Доверительные интервалы записывают следующим образом.
В этом случае 7,0 – это нижняя граница доверительного интервала, 13,0 – верхняя, а 95% – значение надежности, для которого рассчитан ДИ. Это результат A на рисунке ниже.
На рисунке изображены результаты двух экспериментов. Если мы ограничимся указанием среднего значения одной цифрой, то результаты A и B будут одинаковы. Различия между группами в обоих случаях 10% и статистически значимы. Однако доверительные интервалы разные: для А (7,0 13.0), для B (0,1 19,9). И если в первом случае мы знаем, что эффект лежит в достаточно узком диапазоне 7–13% и наверняка имеет клиническое значение, то во втором он может быть ничтожно мал (как, впрочем, и очень велик), поэтому нужны дальнейшие эксперименты. Они помогут сузить доверительный интервал и получить более точное представление о диапазоне, в котором лежит размер наблюдаемого эффекта.
В восьмидесятые годы прошлого века специалисты по статистике провели вполне успешную кампанию за обязательное использование доверительных интервалов либо вместо расчета
Разобрать в рамках этой главы все возможные способы провести клиническое испытание и проанализировать его результаты неправильно – абсолютно невыполнимая задача. Тем, кто хочет узнать об этом больше, можно посоветовать книгу Триши Гринхалдж[223]
“Основы доказательной медицины” – она опубликована на русском языке. А мы поговорим еще об одной проблеме, приводящей к катастрофическим последствиям: результаты многих клинических экспериментов остаются практически никому не известными.Последнее решение
В 1980 году группа британских врачей провела испытание антиаритмического препарата лоркаинид у пациентов с инфарктом миокарда. В то время считалось, что, поскольку аритмия – одна из причин гибели после инфаркта, антиаритмические препараты должны повышать выживаемость пациентов. Из 49 пациентов в группе лоркаидина погибло 9, тогда как в группе плацебо – только один из 47. Поскольку фармкомпания решила не выводить препарат на рынок по причинам, не связанным с результатами этого исследования, они так и не были опубликованы. Как написал позже один из участников исследовательской группы: “Мы утратили интерес… и забыли об этом”.