Во всем этом скрыта еще и очень интересная методологическая проблема. Когда вы планируете провести исследование для определения различий в показателях двух групп пациентов, принимающих различные лекарства, вы делаете так называемый расчет мощностей. С его помощью можно сказать, сколько пациентов вам понадобится для проверки, если вероятность обнаружить 20 %-ю разницу в количестве летальных исходов у пациентов из разных групп при данной ожидаемой частоте смертей у ваших участников составит 80 %. Если исследование проведено и не обнаружено никакой разницы в количестве смертей в группах пациентов, принимавших разные препараты, это значит, что вы не нашли фактов, подтверждающих преимущества одного лечения перед другим.
Это не то же самое, что показать равноценность двух разных препаратов друг другу. Если вы хотите показать, что два лечения эквивалентны, тогда по ряду сложных технических причин (мне нужно где-то провести границу) вам нужно гораздо большее число участников.
Люди об этом часто забывают. Например, исследование INSIGHT было организовано, чтобы проверить, действительно ли нифедипин лучше, чем коамилозид, при лечении высокого кровяного давления. Никаких фактов, подтверждающих это, найдено не было. В то же время в научной статье утверждалось, будто бы эти два лекарства идентичны друг другу, хотя на самом деле это было неправдой.18
Десятки врачей и ученых прислали письма с указанием на ошибку.Состав крови мгновенно реагирует на прием дозы лекарства, а проведение анализа крови — обычная и несложная процедура. Однако пациентов больше интересует избавление от боли и страданий, чем колонки цифр на листке из лаборатории с результатами анализа.
Мы говорили уже об этом в предыдущей главе, но нужно снова и снова повторять это, так как в наших клинических знаниях есть еще очень много пробелов — и их количество нельзя преувеличить — из-за неоправданной, слепой веры в суррогатные критерии эффективности. Было проведено множество исследований для сравнения статинов с плацебо, которые показали, что первые могут достаточно успешно использоваться для предотвращения смертельных случаев. Во время других исследований один статин сравнивался с другим, однако оценка обоих препаратов производилась на основе суррогатных критериев клинической эффективности. Никто еще никогда не сравнивал статины друг с другом по критерию, какой из них лучше спасает от смерти. Это поистине непростительный промах, принимая во внимание то, что десятки миллионов людей по всему миру принимали эти препараты на протяжении многих лет. Если даже один из них предотвращает инфаркты всего лишь на 2 % эффективнее, чем другие, то получается, каждый день сотни людей умирают зря из-за нашего незнания. А этих смертей можно было бы избежать. Десятки миллионов пациентов подвергаются ненужному риску, потому что принимают лекарства, которые не сравнивались должным образом между собой. При этом по каждому из этих пациентов можно получить ценные данные, которые могут быть использованы для формирования новых знаний о том, какое лекарство в целом лучше, при условии проведения систематических рандомизированных исследований, направленных на изучение действия препарата на основные точки клинической эффективности. Обо всем этом вы узнаете больше в следующей главе, где мы будем обсуждать потребность в проведении больших простых исследований, потому что данная проблема не относится к научным. Пациенты лишаются жизни из-за нашего некритичного принятия данных исследований, во время которых не измерялись долгосрочные или основные критерии клинической эффективности.
Иногда использование неверного способа компоновки данных для получения итогового эффекта от лечения может привести к искажению результатов. Например, просто сдвинув пороговые отметки вправо, можно превратить незначительный положительный эффект от лекарства в значимый, завышая его эффективность. А при группировке нескольких положительных свойств препарата, воздействующих на разные параметры организма, в одно для получения «совокупного результата» можно разбавить данные по вредным эффектам или сделать так, чтобы ненужные свойства лекарства, воздействующие на параметры организма, не представляющие интереса, создали впечатление, будто наблюдается улучшение по целому ряду точек клинической эффективности.
Даже если вы собираете абсолютно истинные итоговые данные по основной точке клинической эффективности лекарства, то неправильно выбранный способ, при помощи которого вы сводите эти данные в течение исследования, может исказить общую картину. Приведу сначала несколько простых примеров, как это делается, а затем несколько более сложных.