Самое интересное, что далеко не факт, что непараметрические методы, применённые на нормальных выборках, покажут исследователю какой-то сущий бред. Есть такой термин, чувствительность теста
. Определение этого термина интуитивно понятно: то, насколько тот или иной критерий чувствителен к выявлению различий. Забавный факт в том, что непараметрические методы будут также чувствительны и на нормальных выборках, но чувствительность параметрических методов на таких выборках будет больше. Верно и обратное, хотя параметрика показывает себя на ненормальных распределениях куда хуже.Кто не рискует, тот не пьёт лекарства
Очень часто в медицинских исследованиях можно увидеть такие непонятные аббревиатуры, как OR и RR. После этого обычно идут какие-то непонятные числа, потом какая-то непонятная аббревиатура CI, а потом ещё какие-то числа… Что это такое и что с этим делать, как оно вписывается в наши представления о статистике?
Дело в том, что в медицине очень важно оценивать риски. Врачи делают это регулярно. Да даже если вы возьмёте в руки инструкцию к какому-то препарату, в очень многих случаях вы сможете увидеть фразу: «…если вероятная польза от лечения превышает возможный риск…» Чаще всего эту фразу можно встретить в разделе инструкции, посвящённом применению препарата беременными женщинами. Ведь некоторые лекарства могут быть опасны для плода, как мы с вами знаем на примере талидомида, поэтому существуют специальные категории, которые определяют класс опасности лекарства для плода.
Риск – это тоже своего рода вероятность. Только в данном случае, как правило, подразумевается что-то не очень хорошее, например наступление болезни или её осложнения. Как и любая другая вероятность, риск принимает значения от нуля до единицы. Под нулём понимают такой исход, когда условная болезнь ни при каких условиях не наступает. Если же риск равен единице, то болезнь наступает всегда, во всех случаях. В медицинских исследованиях оценка рисков позволяет, например, определять, насколько применение лекарств безопасно в тех или иных случаях.
Относительный риск в русскоязычной литературе обычно сокращается до ОР (но не следует путать с
Тогда относительный риск легко найти по такой формуле:
После того, как мы нашли значение относительного риска, нужно ещё найти границы так называемого 95 % доверительного интервала (в русскоязычной литературе сокращается до ДИ, а в англоязычной – до CI от confidence interval). Доверительный интервал на определённом уровне (в нашем случае – 95 %) означает, что с определённой вероятностью (в нашем случае – 95 %) значения исследуемой нами величины (в нашем случае – относительного риска) попадут в посчитанный диапазон. Доверительные интервалы рассчитываются по более сложным формулам, которые имеют отдельный вид для верхней и нижней границы интервала соответственно. Любая программа для обработки данных, однако, посчитает вам доверительный интервал в два счёта, поэтому я не буду приводить эти формулы. В нашем случае верхняя граница получится равной примерно 2.54, а нижняя – примерно 1.57.
Итак, относительный риск получился равен 2. Это позволяет вам сделать вывод о том, что поедание марсианской голубики увеличивает частоту неблагоприятных исходов, грубо говоря, есть эту голубику опасно для здоровья. Так как и нижняя, и верхняя граница доверительного интервала больше единицы, можно сказать, что на уровне значимости
Хорошо, с RR стало понятно, а что же такое OR? Это тоже риск? Нет, OR – это сокращение от odds ratio, или отношение шансов (ОШ). Это тоже статистический показатель, он довольно тесно связан по смыслу с риском, так как также используется для оценки связи между фактором риска и каким-либо исходом. С его помощью можно сравнивать группы пациентов по частотам проявления какого-то интересующегося нас фактора риска. Если грубо, то отношение шансов – это то, насколько присутствие или отсутствие голубики в рационе связано с развитием неблагоприятных исходов в какой-то из групп. В нашем случае отношение шансов можно будет посчитать следующим образом: