Для избегания таких ошибок нужно применять специальные поправки на множественные сравнения. Их существует большое количество, для каждого конкретного случая лучше выбирать определённые поправки вручную с учётом целей исследования и полученных выборок. Самой грубой и простой является поправка Бонферрони, когда новый уровень значимости вычисляется простым делением начального уровня значимости на количество сравнений. То есть в случае с тремя группами (и тремя сравнениями) при уровне значимости 0.05 мы получим: 0.05: 3 = 0.017. Значит, значение
Корреляция
. Существует такое понятие как корреляция, по-простому это как один параметр зависит от другого, и зависит ли вообще, если да, то в какой степени. Например, с увеличением роста, как правило, увеличивается масса тела, следовательно, эти две характеристики коррелируют между собой. Коэффициент корреляции Пирсона используют для того, чтобы описывать количественные признаки, которые подчиняются нормальному распределению. Существует также коэффициент корреляции Спирмена, который используют в тех случаях, когда о распределении ничего неизвестно.Тут только нужно особенно отметить тот факт, что «correlation does not imply causation» – корреляция не подразумевает причинно-следственную связь. Самый, к слову, простой пример может показаться довольно банальным. Некоторые дети, которые совершали жестокие преступления, много смотрели телевизор, очевидно, что телевизионные программы делают детей более жестокими. Но на самом деле всё может быть совсем не так, а может и с точностью до наоборот: возможно, жестоким детям просто нравится смотреть телевизор больше, чем нежестоким.
Ещё один пример – вши[29]
. Сейчас мы осознаём, что вши – это опасные существа, разносящие опасные заболевания, но наши предки из средневековой Европы очень удивились бы такому повороту событий. Европейские аристократы наряду с прочими правилами этикета изучали также правильные по этикету способы избавления от вшей. Многие считали, что вши и вовсе оказывают положительное влияние на здоровье человека, так как у больных людей этих паразитов обнаруживали реже. Предполагали, что болезнь приходила тогда, когда человек избавлялся от вшей, но на самом же деле эти членистоногие просто очень чувствительны к температуре. Таким образом, корреляция «больше вшей – здоровее человек» никак не поможет нам установить причинно-следственную связь, а, может, даже и натолкнёт на неправильные выводы о том, что вши полезны для здоровья.Непараметрические методы
Мы уже примерно поняли, когда нужно использовать параметрические методы. Чем же отличаются от них непараметрические? Например, вам нужно исследовать какой-то признак, который нельзя описать числами, какой-нибудь цвет или признак, который подразумевает дихотомичный ответ «да-нет». Подробнее мы остановимся на критерии Манна-Уитни и его многомерном расширении – критерии Краскела-Уоллиса. Интересно в этих методах то, что они являются ранговыми. Это означает, что каждому результату присваивается определённый «ранг». В итоге мы можем сказать о любых двух значениях только то, что одно из них больше или меньше другого, возможно, эти значения равны. Но мы никогда и ни при каких условиях не сможем сказать, на сколько именно одно значение больше или меньше другого. По факту мы всё начинаем измерять «в попугаях».
Такое упрощение даёт нам возможность вообще не заморачиваться о том, какое у нас получилось распределение, и просто наслаждаться жизнью. Мы вообще не интересуемся какими-то там средними, дисперсиями и прочей чепухой, нас интересует только то, чтобы всё как-то магически обрабатывалось. Как говорил известный английский писатель Артур Кларк: «Любая достаточно развитая технология неотличима от магии». В случае применения непараметрических методов эта фраза – наше жизненное кредо. Современные технологии позволяют нам не корпеть над вычислениями, а решать все вопросы двумя нажатиями клавиш на клавиатуре. Непараметрика на бумаге требовала бы от нас многих шагов, но мы избавились от этого, ещё и считаем «в попугаях», ну не сказка ли?
Использовать непараметрические методы необходимо довольно часто. Взгляните вновь на рис. 7: два из трёх распределений асимметричны, они далеко от нормального. Иногда такое распределение можно наблюдать даже тогда, когда, казалось бы, по всем предсказаниям и предположениям распределение должно соответствовать гауссиане. Но жизнь всегда вносит свои коррективы, поэтому повторюсь: мы не освобождены от проверки на нормальность.