P-значение, пожалуй, основной термин, который нужно знать, чтобы понимать, как используется статистика в современной науке (особенно в медицине и биологии) и что на самом деле означают статистические результаты. Это число настолько важно, что среди биологов популярен тост “Выпьем за то, чтобы наш список публикаций был большим, а P-значения маленькими”.
“Р” в данном случае английская буква “пи”, сокращение от слова
Если вы сравниваете данные по двум популяциям, между ними практически всегда будет какая-то разница. Р-значение говорит вам, какова вероятность, что обнаруженная вами разница – случайность. Чем меньше P-значение, тем вероятнее, что эти две популяции действительно различаются.
Например, вы хотите узнать, помогает ли чеснок от гриппа. После долгих лет наблюдений вы выяснили, что пациенты, принимавшие чеснок, выздоравливали в среднем через 6,5 дня, а те, кто не принимал, – через 6,6. Вы подставляете в формулу количество пациентов в каждой группе и результаты наблюдений. Если получается Р-значение, близкое к единице, значит, наблюдаемая разница – почти наверняка случайность, а если близкое к нулю – почти наверняка нет.
Если разница действительно существует, то чем больше размер выборки, тем меньше получится Р-значение и тем убедительнее будет ваш результат. А если разницы на самом деле нет, то, сколько бы вы ни увеличивали размер выборки, Р-значение будет только расти. Поэтому ученые всегда стремятся к максимальному размеру выборки, чтобы результат оставлял как можно меньше сомнений.
Разумеется, любой исследователь хотел бы получать P-значения, равные нулю, но на практике это удается крайне редко. В биологических исследованиях принято считать достаточно убедительными результаты с Р-значением не больше 0,05. Такие результаты называются
Разных видов крокодиловых было слишком мало, чтобы я мог надеяться получить маленькое P-значение, просто их сравнив. Но мне все равно обязательно надо было попытаться получить хотя бы общие сведения по как можно большему их количеству. Моя теория очень четко предсказывала, каким должно быть соотношение рева и хлопков головой в “песнях” каждого вида-“специалиста”. Мне совершенно не хотелось проработать над доказательством этой теории много лет, опубликовать результаты, а спустя неделю обнаружить, что какой-нибудь редкий африканский крокодильчик делает все наоборот и все мои логические построения неправильны.
Сравнивая животных одного “универсального” вида, живущих в разных местообитаниях, я мог получить большую выборку, но это требовало многих лет работы, потому что брачный сезон у каждого вида длится всего несколько недель. Но тут уж я ничего не мог поделать: мне нужно было маленькое Р-значение.
Больше всего, однако, меня беспокоил растущий список загадок, на которые моя теория не давала ответа. Например, аллигаторы никогда не включали рев и хлопки головой в одну и ту же “песню”, а крокодилы делали это довольно часто. Я не мог придумать никаких возможных объяснений такого различия.