Читаем Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее полностью

Все значения размеров выборки в следующей таблице зависят от выбранной альтернативной гипотезы с разницей в 15 %. Размеры выборки увеличивались бы и дальше, если бы разработчики хотели обнаружить еще меньшую разницу, и уменьшились бы, если бы хотели найти только большую разницу.

Размер выборки изменяется с мощностью и значимостью


Исследователям часто приходится брать выборку поменьше, чтобы сэкономить время и деньги, из-за чего выбор большей разницы для альтернативной гипотезы становится привлекательным. Но такой выбор сопряжен с высоким риском. Например, разработчики могли бы сократить размер выборки всего до 62 человек (вместо 268), если бы заменили разницу в альтернативной гипотезе на 30 % между двумя группами (а не 15 %).

Но если в действительности приложение дает разницу всего 15 %, с этим меньшим размером выборки они смогут обнаружить такую меньшую разницу только в 32 % случаев! Это меньше, чем изначальные 80 %, и значит, что в 2/3 случаев будет получен ложноотрицательный результат, который не покажет разницу в 15 %. В идеале любой эксперимент нужно разрабатывать так, чтобы обнаруживать малейшую существенную разницу.

Последнее замечание о p-значениях и статистической значимости: большинство статистиков предостерегают, что нельзя чрезмерно полагаться на p-значения при интерпретации результатов исследования. Неспособность найти значимый результат (достаточно малое p-значение) – это не то же самое, что уверенность в отсутствии эффекта.

Отсутствие доказательств не является доказательством отсутствия.

Точно так же, даже несмотря на то, что исследование могло достичь лишь низкого p-значения, этот результат может быть неприменим, что мы рассмотрим в заключительном разделе.

Статистическую значимость не следует путать с научной, человеческой или экономической значимостью. Даже самый мизерный заметный эффект будет статистически значимым, если размер выборки достаточно велик. Например, если в исследовании сна примет участие достаточное количество людей, вы потенциально обнаружите разницу в 1 % между двумя группами, но будет ли это значимо для покупателей? Нет.

И наоборот, больше внимания стоит обратить на разницу, измеренную в исследовании, вместе с соответствующим доверительным интервалом. Потребители приложения хотят знать не только то, будут ли они лучше спать с ним, чем без него, но и насколько лучше. Возможно, разработчикам даже захочется увеличить размер выборки, чтобы гарантировать определенную погрешность в своих оценках.

Кроме того, Американская ассоциация статистики в одном из выпусков своего журнала за 2016 год подчеркнула, что «научные выводы и деловые или политические решения не должны опираться только на то, преодолевает ли p-значение определенный порог». Слишком большое внимание к p-значению поощряет черно-белое мышление и сокращает до одного числа весь объем информации, полученной из исследования. Такой исключительный фокус заставит вас упустить из виду возможные неоптимальные варианты в проекте исследования (например, размер выборки) или погрешности, которые могли закрасться в него (например, систематическую ошибку отбора).

Получится ли воспроизвести?

Вы уже знаете, что результаты некоторых экспериментов – просто счастливая случайность. Чтобы удостовериться в том, что результат исследования не случаен, его необходимо воспроизвести. Интересно, что в некоторых областях, таких как психология, для воспроизведения положительных результатов предпринимались согласованные усилия, но эти усилия показали, что более 50 % положительных результатов невозможно воспроизвести.

Это низкий показатель и такая проблема с исключительно положительными результатами называется кризисом воспроизводимости. В этом последнем разделе мы предлагаем кое-какие модели, которые объясняют, как это происходит и как все равно получить больше доверия в своей области исследований.

Попытки воспроизведения – это попытки отличить ложноположительные результаты от истинно положительных.

Подумайте, каковы шансы воспроизведения в каждой из этих двух групп. Предполагается, что ложноположительный результат повторится – то есть ожидается получение второго ложноположительного результата при повторном эксперименте – всего в 5 % случаев. С другой стороны, ожидается, что истинно положительный результат повторится в 80–90 % случаев, в зависимости от мощности повторного исследования. Предположим, что это 80 %, как в предыдущем разделе.

Кризис воспроизводимости


Перейти на страницу:

Похожие книги

Принцип сперматозоида
Принцип сперматозоида

По мнению большинства читателей, книга "Принцип сперматозоида" лучшее творение Михаила Литвака. Вообще все его книги очень полезны для прочтения. Они учат быть счастливее и становиться целостной личностью. Эта книга предназначена для психологов, психотерапевтов и обычных людей. Если взять в учет этот факт, то можно сразу понять, насколько грамотно она написана, что может утолить интерес профессионала и быть доступной для простого человека. В ней содержатся советы на каждый день, которые несомненно сделают вашу жизнь чуточку лучше. Книга не о продолжении рода, как может показаться по названию, а о том, что каждый может быть счастливым. Каждый творит свою судьбу сам и преграды на пути к гармонии тоже строить своими же руками. Так же писатель приводит примеры классиков на страницах своего произведения. Сенека, Овидий, Ницше, Шопенгауэр - все они помогли дополнить теорию автора. В книге много примеров из жизни, она легко читается и сможет сделать каждого, кто ее прочитал немножко счастливее. "Принцип сперматозоида" поменял судьбы многих людей.

Михаил Ефимович Литвак

Психология и психотерапия / Психология / Образование и наука
100 секретов счастливой любви
100 секретов счастливой любви

Кто из нас не мечтает о счастливой любви? Но как найти свое счастье и, самое главное, – удержать его? Как не допустить крушения иллюзий и сохранить в душе романтику?Любовные отношения имеют свои законы и правила. Узнав их, вы сможете достичь тончайших оттенков любовных переживаний и избежать разочарований и обид.Рекомендации автора помогут вам понять, чем отличается настоящая любовь от других чувств, обычно за нее принимаемых, на какие отношения претендует ваш избранник, и на что можете рассчитывать вы, как вести себя, чтобы добиться поставленной цели и избежать распространенных ошибок. Умение строить гармоничные отношения с любимыми и близкими – это искусство, которым может овладеть каждый.

Константин Петрович Шереметьев , Константин Шереметьев

Психология и психотерапия / Психология / Образование и наука