Читаем Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее полностью

Таким образом, для 50 % воспроизведения требуется, чтобы около 60 % исследований были истинно положительными, а 40 % – ложноположительными. Чтобы было понятнее, представьте 100 экспериментов: если 60 дадут истинно положительный результат, 48 из них должно быть можно воспроизвести (80 % от 60). Из оставшихся 40 ложноположительных результатов будут воспроизведены 2 (5 % от 40), чтобы в общей сложности получилось 50. Тогда уровень воспроизводимости будет 50 на 100 экспериментов, или 50 %.

Получается, в этом сценарии около четверти неудачных воспроизведений (12 из 50) будут объясняться недостатком мощности усилий для воспроизведения. Это реальный результат, который, скорее всего, будет воспроизведен успешно при проведении дополнительного исследования, или получился бы, если бы у первоначального воспроизведения была более крупная выборка.

Остальные результаты, которые не получилось воспроизвести, изначально и не должны были быть положительными. Многие из этих первоначальных исследований, вероятно, недооценили частоту ошибки типа I и повысили шансы получить ложноположительный результат. Это связано с тем, что при планировании исследования с 5 % шансом ложноположительного результата этот шанс применяется только к одной статистической проверке, но крайне редко такая проверка проводится всего один раз.

Проведение дополнительных проверок для поиска статистически значимых результатов имеет много названий, включая прочесывание, выуживание данных или p-взлом (попытка взломать данные в поисках достаточно малых p-значений). Часто это делается из лучших побуждений, потому что наблюдение за данными эксперимента воодушевляет и побуждает исследователя формировать новые гипотезы. Соблазн проверить дополнительные гипотезы велик, так как необходимые для их анализа данные уже собраны. Однако проблема возникает, когда исследователь преувеличивает результаты этих дополнительных испытаний.

Комикс XKCD[67], приведенный ниже, показывает, чем может обернуться выуживание данных: не найдя никакой статистически значимой связи между карамельками и прыщами, ученые продолжили прочесывать двадцать одну подгруппу, пока не нашли одну с существенно низким p-значением, из-за чего появился заголовок: «Прыщи появляются от зеленых карамелек!»



Каждый раз, когда проводилась очередная статистическая проверка, шанс сделать ошибочный вывод продолжал расти выше 5 %. Чтобы было понятнее, предположим, что у вас есть кубик с 20 гранями. Шансы сделать ошибку при первой проверке будут такими же, как шансы выбросить единицу. Каждый дополнительно проведенный тест будет еще одним броском кубика, каждый с новым шансом 1 к 20 выбросить единицу. После 21 броска (в соответствии с 21 цветной карамелькой в комиксе) будет шанс примерно 2/3, что единица выпала как минимум однажды, то есть был как минимум один ошибочный результат.

Если выуживание данных такого типа проводится достаточно часто, становится понятно, почему так много исследований, подлежащих воспроизведению, изначально бывают ложноположительными. Другими словами, в этом наборе из ста исследований базовый процент ложноположительного результата, скорее всего, был намного больше 5 %, поэтому значительную часть кризиса воспроизводимости можно объяснить ошибкой базового процента.

К сожалению, исследования с большей вероятностью опубликуют, если в них будут статистически значимые результаты, что приводит к искажению публикации. Исследования, которые не смогли показать статистически значимые результаты, все еще имеют научную значимость, но как сами ученые, так и издания предвзято относятся к ним по ряду причин. Например, в журнале ограничено количество страниц, и, выбирая между двумя исследованиями, редактор всегда отдаст предпочтение значимым результатам. Успешные исследования чаще привлекают внимание СМИ и научного сообщества. Вероятнее, что они также сильнее повлияют на карьеру исследователей.

Все эти факторы являются сильным стимулом к получению значительных результатов экспериментов. В комиксе, несмотря на то что первоначальная гипотеза не показала значимого результата, эксперимент был «спасен» и в конечном итоге опубликован, потому что нашлась второстепенная гипотеза, показавшая значимый результат.

Публикация ложноположительных результатов вроде этого напрямую способствует кризису воспроизводимости и задерживает научный прогресс, направляя будущие исследования к этим ложным гипотезам.

Так же как и замалчивание отрицательных результатов. Это приводит к тому, что разные люди проверяют одну и ту же ложную гипотезу снова и снова, потому что никто не знает, что ее уже проверили другие.

Перейти на страницу:

Похожие книги

Принцип сперматозоида
Принцип сперматозоида

По мнению большинства читателей, книга "Принцип сперматозоида" лучшее творение Михаила Литвака. Вообще все его книги очень полезны для прочтения. Они учат быть счастливее и становиться целостной личностью. Эта книга предназначена для психологов, психотерапевтов и обычных людей. Если взять в учет этот факт, то можно сразу понять, насколько грамотно она написана, что может утолить интерес профессионала и быть доступной для простого человека. В ней содержатся советы на каждый день, которые несомненно сделают вашу жизнь чуточку лучше. Книга не о продолжении рода, как может показаться по названию, а о том, что каждый может быть счастливым. Каждый творит свою судьбу сам и преграды на пути к гармонии тоже строить своими же руками. Так же писатель приводит примеры классиков на страницах своего произведения. Сенека, Овидий, Ницше, Шопенгауэр - все они помогли дополнить теорию автора. В книге много примеров из жизни, она легко читается и сможет сделать каждого, кто ее прочитал немножко счастливее. "Принцип сперматозоида" поменял судьбы многих людей.

Михаил Ефимович Литвак

Психология и психотерапия / Психология / Образование и наука
100 секретов счастливой любви
100 секретов счастливой любви

Кто из нас не мечтает о счастливой любви? Но как найти свое счастье и, самое главное, – удержать его? Как не допустить крушения иллюзий и сохранить в душе романтику?Любовные отношения имеют свои законы и правила. Узнав их, вы сможете достичь тончайших оттенков любовных переживаний и избежать разочарований и обид.Рекомендации автора помогут вам понять, чем отличается настоящая любовь от других чувств, обычно за нее принимаемых, на какие отношения претендует ваш избранник, и на что можете рассчитывать вы, как вести себя, чтобы добиться поставленной цели и избежать распространенных ошибок. Умение строить гармоничные отношения с любимыми и близкими – это искусство, которым может овладеть каждый.

Константин Петрович Шереметьев , Константин Шереметьев

Психология и психотерапия / Психология / Образование и наука