Читаем Голая статистика. Самая интересная книга о самой скучной науке полностью

Голая статистика. Самая интересная книга о самой скучной науке

Допустим, что в результате проведения простого экзитпола репрезентативной выборки из 500 избирателей выяснилось, что 53 % проголосовали за кандидата от республиканцев, 45 % – за кандидата от демократов и 2 % поддержали независимого кандидата. Если использовать кандидата от республиканцев как интересующую нас долю, то стандартная ошибка для этого экзитпола составит: [(0,53)(1–0,53)/500] = [(0,53)(0,47)/500] = [0,25/500] = 0,0005 = 0,02236

Для упрощения округлим стандартную ошибку для этого экзитпола до 0,02. Пока это всего лишь некое число. Подумаем, почему оно так важно для нас. Предположим, избирательные участки только что закрылись, и вашему работодателю (коим является некая телекомпания) не терпится объявить победителя выборов еще до того, как станут известны официальные результаты. Вам как человеку, уже прочитавшему две трети этой книги, поручено заниматься обработкой данных, полученных в ходе экзитпола. Ваш начальник желает знать, можно ли на их основании назвать победителя выборов.

Вы объясняете, что ответ на этот вопрос зависит от того, насколько уверенной хочет быть телекомпания в правильности своего заявления – или, точнее говоря, какой риск она готова принять на себя, если оно окажется ошибочным. Вспомните: стандартная ошибка дает нам представление о том, как часто можно ожидать, что доля в выборке (экзитпол) окажется достаточно близкой к истинной доле в совокупности (результат голосования). Нам известно, что примерно в 68 % случаев мы можем ожидать, что доля в выборке – в данном случае 53 % избирателей, которые утверждают, что проголосовали за кандидата от республиканцев, – отстоит от истинного окончательного результата голосования не более чем на одну стандартную ошибку. Таким образом, вы говорите начальнику «с 68 %-ной уверенностью», что ваша выборка, которая показывает, что кандидат от республиканцев получил голоса 53 % избирателей ± 2 %, то есть между 51 и 55 %, соответствует истинному достигнутому им результату. Между тем, согласно тому же экзитполу, за кандидата от демократов отдали голоса 45 % избирателей. Если предположить, что итог голосования за кандидата от демократов имеет ту же стандартную ошибку (упрощение, суть которого я объясню ниже), то с 68 %-ной уверенностью можно утверждать, что наша выборка (экзитпол), которая показывает, что за кандидата от демократов проголосовали 45 % избирателей ± 2 %, то есть между 43 и 47 %, заключает в себе истинный результат этого кандидата. Согласно этому подсчету, победителем становится кандидат от республиканцев.

Группа графического дизайна бросается строить красочную трехмерную диаграмму, чтобы вы могли отобразить ее на экранах ваших телезрителей:

Представитель Республиканской партии 53 %

Представитель Демократической партии 45 %

Независимый кандидат 2 %

(Предел погрешности 2 %)

Поначалу ваш босс приходит в восторг – главным образом потому, что диаграмма представлена в трехмерном виде, насыщена яркими красками и даже может вращаться на экране вокруг вертикальной оси. Однако когда вы объясняете, что примерно в 68 случаях из 100 результаты экзитпола будут отличаться от действительных результатов выборов не более чем на одну стандартную ошибку, ваш начальник, которому уже не раз приходилось посещать курсы аутотренинга и управления негативными эмоциями, указывает на совершенно очевидную вещь: в 32 случаях из 100 результаты экзитпола будут отличаться от действительных результатов выборов более чем на одну стандартную ошибку. И что тогда?

Вы объясняете, что есть два варианта: 1) кандидат от республиканцев мог получить даже больше голосов, чем предсказывал экзитпол, тогда все равно вы назвали бы победителя правильно; 2) но существует достаточно высокая вероятность того, что кандидат от демократов набрал гораздо больше голосов, чем предсказывал экзитпол; в этом случае ваша восхитительная красочная вращающаяся трехмерная диаграмма объявит победителя неправильно.

Босс запускает чашкой с кофе в стену, из чего вы делаете вывод, что посещение курсов аутотренинга и управления негативными эмоциями не пошло ему на пользу. Между тем, начальник продолжает бушевать: «Как, черт бы вас побрал, мы можем быть уверены в правильности результата, показанного на вашей …ной диаграмме?»

Понимая кое-что в статистике, вы указываете ему, что не можете быть уверены в каком-либо результате до тех пор, пока не будут подсчитаны все голоса. И предлагаете в качестве критерия уверенности воспользоваться 95-процентным доверительным интервалом. В данном случае ваша восхитительная красочная вращающаяся 3D-диаграмма предскажет победителя неправильно в среднем лишь в 5 случаях из 100.

Перейти на страницу: