Меня часто спрашивают, как опрос двухсот человек может сказать что-то достоверное о предпочтениях миллионов избирателей? Если так ставить вопрос, то это звучит сомнительно, словно попытка узнать, какой суп в тарелке, попробовав всего одну ложку.
Но на самом деле вы вполне можете это сделать! Ведь у вас есть все основания думать, что в вашей ложке находится случайная выборка – образец супа. Вы никогда не залезете в тарелку с клэм-чаудером так, чтобы в вашей ложке оказался минестроне[112]
.Именно этот суповой принцип и делает опросы такими эффективными. Но он не говорит вам, насколько точно опрос отражает ситуацию в городе, штате или стране, в которых проводится. Ответ кроется в медленном беспорядочном движении комара из пруда. Возьмем какой-нибудь штат, например Висконсин, где я живу и где демократов и республиканцев практически поровну. Теперь представьте себе комара, движение которого определяется следующим образом: я звоню случайному висконсинцу, узнаю его политические взгляды и командую насекомому лететь на северо-восток, если мой респондент – демократ, и на юго-запад, если он голосует за республиканцев. Это в точности модель Росса: комар двигается случайно двести раз в том или ином направлении. Откуда нам знать, что мы не позвоним случайно двумстам демократам и не получим совершенно искаженное представление о том, как голосует Висконсин? Конечно, гипотетически такое возможно – так ведь и комар мог целенаправленно двигаться на северо-восток с места рождения и до смерти. Но этого с большой долей вероятности не произойдет. Мы уже видели, что расстояние от дома до комара через 200 дней (которое численно равно разности между количеством демократов и республиканцев в нашем опросе) в среднем составляет примерно 11 километров. Поэтому вовсе не странно было бы обнаружить в нашем опросе 106 республиканцев и 94 демократа. Другое дело, если бы выявилось соотношение 120 на 80, далекое от политической реальности. Это все равно что зачерпнуть в тарелке Висконсина, а получить ложку Миссури. Если республиканцев на 40 больше, чем демократов, то это эквивалентно тому, что комар блуждает в 40 километрах от дома, а мы уже видели, что вероятность такого сценария всего 3 из 1000.
Иными словами, маловероятно, что двести участников опроса будут существенно отличаться от висконсинцев в целом. Ложка супа имеет тот же вкус, что и вся тарелка. С 95-процентной вероятностью доля республиканцев в этой выборке будет заключена между 43 % и 57 %, а потому о таком опросе будет сказано, что он имеет погрешность ±7 %. Но это при условии, что в выборе респондентов не было никакого скрытого перекоса. Росс очень хорошо понимал, что подобное смещение может испортить его комариную модель: перед вычислениями и составлением диаграмм он оговаривает, что его ландшафт настолько однороден, «что все его точки равно привлекательны для них [комаров] в отношении питания и что нет ничего такого, например ветра или локальных врагов, что могло бы заставлять их попадать в какие-то определенные районы местности».
Росс настаивает на этом предположении по действительно веской причине: без него все летит к чертям. Допустим, что есть ветер. Поскольку комары очень малы, то даже легкий ветерок может сбить их с курса. Если ветер дует в северном направлении, то, возможно, вероятность того, что комар полетит на северо-восток, составит не 50 %, а 53 %. Точно так же в нашем опросе может оказаться незамеченное смещение, когда респондент окажется республиканцем с вероятностью не 50 %, а 53 %. Скажем, республиканцы охотнее соглашаются отвечать на вопросы, чем демократы, или чаще берут трубку, или чаще имеют телефон. Это значительно увеличивает шансы на то, что наш опрос даст описание электората, отличающееся от истины. При непредвзятом опросе вероятность обнаружить 120 республиканцев и 80 демократов будет всего 3 из 1000. При «республиканском ветре» она подскакивает до 2,7 %, то есть увеличивается почти вдесятеро.
В реальной жизни мы никогда не узнаем, насколько объективен опрос. Поэтому нам, пожалуй, следует довольно скептически относиться к заявленной погрешности. Если легкий ветерок систематического смещения регулярно подталкивает опрос в ту или иную сторону, то можно ожидать, что реальные результаты выборов будут гораздо сильнее выходить за пределы заявленных погрешностей, чем утверждается. И знаете что? Именно так и происходит. В одной статье 2018 года говорится[113]
, что реальные результаты выборов в среднем отличаются от результатов опросов примерно вдвое больше, чем можно было предположить исходя из заявленных погрешностей. Ветреные выборы!Есть еще один способ подумать о воздействии неизвестного ветра. Это означает, что перемещения комара в разные дни не независимы, а коррелируют друг с другом. Если сегодня комар полетел на северо-восток, это слегка повышает вероятность, что ветер дует в том же направлении, поэтому более вероятно, что и завтра насекомое полетит туда же. Этот эффект слаб, но имеет тенденцию накапливаться.