Как-то в телерекламе я увидел вот такую графическую презентацию: она представляла «уровень довольства» клиентов – то, насколько те удовлетворены работой трех обслуживающих компаний. Само собой, компания, которая спонсировала рекламный ролик, получила высшую оценку – 7,5 из 10, в то время как ее конкуренты – 7,3 и 7,2 соответственно. На графике не показали, сколько клиентов составили выборку, и мы не можем узнать, реальна ли разница между тремя компаниями.
Колонки создают впечатление того, что спонсор ролика на голову превосходит конкурентов. Интересно, кто-нибудь раскусил это?
Бенджамин Дизраэли (1804–1881), вероятно, был прав, когда сказал, что есть три вида лжи: ложь, гнусная ложь и статистика. Впрочем, если по правде, то эта история, скорее всего, тоже ложь. Эту ремарку приписывал британскому премьер-министру Марк Твен (1835–1910), но никто и никогда не слышал того, чтобы Дизраэли произносил это знаменитое высказывание, и ни в одном из его сочинений такой фразы не нашли.
В 1973 г. исследователи, решившие изучить жалобы на гендерные предрассудки в Калифорнийском университете в Беркли, выяснили, что, после того как примерно 8000 мужчин и 4000 женщин подали документы в аспирантуру, доля мужчин, которых туда принимали, оказалась намного выше доли женщин. На университет подали в суд за предвзятость. Но была ли здесь дискриминация женщин на самом деле? Исследователи проверили данные приемных комиссий по отдельным факультетам и выяснили вот что: если и была причина для обращения в суд, то по поводу совершенно иной дискриминации! Все факультеты отдавали предпочтение женщинам – и, если судить в процентном отношении, принимали их чаще, чем мужчин.
Если вам не знакома статистика (или законы исчисления дробей), это может показаться невозможным. Если бы все факультеты проявили предвзятость и оказывали благосклонность женщинам, тогда и весь университет проявил бы такие же гендерные предрассудки – а все обстояло совершенно иначе.
Английский статистик Эдвард Симпсон (1922–2019) описал этот феномен в своей статье, вышедшей в 1951 г. и озаглавленной «Интерпретация взаимодействия в таблицах сопряженности»[22]
. Сегодня мы называем это явление парадоксом Симпсона, или эффектом Юла – Симпсона (Удни Юл, статистик из Великобритании, уже упоминал о похожем эффекте в 1901 г.). Я объясню это без практических данных Беркли – с помощью простой гипотетической версии.Предположим, у нас есть университет, в котором только два факультета – математический и юридический. Пусть 100 женщин и 100 мужчин подают документы на факультет математики, куда проходят 60 женщин (или 60 %) и 58 мужчин (58 %). Кажется, на математическом женщины в фаворе. На юридический подают документы 100 женщин, совершенно других, из них проходят 40 (40 %); что же касается мужчин, то юриспруденцию хотят изучать всего трое, а проходит только один. Один из трех – это меньше чем 40 %, и создается впечатление, что оба факультета предпочитают брать к себе женщин. Но если мы посмотрим на общие цифры по университету, то окажется, что из 200 женщин, подавших документы, принято 100, то есть 50 %, а из 103 мужчин, подавших документы, принято 59, то есть больше 50 %.
И как все это объяснить?
Вместо того чтобы переходить к техническим сложностям, позвольте привести интуитивно понятное объяснение. На основании имеющихся данных видно, что юридический факультет относится к поступающим намного суровее. И когда много женщин (100) подают документы на юридический факультет, отношение поступивших к общему числу, выраженное как 60 %, становится гораздо менее ценным. Поскольку равное количество женщин подает документы на каждый факультет, общее процентное отношение женщин, принятых в университет, к женщинам, подавшим документы, – это среднее арифметическое от 60 и 40, то есть 50. Но по причине того, что все знают, сколь суров и жесток юридический факультет, документы туда подают только трое мужчин, а поступает только один (и ничего бы не изменилось, если бы не поступил никто) – и это почти никак не влияет на процентное соотношение мужчин, принятых на математический факультет, к мужчинам, подавшим туда документы.
Вывод: да, оба факультета отдавали предпочтение женщинам. Но именно потому, что на юридический факультет, где процент зачисленных ниже, пытались поступить в большинстве своем женщины, а мужчины почти не шли, при объединении процентных соотношений доля мужчин действительно оказывается больше.
Сказать по правде, парадокс Симпсона сообщает нам кое-что очень простое о законах дробей. Приведенные ниже строки – это не более чем та же самая история, только в виде дробей:
60/100 > 58/100
и также
40/100 > 1/3,
но
(60 + 40) / (100 + 100) < (58 + 1) / (100 + 3)
Один мудрый человек как-то сказал, что статистика напоминает ему женщин в бикини: все, что открыто, очень мило и греет душу, но самое важное остается скрытым.