Представьте исследование, в котором измеряют еженедельную физическую активность и уровень холестерина у людей разных возрастных групп. Если нанести количество часов, потраченных на физкультуру, на ось
Рис 44. Парадокс Симпсона: физическая активность представляется полезной (направление вниз) в каждой возрастной группе, но вредной (направление вверх) в популяции в целом.
Чтобы решить, полезна или вредна физическая активность, мы, как всегда должны обратиться к истории, которая стоит за данными. Данные показывают, что люди старшего возраста в нашей популяции больше занимаются физическими упражнениями. Поскольку ситуация, когда Возраст служит причиной Физической активности представляется более вероятной, чем обратная, и поскольку Возраст способен оказывать каузальное воздействие на Холестерин, мы приходим к выводу, что Возраст может быть осложнителем для Физической активности и Холестерина. Значит, нужно сделать корректировку по Возрасту. Другими словами, следует посмотреть на данные, распределенные по возрастам, и мы увидим, что физические упражнения приносят пользу, независимо от возраста.
Родственник парадокса Симпсона десятилетиями мелькал в литературе по статистике, и его легко интерпретировать визуальными средствами. Фредерик Лорд изначально сформулировал этот парадокс в 1967 году. И снова он вымышленный, но вымышленные примеры (вроде мысленных парадоксов Эйнштейна) всегда обеспечивают хороший способ нащупать границы нашего понимания.
Лорд наблюдает за университетом, администрация которого хочет понять, как питание, предлагаемое студентам в столовых, влияет на их вес — в частности, оказывает ли оно разный эффект на юношей и девушек. С этой целью студенты сначала взвешиваются в сентябре, а потом в следующем июне. На рис. 45 результаты представлены на графике, где эллипсы снова отражают диаграммы рассеяния данных. Потом университет приглашает двух статистиков, они рассматривают полученные данные и приходят к противоположным выводам.
Первый статистик смотрит на распределение веса у девушек в целом, и отмечает, что их средний вес в июне остался таким же, как в сентябре. (Это показывает симметрия диаграммы рассеяния вдоль линии
Рис 45. Парадокс Лорда. (Эллипсы представляют диаграммы рассеяния). В целом, ни девушки, ни юноши не прибавляют в весе в течение года, но в каждой страте с одинаковым исходным весом юноши имеют тенденцию поправляться больше девушек.
Второй статистик, со своей стороны, утверждает, что, поскольку на конечный вес студентов сильно влияет исходный вес, необходимо стратифицировать их по исходному весу. Если сделать вертикальный срез, пройдя через оба эллипса, что позволит посмотреть только на юношей и девушек с определенным исходным весом (например,
Что же делать университетскому диетологу? Лорд пишет: «Выводы обоих статистиков с виду верны». То есть, не нужно заниматься подсчетами, чтобы увидеть: два веских аргумента ведут к двум разным выводам. Достаточно посмотреть на рисунок: на рис. 45 мы видим, что юноши в каждой страте (в любом вертикальном сечении) поправляются больше, чем девушки. В то же время, очевидно, что ни юноши, ни девушки в итоге не прибавили ничего. Как это возможно? Разве общая прибавка веса — не средний показатель для прибавки в каждой группе?