Но такой связи мало для того, чтобы сделать вывод о вреде тех или иных видов работ для здоровья человека. Если мы просто замечаем, что мелкие государственные служащие в иерархии британской государственной службы страдают сердечно-сосудистыми заболеваниями чаще других, то полученные нами результаты будут искажаться действием ряда других факторов. Например, можно было бы ожидать, что уровень образования мелких чиновников окажется ниже, чем у чиновников более высоких рангов. Может также выясниться, что среди мелких государственных служащих больше курящих (не исключено, что это объясняется их неудовлетворенностью работой). Вполне вероятно, что у этих людей было трудное детство, и это сузило перспективы их будущего карьерного роста. Или их невысокий уровень доходов не позволяет им уделять должное внимание своему здоровью. И так далее. Дело в том, что любое сравнительное исследование – изменение состояния здоровья у большой группы британских работников или какой-то другой крупной группы населения – не позволяет нам сделать далекоидущие выводы. Возможно, что другие источники изменения полученных нами данных внесут искажения в интересующую нас связь. Можем ли мы быть уверены в том, что именно невозможность человека в достаточной степени контролировать содержание, способы и условия выполнения своей работы является подлинной причиной развития у него сердечно-сосудистых заболеваний? Или истинная причина – в сочетании действия ряда факторов, которые оказались общими для данной категории людей?
Статистический инструмент под названием регрессионный анализ помогает решить данную проблему. А если конкретнее, то регрессионный анализ позволяет нам измерить величину зависимости между какой-то переменной и интересующим нас исходом,
Большинство исследований, о которых вам приходилось читать в прессе, основываются на регрессионном анализе. Когда ученые приходят к выводу, что у детей, посещавших детсад, чаще возникают проблемы с успеваемостью в начальной школе, чем у детей, которые воспитывались дома, это вовсе не означает, что они случайным образом сформировали выборку из нескольких тысяч детей, одну половину которых отправили в детсады, а другую оставили на попечении родителей. Это также не означает, что исследователи просто сравнили успеваемость в начальной школе детей, посещавших детсад, и детей, находившихся дома, не отдавая себе отчета в том, что эти две группы детей фундаментально разнятся между собой по ряду других показателей. В разных семьях принимаются разные решения относительно воспитания детей
В приведенном выше предложении есть два ключевых словосочетания. Первое: «в случае надлежащего выполнения». Сегодня при наличии соответствующих данных и доступа к персональному компьютеру даже шестилетний ребенок может воспользоваться какой-либо статистической программой для получения результатов регрессионного анализа, поскольку это не потребует практически никаких умственных усилий. Проблема не в выполнении регрессионного анализа как такового, главная трудность – определить, какие именно переменные следует рассматривать в этом анализе и как это лучше всего сделать. Регрессионный анализ подобен многим современным универсальным электромеханическим инструментам: им относительно легко пользоваться, но трудно это делать эффективно, не говоря уже о том, что при ненадлежащем использовании, то есть неумелом обращении, он оказывается потенциально опасен.