Читаем Голая статистика. Самая интересная книга о самой скучной науке полностью

Существует так много потенциальных «регрессионных ловушек», что я решил посвятить их рассмотрению всю следующую главу. Пока же будем считать, что на нашем пути ни одна из них не встретится. Регрессионный анализ обладает замечательным свойством вычленять в каждом отдельном случае статистическую связь, которая представляет для нас интерес, например связь между невозможностью человека в достаточной степени контролировать содержание, способы и условия выполнения своей работы и развитием сердечно-сосудистых заболеваний, учитывая при этом другие факторы, которые могут внести в нее искажения.

Как действует данный механизм? Если нам известно, что мелкие государственные служащие Британии курят чаще, чем их начальники, то как нам определить, в какой мере плохое состояние их сердечно-сосудистой системы обусловлено спецификой работы, а в какой – этой пагубной привычкой? Оба фактора кажутся неразрывно связанными между собой.

Регрессионный анализ (выполненный надлежащим образом!) позволяет разделить эти факторы. Чтобы объяснить процесс на интуитивном уровне, мне придется начать с базовой идеи, лежащей в основе всех форм регрессионного анализа, от простейших статистических связей до сложных моделей, разработанных лауреатами Нобелевской премии. По своей сути регрессионный анализ стремится найти «наилучшее приближение» линейной зависимости между двумя переменными. Простой пример – зависимость между ростом и весом людей. Те, кто выше ростом, как правило, весят больше, хотя эта закономерность соблюдается не всегда. Если бы мы построили диаграмму разброса для роста и веса группы студентов-выпускников, то получили бы нечто наподобие того, что уже видели в главе 4.

Если бы вас попросили описать получившуюся картину, вы бы наверняка сказали что-то вроде: «Вес, по-видимому, увеличивается пропорционально росту». Такую догадку вряд ли можно назвать озарением. Регрессионный анализ позволяет нам пойти дальше и «провести линию», которая точнее всего отражает линейную зависимость между этими двумя переменными.



Можно провести множество линий, которые будут отражать соотношение между ростом и весом. Но как знать, какая из них это делает точнее всего? К тому же посредством какого критерия мы определяем эту линию? Регрессионный анализ обычно использует методологию под названием стандартный метод наименьших квадратов, МНК. Если читателя интересуют его технические подробности и он хочет узнать, почему МНК обеспечивает «наилучшее приближение», ему придется обратиться к более солидным учебникам по статистике. Ключевыми словами в названии МНК являются «наименьшие квадраты»: МНК определяет линию, минимизирующую сумму квадратов разностей. Это не настолько сложно, как может показаться на первый взгляд. Каждое наблюдение в нашей совокупности данных «рост/вес» характеризуется разностью, которая представляет собой его расстояние по вертикали от линии регрессии; это не относится к наблюдениям, расположенным непосредственно на линии: для них разность равняется нулю. (На представленной ниже диаграмме разброса разность отмечена для некоего гипотетического лица A.) На интуитивном уровне должно быть понятно, что чем больше сумма разностей в целом, тем худшее приближение обеспечивает данная линия. Единственное, что может быть непонятно в МНК на интуитивном уровне, это то, что в соответствующей формуле суммируются квадраты каждой разности (тем самым увеличивается весовой коэффициент, назначаемый наблюдениям, которые расположены особенно далеко от линии регрессии, то есть «отщепенцам»).

Обычный метод наименьших квадратов позволяет определить линию, которая минимизирует сумму квадратов разностей, как показано ниже.



Если технические подробности вызывают у вас головную боль, можете не обращать на них внимания. Важно запомнить главное: стандартный метод наименьших квадратов позволяет получить наилучшее описание линейной зависимости между двумя переменными. В результате мы получаем не только линию как таковую, но и – как вы, наверное, помните из курса геометрии в средней школе – уравнение, описывающее ее. Оно известно как уравнение регрессии и имеет следующий вид: y = a + bx, где y – вес в фунтах, a – отрезок, отсекаемый этой линией на оси Y (то есть значение y, когда x = 0), b – коэффициент наклона линии, а x – рост в дюймах. Коэффициент наклона b найденной нами линии описывает «наилучшую» линейную зависимость между ростом и весом для соответствующей выборки, как определяется стандартным методом наименьших квадратов.

Перейти на страницу:

Похожие книги

К черту недостатки! Как использовать свои сильные стороны
К черту недостатки! Как использовать свои сильные стороны

Стремясь повысить прибыль и эффективность компаний, современные руководители непрерывно и тщетно борются с недостатками сотрудников. Большинство амбициозных людей также стремится стать лучше и профессиональнее. Для этого они изо дня в день из последних сил пытаются исправить свои недостатки. Но все это не работает!Маркус Бакингем, один из ведущих мировых специалистов по менеджменту и лидерству, провел масштабное международное исследование с целью выяснить пути, ведущие к максимальной самореализации человека и предельной эффективности бизнеса.Оказывается, для того, чтобы достичь профессионального совершенства и получать удовольствие от каждого прожитого дня, не нужно исправлять свои недостатки и преодолевать слабые стороны. Сосредоточьтесь на сильных сторонах и максимально развивайте их. Только в этом случае вы и ваша компания достигнете настоящего успеха.Автор подробно и убедительно, на примере реальных историй крупных компаний и данных научных исследований, показывает, как отыскать в себе качества, развив которые можно сделать успешную карьеру и достичь внутренней гармонии. Как, распределив обязанности сотрудников в соответствии с их уникальными способностями, руководитель может дать новый импульс развитию бизнеса.

Виктория Шилкина , Маркус Бакингем

Карьера, кадры / Публицистика / О бизнесе популярно / Документальное / Финансы и бизнес
Как заработать, если умеешь писать
Как заработать, если умеешь писать

Сейчас пишут все. Но как найти свой собственный стиль? Как раскрутить себя и заработать, если уже умеешь писать? Эта книга – неоценимое пособие для каждого, кто хочет научиться писать так, чтобы его читали миллионы. А также для тех, кто хочет издать уже написанное.– Простые приемы, которыми пользуются известные литераторы;– Отличия графомана от писателя;– Все хитрости и ловушки издательств;– Как заработать на писательстве;И многое другое…Ирина Горюнова – владелец успешного литературного агентства, которое работает как с начинающими, так и со звездными авторами, в том числе с Татьяной Догилевой, Гариком Сукачевым, Романом Фадом, Инной Бачинской и другими. Книги Ирины выходят в крупнейших издательствах – «АСТ», «ЭКСМО», «РИПОЛ классик», «Время» и других. Вот почему именно она знает ответ на вопрос – КАК ЗАРАБОТАТЬ, ЕСЛИ УМЕЕШЬ ПИСАТЬ?

Ирина Стояновна Горюнова

Карьера, кадры / Руководства / О бизнесе популярно / Финансы и бизнес / Словари и Энциклопедии