Читаем Модельное мышление. Как анализировать сложные явления с помощью математических моделей полностью

Если общая вариация составляет 1 миллиард долларов, а модель объясняет 800 миллионов этой вариации, то ее показатель R^2 составляет 0,8. Величина объясненной вариации соответствует тому, насколько данная модель улучшает оценку среднего значения. Если оценка, полученная с помощью модели, указывает, что домохозяйство потратит 600 долларов, и оно действительно тратит 600 долларов, то данная модель объясняет все 10 000, которые это домохозяйство вносит в общую вариацию. Если семья потратила 800 долларов, а согласно модели должна была потратить 700 долларов, тогда то, что было вкладом в общую вариацию 90 000 ((800 – 500)^2), теперь составляет всего 10 000 ((800 – 700)^2). Таким образом, данная модель объясняет вариации.

R^2: процент объясненной дисперсии (коэффициент детерминации)

где V(x) – это значение x на множестве X,  – среднее значение, а M(x) – оценка модели.

В данном контексте модель категоризации делит домохозяйства на категории и определяет значение по каждой. Более детализированная модель обеспечивает создание большего числа категорий. Это может потребовать анализа большего количества атрибутов домохозяйств. Увеличение числа категорий позволяет объяснить большую долю вариации, но мы можем зайти слишком далеко. Последовав примеру картографов Борхеса и отнеся каждое домохозяйство к отдельной категории, мы сможем объяснить всю вариацию. Но такое объяснение, как и карта в натуральную величину, не принесет особой пользы.

Создание избыточного количества категорий приводит к чрезмерной подгонке данных, а она препятствует прогнозированию будущих событий. Предположим, мы хотим использовать данные о покупках продуктов за прошлый месяц для прогнозирования данных за нынешний месяц. Ежемесячные расходы домохозяйств отличаются. Модель, которая относит каждое домохозяйство к его собственной категории, предскажет, что оно потратит столько же, сколько и в прошлом месяце. Но это будет не очень хороший прогноз, учитывая ежемесячные колебания расходов. Отнеся домохозяйства к категории им подобных, мы сможем использовать средний объем расходов на продукты аналогичных домохозяйств для создания более точного прогноза.

Для этого мы будем рассматривать ежемесячный объем расходов каждого домохозяйства как одно из значений распределения (о распределениях рассказывается в главе 5). У этого распределения есть среднее значение и дисперсия. Задача построения модели категоризации – создать категории на основе атрибутов таким образом, чтобы у домохозяйств в рамках одной категории были близкие средние значения. Тогда объем расходов одной семьи за первый месяц позволит определить объем расходов другой семьи за второй месяц. Однако ни один вариант категоризации не может быть идеальным. Средний объем расходов домохозяйств, входящих в одну категорию, будет немного отличаться. Мы называем это погрешностью категоризации.

Увеличивая категории, мы увеличиваем и погрешность категоризации, поскольку возрастает вероятность отнесения к одной категории домохозяйств с разными средними значениями. Впрочем, более крупные категории основаны на большем количестве данных, а значит, оценки среднего в каждой категории будут точнее (см. правило квадратного корня в главе 5). Погрешность, возникающая из-за неправильной оценки среднего, называется погрешностью оценки. По мере увеличения категорий погрешность оценки уменьшается. Включение одного или даже десяти домохозяйств в одну категорию не позволит получить точную оценку среднего, если они будут существенно разниться по ежемесячному объему расходов. Тысяча домохозяйств в одной категории обеспечат такую оценку.

Итак, мы получили важный интуитивный вывод: увеличение количества категорий влечет за собой погрешность категоризации в связи с отнесением домохозяйств с разными средними значениями к одной категории. Статистики называют это систематической ошибкой модели.

Перейти на страницу:

Похожие книги

Борис Годунов
Борис Годунов

Фигура Бориса Годунова вызывает у многих историков явное неприятие. Он изображается «коварным», «лицемерным», «лукавым», а то и «преступным», ставшим в конечном итоге виновником Великой Смуты начала XVII века, когда Русское Государство фактически было разрушено. Но так ли это на самом деле? Виновен ли Борис в страшном преступлении - убийстве царевича Димитрия? Пожалуй, вся жизнь Бориса Годунова ставит перед потомками самые насущные вопросы. Как править, чтобы заслужить любовь своих подданных, и должна ли верховная власть стремиться к этой самой любви наперекор стратегическим интересам государства? Что значат предательство и отступничество от интересов страны во имя текущих клановых выгод и преференций? Где то мерило, которым можно измерить праведность властителей, и какие интересы должна выражать и отстаивать власть, чтобы заслужить признание потомков?История Бориса Годунова невероятно актуальна для России. Она поднимает и обнажает проблемы, бывшие злободневными и «вчера» и «позавчера»; таковыми они остаются и поныне.

Александр Николаевич Неизвестный автор Боханов , Александр Сергеевич Пушкин , Руслан Григорьевич Скрынников , Сергей Федорович Платонов , Юрий Иванович Федоров

Драматургия / История / Учебная и научная литература / Документальное / Биографии и Мемуары
Теория социальной экономики
Теория социальной экономики

Впервые в мире представлена теория социально ориентированной экономики, обеспечивающая равноправные условия жизнедеятельности людей и свободное личностное развитие каждого человека в обществе в соответствии с его индивидуальными возможностями и желаниями, Вместо антисоциальной и антигуманной монетаристской экономики «свободного» рынка, ориентированной на деградацию и уничтожение Человечества, предложена простая гуманистическая система организации жизнедеятельности общества без частной собственности, без денег и налогов, обеспечивающая дальнейшее разумное развитие Цивилизации. Предлагаемая теория исключает спекуляцию, ростовщичество, казнокрадство и расслоение людей на бедных и богатых, неразумную систему управления в обществе. Теория может быть использована для практической реализации национальной русской идеи. Работа адресована всем умным людям, которые всерьез задумываются о будущем нашего мироздания.

Владимир Сергеевич Соловьев , В. С. Соловьев

Обществознание, социология / Учебная и научная литература / Образование и наука
Сталин и Военно-Морской Флот в 1946-1953 годах
Сталин и Военно-Морской Флот в 1946-1953 годах

В истории человечества есть личности, которые, несмотря на время, продолжают интересовать и привлекать к себе внимание потомков. Их любят и ненавидят, ими восторгаются, их проклинают, но их помнят. Эти люди настолько изменили нашу историю, что их именами мы называем целые эпохи.К личностям такого масштаба, безусловно, относится и Иосиф Виссарионович Сталин. Несмотря на нескончаемый поток обвинений и грязи в его адрес, Сталина, по-прежнему, любит и чтит народ. Фильмы, статьи и книги о нем обречены на успех, так как новые и новые поколения хотят понять феномен этой незаурядной личности. И на самом деле, удивительно, сколько успел сделать за свою жизнь этот человек, принявший Россию с сохой и оставивший ее с атомной бомбой на пороге космической эры!Предмет нашего исследования – Военно-Морской флот Советского Союза. В книге рассказывается о том, как непросто Сталин пришел к пониманию важности ВМФ не только, как гаранта безопасности СССР, но и как мощного инструмента внешней политики, о том, как он создавал океанский флот Советского Союза в предвоенную эпоху. Несмотря на обилие исследований и книг о Сталине, данную тему до настоящей книги еще никто отдельно не поднимал.Автор книги «Сталин и флот» – известный российский писатель-маринист Владимир Шигин, изучил, проанализировал и обобщил огромный исторический материал, в том числе и уникальные архивные документы, на основании которых и создал новое интересное и увлекательное произведение, которое, вне всяких сомнений, не оставит равнодушным всех, кто интересуется правдой о прошлом нашего Отечества, историей сталинской эпохи, наших Вооруженных Сил и Военно-Морского флота.

Владимир Виленович Шигин

Военное дело / Учебная и научная литература / Образование и наука