Читаем Голая статистика. Самая интересная книга о самой скучной науке полностью

Оказывается, довольно много. Прежде всего, можно подтвердить наше предположение о том, что среднее значение любой выборки будет равняться среднему значению совокупности, из которой такая выборка сформирована. Сущность репрезентативной выборки заключается в том, что она похожа на совокупность, из которой сформирована. Любая надлежащим образом созданная выборка не будет в среднем отличаться от Америки в целом. В такую выборку войдут и менеджеры хеджевых фондов, и бездомные, и полицейские, и все прочие основные группы населения, причем все они будут включены в выборку приблизительно в той пропорции, в какой представлены в соответствующей совокупности. Следовательно, можно ожидать, что средний семейный доход в репрезентативной выборке из 1000 американских семей приблизительно составит 70 900 долларов. Будет ли он в точности равен 70 900 долларам? Нет. Но существенно отличаться от этой суммы не будет.

Если мы возьмем несколько выборок из 1000 американских семей, то предположительно их средние значения будут гуппироваться вокруг среднего значения данной совокупности, то есть 70 900 долларов. Можно ожидать, что некоторые из средних значений будут несколько выше этой суммы, а другие – несколько ниже. Может ли среди этих выборок оказаться такая, у которой средний семейный доход составит 427 000 долларов? Разумеется да, однако это очень и очень маловероятно. (Не забывайте, что мы используем правильную методологию формирования выборок, иными словами, не проводим опрос на парковке возле Greenwich Country Club.) Столь же маловероятно, что средний семейный доход в надлежащим образом сформированной выборке из 1000 американских семей составит 8000 долларов.

Все наши рассуждения основываются на простейшей логике. Центральная предельная теорема позволяет пойти еще дальше, описывая ожидаемое распределение средних значений разных выборок, группирующихся вблизи среднего значения генеральной совокупности. А именно, средние значения этих выборок вблизи среднего значения нашей совокупности (в данном случае 70 900 долларов) распределены по нормальному закону. Вспомните, что форма распределения исходной совокупности значения не имеет. Распределение семейного дохода в Соединенных Штатах характеризуется значительным скосом, однако у распределения средних значений выборок скос отсутствует. Если бы мы взяли 100 разных выборок, каждая из которых включает 1000 семей, и построили график частоты наших результатов, то можно было бы ожидать, что средние значения этих выборок образуют хорошо знакомое нам «колоколообразное» распределение в районе 70 900 долларов.

Чем больше количество выборок, тем точнее это распределение аппроксимируется нормальным распределением. А чем больше размер каждой выборки, тем такое распределение будет уже. Чтобы проверить этот результат, давайте проведем эксперимент с реальными данными о весе реальных американцев. Мичиганский университет выполнил повторное исследование под названием Americans’ Changing Lives («Меняющаяся жизнь американцев»), которое предусматривает детальные наблюдения за несколькими тысячами взрослых американцев, в том числе и за их весом. Распределение веса слегка скошено вправо, поскольку биологически легче весить на 100 фунтов больше нормы, чем на 100 фунтов меньше нормы. Средний вес для всех взрослых в этом исследовании составляет 162 фунта.

С помощью компьютера и базового статистического программного обеспечения можно создать на основе данных Americans’ Changing Lives произвольную выборку из 100 человек. Вообще говоря, это можно делать многократно, чтобы увидеть, как полученные результаты согласуются с тем, что предсказывает нам центральная предельная теорема. Ниже приведен график распределения 100 средних значений выборок (с округлением до ближайшего фунта), сгенерированных случайным образом на основе данных Americans’ Changing Lives.



Чем больше размер выборки и чем больше выборок, тем точнее распределение их средних значений аппроксимируется нормальным распределением. (Чтобы обеспечить применимость центральной предельной теоремы, желательно, чтобы размер выборки был не менее 30.) Это должно быть понятно на интуитивном уровне. Большой размер выборки в меньшей степени подвержен случайным отклонениям. Выборка же из 2 человек может быть сильно скошена, если в ней окажется человек с необычайно большим (или слишком малым) весом. Напротив, на выборку из 500 человек лишь очень незначительно повлияет наличие в ней нескольких человек с нестандартным весом.

Перейти на страницу:

Похожие книги

100 способов уложить ребенка спать
100 способов уложить ребенка спать

Благодаря этой книге французские мамы и папы блестяще справляются с проблемой, которая волнует родителей во всем мире, – как без труда уложить ребенка 0–4 лет спать. В книге содержатся 100 простых и действенных советов, как раз и навсегда забыть о вечерних капризах, нежелании засыпать, ночных побудках, неспокойном сне, детских кошмарах и многом другом. Всемирно известный психолог, одна из основоположников французской системы воспитания Анн Бакюс считает, что проблемы гораздо проще предотвратить, чем сражаться с ними потом. Достаточно лишь с младенчества прививать малышу нужные привычки и внимательно относиться к тому, как по мере роста меняется характер его сна.

Анн Бакюс

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Детская психология / Образование и наука
27 принципов истории. Секреты сторителлинга от «Гамлета» до «Южного парка»
27 принципов истории. Секреты сторителлинга от «Гамлета» до «Южного парка»

Не важно, что вы пишете – роман, сценарий к фильму или сериалу, пьесу, подкаст или комикс, – принципы построения истории едины для всего. И ВСЕГО ИХ 27!Эта книга научит вас создавать историю, у которой есть начало, середина и конец. Которая захватывает и создает напряжение, которая заставляет читателя гадать, что же будет дальше.Вы не найдете здесь никакой теории литературы, академических сложных понятий или профессионального жаргона. Все двадцать семь принципов изложены на простом человеческом языке. Если вы хотите поэтапно, шаг за шагом, узнать, как наилучшим образом рассказать связную. достоверную историю, вы найдете здесь то. что вам нужно. Если вы не приемлете каких-либо рамок и склонны к более свободному полету фантазии, вы можете изучать каждый принцип отдельно и использовать только те. которые покажутся вам наиболее полезными. Главным здесь являетесь только вы сами.В формате PDF A4 сохранен издательский макет книги.

Дэниел Джошуа Рубин

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Зарубежная прикладная литература / Дом и досуг
История математики. От счетных палочек до бессчетных вселенных
История математики. От счетных палочек до бессчетных вселенных

Эта книга, по словам самого автора, — «путешествие во времени от вавилонских "шестидесятников" до фракталов и размытой логики». Таких «от… и до…» в «Истории математики» много. От загадочных счетных палочек первобытных людей до первого «калькулятора» — абака. От древневавилонской системы счисления до первых практических карт. От древнегреческих астрономов до живописцев Средневековья. От иллюстрированных средневековых трактатов до «математического» сюрреализма двадцатого века…Но книга рассказывает не только об истории науки. Читатель узнает немало интересного о взлетах и падениях древних цивилизаций, о современной астрономии, об искусстве шифрования и уловках взломщиков кодов, о военной стратегии, навигации и, конечно же, о современном искусстве, непременно включающем в себя компьютерную графику и непостижимые фрактальные узоры.

Ричард Манкевич

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Математика / Научпоп / Образование и наука / Документальное
Психология подросткового и юношеского возраста
Психология подросткового и юношеского возраста

Предлагаемое учебное пособие объективно отражает современный мировой уровень развития психологии пубертатного возраста – одного из сложнейших и социально значимых разделов возрастной психологии. Превращение ребенка во взрослого – сложный и драматический процесс, на ход которого влияет огромное количество разнообразных факторов: от генетики и физиологии до политики и экологии. Эта книга, выдержавшая за рубежом двенадцать изданий, дает в распоряжение отечественного читателя огромный теоретический, экспериментальный и методологический материал, наработанный западной психологией, медициной, социологией и антропологией, в талантливом и стройном изложении Филипа Райса и Ким Долджин, лучших представителей американской гуманитарной науки.Рекомендуется студентам гуманитарных специальностей, психологам, педагогам, социологам, юристам и социальным работникам. Перевод: Ю. Мирончик, В. Квиткевич

Ким Долджин , Филип Райс

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Психология / Образование и наука