Читаем Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее полностью

Самая простая дисперсионная статистика показывает диапазоны. Для температуры тела это диапазоны нормальных значений, например от минимума до максимума температуры здоровых людей, как показано на графике ниже (такой график называется гистограммой).

Гистограмма

Филип А. Маковяк, Стивен С. Вассерман и Майрон М. Левин «Критическая оценка 98,6 °F, верхнего предела нормальной температуры тела и другого наследия Карла Рейнхолда Августа Вундерлиха». Journal of the American Medical Association 268, № 12 (сентябрь 1992 года), 1578–1580.


График выше отображает частоту 130 разных температур тела, измеренных у здоровых взрослых. Такая гистограмма – это простой способ визуально суммировать данные: сгруппировать значения в столбики, сосчитать, сколько точек данных в каждом столбике, и составить график из вертикальных столбиков – столбчатую гистограмму. Прежде чем сообщить о диапазоне, вначале нужно найти выбросы – те точки данных, которые не соотносятся с остальными показателями. Это точки данных, которые находятся за пределами гистограммы, например температура 100,8 °F (38,2 °С). Может быть, в выборку затесался больной человек. Иначе придется сказать, что нормальная температура варьируется от 96,3 до 100,0 °F. Конечно, чем больше у вас данных, тем четче будет диапазон.

В этом наборе данных статистика центральных тенденций довольно схожа, поскольку показатели распределяются достаточно симметрично, и единственный пик наблюдается посередине. В результате нормой здесь является 98,25 °F (36,8 °С), медианой – 98,3 °F (36,8 °С), а модой – 98 °F (36,7 °С). В других сценариях эти три сводные статистики могут существенно отличаться.

Чтобы проиллюстрировать это, ниже мы рассмотрим другую гистограмму, которая показывает распределение семейных доходов в США в 2016 году. Этот набор данных также имеет один пик, 20 000–24 999 долларов, но он асимметричен, смещен вправо. (Все доходы свыше 200 000 долларов сгруппированы в один столбик. Если этого не сделать, график будет иметь длинный хвост, уходящий далеко вправо.) В отличие от температуры тела, медианный доход в размере 59 039 долларов сильно отличается от среднего дохода в размере 83 143 доллара. Всякий раз, когда данные искажаются в одном направлении, как здесь, норма отодвигается от медианы в сторону смещения, так как ее сдвигают крайние значения.

Распределение семейных доходов в США (2016)

Бюро переписей США «HINC-06. Распределение дохода до 250 000 долларов США и более для домохозяйств», www.census.gov/data/tables/time-series/demo/income-poverty/cps-hinc/hinc-06.2016.html.


Минимальный и максимальный диапазон в данном случае менее информативны. Дисперсию лучше передает межквартильный диапазон, который определяет 25-й процентиль к 75-му процентилю данных, охватывающий средние 50 % доходов, от 27 300 до 102 350 долларов США.

Наиболее распространенными статистическими показателями дисперсии являются дисперсия случайной величины и стандартный разброс (последнее обычно обозначается греческой буквой σ – сигмой). Обе эти меры показывают, как далеко числа в наборе данных отклоняются от нормы. Следующий пример показывает, как рассчитать их для набора данных.

Дисперсия случайной величины и стандартный разброс


Поскольку стандартный разброс – это всего лишь квадратный корень дисперсии случайной величины, если вы знаете последнюю, то вам легко будет рассчитать его. Более высокие величины каждого из них означают, что точки данных часто сильно отклоняются от нормы, как показано на мишенях ниже.

Дисперсия случайной величины


Наборы данных о температуре тела, изображенные ранее, отклоняются от стандарта на 0,73 °F. Чуть более двух третей их значений находятся в пределах одного отклонения от нормы (97,52–98,8 °F), 95 % – в двух отклонения от нормы (96,79–99,71 °F). Как видите, эта закономерность является обычной для множества наборов измерительных данных (например, рост, артериальное давление, стандартизированные тесты).

Гистограммы такого типа имеют похожую форму колокола с кластером значений в центре ближе к норме и все меньшим и меньшим числом результатов по мере удаления от нормы. Когда набор данных имеет такую форму, предполагается, что он поступает из нормального распределения.

Нормальное распределение – это особый тип распределения вероятностей, математической функции, которая описывает, как распределены вероятности всех возможных исходов случайного явления.

Перейти на страницу:

Похожие книги

Принцип сперматозоида
Принцип сперматозоида

По мнению большинства читателей, книга "Принцип сперматозоида" лучшее творение Михаила Литвака. Вообще все его книги очень полезны для прочтения. Они учат быть счастливее и становиться целостной личностью. Эта книга предназначена для психологов, психотерапевтов и обычных людей. Если взять в учет этот факт, то можно сразу понять, насколько грамотно она написана, что может утолить интерес профессионала и быть доступной для простого человека. В ней содержатся советы на каждый день, которые несомненно сделают вашу жизнь чуточку лучше. Книга не о продолжении рода, как может показаться по названию, а о том, что каждый может быть счастливым. Каждый творит свою судьбу сам и преграды на пути к гармонии тоже строить своими же руками. Так же писатель приводит примеры классиков на страницах своего произведения. Сенека, Овидий, Ницше, Шопенгауэр - все они помогли дополнить теорию автора. В книге много примеров из жизни, она легко читается и сможет сделать каждого, кто ее прочитал немножко счастливее. "Принцип сперматозоида" поменял судьбы многих людей.

Михаил Ефимович Литвак

Психология и психотерапия / Психология / Образование и наука
100 секретов счастливой любви
100 секретов счастливой любви

Кто из нас не мечтает о счастливой любви? Но как найти свое счастье и, самое главное, – удержать его? Как не допустить крушения иллюзий и сохранить в душе романтику?Любовные отношения имеют свои законы и правила. Узнав их, вы сможете достичь тончайших оттенков любовных переживаний и избежать разочарований и обид.Рекомендации автора помогут вам понять, чем отличается настоящая любовь от других чувств, обычно за нее принимаемых, на какие отношения претендует ваш избранник, и на что можете рассчитывать вы, как вести себя, чтобы добиться поставленной цели и избежать распространенных ошибок. Умение строить гармоничные отношения с любимыми и близкими – это искусство, которым может овладеть каждый.

Константин Петрович Шереметьев , Константин Шереметьев

Психология и психотерапия / Психология / Образование и наука