Читаем Статистика и котики полностью

Вторая и третья меры изменчивости называются дисперсией и стандартным отклонением. Чтобы разобраться в том, как они устроены, предположим, что мы решили сравнить размер некоторого конкретного котика (назовем его Барсиком) со средним котиковым размером. Разница (а точнее разность) этих размеров называется отклонением.



И совершенно очевидно, что чем сильнее Барсик будет отличаться от среднего котика, тем больше будет это самое отклонение.

Логично было бы предположить, что чем больше у нас будет котиков с сильным отклонением, тем более разнообразными будут наши котики по размеру. И, чтобы понять, какое отклонение является для наших котиков наиболее типичным, мы можем просто найти среднее значение по этим отклонениям (т. е. сложить все отклонения и поделить их на количество котиков).



Однако если мы это сделаем, то получим 0. Это происходит, поскольку одни отклонения являются положительными (когда Барсик больше среднего), а другие – отрицательными (когда Барсик меньше среднего). Поэтому необходимо избавиться от знака. Сделать это можно двумя способами: либо взять модуль от отклонений, либо возвести их в квадрат, который, как мы помним, всегда положителен. Последнее применяется чаще.



И, если мы найдем среднее от квадратов отклонений, мы получим то, что называется дисперсией. Однако, к большому сожалению, квадрат в этой формуле делает дисперсию очень неудобной для оценки разнообразия котиков: если мы измеряли размер в сантиметрах, то дисперсия имеет размерность в квадратных сантиметрах. Поэтому для удобства использования дисперсию берут под корень, получая по итогу показатель, называемый среднеквадратическим отклонением.



К несчастью, дисперсия и среднеквадратическое отклонение так же неустойчивы к выбросам, как и среднее арифметическое.

Среднее значение и среднеквадратическое отклонение очень часто совместно используются для описания той или иной группы котиков. Дело в том, что, как правило, большинство (а именно около 68 %) котиков находится в пределе одного среднеквадратического отклонения от среднего. Эти котики обладают так называемым нормальным размером. Оставшиеся 32 % либо очень большие, либо очень маленькие. В целом же для большинства котиковых признаков картина выглядит вот так:



Такой график называется нормальным распределением признака.

Таким образом, зная всего два показателя, вы можете с достаточной долей уверенности сказать, как выглядит типичный котик, насколько разнообразными являются котики в целом и в каком диапазоне лежит норма по тому или иному признаку.

НЕМАЛОВАЖНО ЗНАТЬ!

Выборка, генеральная

совокупность и два вида дисперсии

Чаще всего нас, как исследователей, интересуют все котики без исключения. Статистики называют этих котиков генеральной совокупностью. Однако на практике мы не можем замерить всю генеральную совокупность – как правило, мы работаем только с небольшим количеством котиков, называемым выборкой.



Очень важно, чтобы выборка была максимально похожа на генеральную совокупность. Степень такой похожести называется репрезентативностью.

Необходимо запомнить, что существует две формулы дисперсии: одна для генеральной совокупности, другая – для выборки. В знаменателе первой всегда стоит точное количество котиков, а у второй – ровно на одного котика меньше.



Корень из дисперсии генеральной совокупности, как уже было сказано, называется среднеквадратическим отклонением. А вот корень из дисперсии по выборке называется стандартным отклонением.

Однако не будет большой ошибкой, если вы будете пользоваться терминами стандартное отклонение генеральной совокупности и стандартное отклонение выборки. Чаще всего именно последнее и рассчитывается для реальных исследований.

Глава 2. Картинки с котиками или Средства визуализации данных

В предыдущей главе мы говорили про показатели, которые помогают определить, какой размер является для котиков типичным и насколько он бывает разнообразным. Но когда нам требуется получить более полные и зрительно осязаемые представления о котиках, мы можем прибегнуть к так называемым средствам визуализации данных.

Первая группа средств показывает, сколько котиков обладает тем или иным размером. Для их использования необходимо предварительно построить так называемые таблицы частот. В этих таблицах есть два столбика: в первом указывается размер (или любое другое котиковое свойство), а во втором – количество котиков при данном размере.

Это количество, кстати, и называется частотой. Эти частоты бывают абсолютными (в котиках) и относительными (в процентах).



Перейти на страницу:

Похожие книги

Иная жизнь
Иная жизнь

Эта книга — откровения известного исследователя, академика, отдавшего себя разгадке самой большой тайны современности — НЛО, известной в простонародье как «летающие тарелки». Пройдя через годы поисков, заблуждений, озарений, пробившись через частокол унижений и карательных мер, переболев наивными представлениями о прилетах гипотетических инопланетян, автор приходит к неожиданному результату: человечество издавна существует, контролируется и эксплуатируется многоликой надгуманоидной формой жизни.В повествовании детективный сюжет (похищение людей, абсурдные встречи с пришельцами и т. п.) перемежается с репортерскими зарисовками, научно-популярными рассуждениями и даже стихами автора.

Владимир Ажажа , Владимир Георгиевич Ажажа

Альтернативные науки и научные теории / Прочая научная литература / Образование и наука
Тайны нашего мозга или Почему умные люди делают глупости
Тайны нашего мозга или Почему умные люди делают глупости

Мы пользуемся своим мозгом каждое мгновение, и при этом лишь немногие из нас представляют себе, как он работает. Большинство из того, что, как нам кажется, мы знаем, почерпнуто из «общеизвестных фактов», которые не всегда верны...Почему мы никогда не забудем, как водить машину, но можем потерять от нее ключи? Правда, что можно вызубрить весь материал прямо перед экзаменом? Станет ли ребенок умнее, если будет слушать классическую музыку в утробе матери? Убиваем ли мы клетки своего мозга, употребляя спиртное? Думают ли мужчины и женщины по-разному? На эти и многие другие вопросы может дать ответы наш мозг.Глубокая и увлекательная книга, написанная выдающимися американскими учеными-нейробиологами, предлагает узнать больше об этом загадочном «природном механизме». Минимум наукообразности — максимум интереснейшей информации и полезных фактов, связанных с самыми актуальными темами; личной жизнью, обучением, карьерой, здоровьем. Приятный бонус - забавные иллюстрации.

Сандра Амодт , Сэм Вонг

Медицина / Научная литература / Прочая научная литература / Образование и наука
100 великих воительниц
100 великих воительниц

На протяжении многих веков война была любимым мужским занятием. Однако традиция участия женщин в войнах также имеет очень давнюю историю и отнюдь не является феноменом XX века.Если реальность существования амазонок еще требует серьезных доказательств, то присутствие женщин в составе вооруженных формирований Древней Спарты – документально установлено, а в Древнем Китае и Индии отряды женщин охраняли императоров. Женщины участвовали в походах Александра Македонского, а римский историк Тацит описывал кельтское войско, противостоящее римлянам, в составе которого было много женщин. Историки установили, что у германцев, сарматов и у других индоевропейских народов женщины не только участвовали в боевых действиях, но и возглавляли воинские отряды.О самых известных воительницах прошлого и настоящего рассказывает очередная книга серии.

Сергей Юрьевич Нечаев

Военное дело / Прочая научная литература / Образование и наука