Простейшие приёмы статистического описания.
Изучаемая совокупность из n
объектов может по какому-либо качественному признаку А
разбиваться на классы A
1
, A
2
, ..., A
r
. Соответствующее этому разбиению статистическое распределение задаётся при помощи указания численностей (частот) n
1
, n
2
, ..., n
r
, (где ) отдельных классов. Вместо численностей n
i
часто указывают соответствующие относительные частоты (частости) h
i
= n
i
/
n
(удовлетворяющие, очевидно, соотношению). Если изучению подлежит некоторый количественный признак, то его распределение в совокупности из n
объектов можно задать, перечислив непосредственно наблюдённые значения признака: х
1
, x
2
, ..., x
n
, например, в порядке их возрастания. Однако при больших n
такой способ громоздок и в то же время не выявляет отчётливо существенных свойств распределения (подробнее о способах изображения и простейших характеристиках распределения одного количественного признака см. Распределения
). При сколько-либо больших n
на практике обычно совсем не составляют полных таблиц наблюдённых значений x
i
, а исходят во всей дальнейшей работе из таблиц, содержащих лишь численности классов, получающихся при группировке наблюдённых значений по надлежаще выбранным интервалам. Например, в первом столбце таблицы 1а даны результаты измерения 200 диаметров деталей, группированные по интервалам длиной 0,05 мм
. Основная выборка соответствует нормальному ходу технологического процесса, 1-я, 2-я и 3-я выборки сделаны через некоторые промежутки времени для проверки устойчивости этого нормального хода производства. В таблице 1б результаты измерения деталей основной выборки даны при группировке по интервалам длиной 0,25 мм
. Обычно группировка по 10—20 интервалам, в каждый из которых попадает не более 15—20 % значений x
i
, оказывается достаточной для довольно полного выявления всех существенных свойств распределения и надёжного вычисления по групповым численностям основных характеристик распределения (см. о них ниже). Составленная по таким группированным данным гистограмма
наглядно изображает распределение. Гистограмма, составленная на основе группировки с маленькими интервалами, обычно многовершинная и не отражает наглядно существенных свойств распределения. В качестве примера на рис. 1
дана гистограмма распределения 200 диаметров, соответствующая данным первого столбца таблицы 1а, а на рис. 3
— гистограмма того же распределения (соответствующая таблица не приводится ввиду её громоздкости) при интервале 0,01 мм
. С другой стороны, группировка по слишком крупным интервалам может привести к потере ясного представления о характере распределения и к грубым ошибкам при вычислении среднего и других характеристик распределения (см. таблицу 1б и соответствующую гистограмму на рис. 2
). В пределах М. с. вопрос об интервалах группировки может быть рассмотрен только с формальной стороны: полноты математического описания распределения, точности вычисления средних по сгруппированным данным и так далее. О группировке, имеющей целью выделить качественно различные группы в изучаемой совокупности, см. Статистические группировки
. При изучении совместного распределения двух признаков пользуются таблицами с двумя входами. Примером совместного распределения двух качеств, признаков может служить таблица 2а. В общем случае, когда по признаку А
материал разбит на классы A
1
, A
2
, ..., A
r
, а по признаку В
— на классы B
1
, B
2
, ..., B
s
, таблица состоит из численностей nij
объектов, принадлежащих одновременно классам A
i
и B
j
). Суммируя их по формулам , ,
получают численности самих классов A
i
и B
j
; очевидно, что ,
где n
— численность всей изучаемой совокупности. В зависимости от целей дальнейшего исследования вычисляют те или иные из относительных частот hij
= nij
/ n
, hi
.
= ni
. / n
, h.j
= n..j
/ n
, hi(j)
= nij
/ n.j
, h(i)j
= nij
/ ni
.
. Например, при изучении влияния вдыхания сыворотки на заболевание гриппом по таблице 2а естественно вычислить относительные частоты, данные в таблице 2б.
Таблица 2а. — Распределение заболевших и не заболевших гриппом среди работников Центрального универмага в Москве, вдыхавших и не вдыхавших противогриппозную сыворотку (1939)
| Не заболевшие | Заболевшие | Всего |
Не вдыхавшие | 1675 | 150 | 1825 |
Вдыхавшие | 497 | 4 | 501 |
Всего | 2172 | 154 | 2326 |
Таблица 2б. — Относительные частоты (соответствующие данным таблицы 2а)
| Не заболевшие | Заболевшие | Всего |
Не вдыхавшие | 0,918 | 0,082 | 1,000 |
Вдыхавшие | 0,992 | 0,008 | 1,000 |