Вот очень несложный пример быстрого измерения, которое каждый может провести и при этом легко рассчитать статистическую погрешность. Предположим, что вы подумываете над тем, чтобы перевести часть своих сотрудников на дистанционную работу. Один из факторов, который вам необходимо учесть, — сколько времени средний служащий ежедневно тратит на дорогу до работы и домой. Чтобы выяснить это, вы можете официально опросить всех работников, потратив много времени и денег. При этом, скорее всего, ответ будет более точным, чем вам необходимо. Допустим теперь, что взамен вы выберете наугад пять человек. Позже мы еще поговорим о том, что означает «выбрать наугад», а сейчас представим, что вы просто закроете глаза и ткнете пальцем в список сотрудников. Вызовите этих людей и спросите, сколько времени они обычно тратят на дорогу. Предположим, будут получены следующие ответы: 30, 60, 45, 80 и 60 минут. Возьмем самое высокое и самое низкое значения в выборке — 35 и 80. Вероятность того, что медиана значений продолжительности поездок на работу и домой для совокупности работников находится в этом интервале значений, составляет 93 %. Я называю это Правилом пяти. Правило пяти несложно, оно работает, и можно доказать его статистическую обоснованность для решения целого ряда задач. Когда выборка настолько мала, интервал значений может быть очень широким, но если он окажется значительно уже предыдущего интервала, значит, вы провели измерение.
Существует 93-процентная вероятность того, что в любой случайной выборке медиана для всей совокупности находится в интервале между наименьшим и наибольшим значениями.
Кажется, что нельзя быть уверенным в чем-то на 93 %, располагая всего пятью случайными значениями, но это возможно. Чтобы понять, почему это так, важно учесть, что Правило пяти позволяет определить медиану совокупности. Медиана — это такая точка, которая делит всю совокупность на половины со значениями выше и ниже нее. Если выбрать наугад такие пять значений, которые все располагались бы выше или ниже медианы, то медиана оказалась бы вне интервала. Но какова вероятность подобного выбора?
Вероятность случайного выбора значения, превышающего медиану, составляет, по определению, 50 % (вероятность выпадения орла при подкидывании монеты). Вероятность случайного выбора пяти значений, которые все окажутся выше медианы, равна вероятности выпадения орла при подкидывания монеты пять раз подряд, то есть равна 1
/32, или 3,125 %. Такова же вероятность того, что пять раз подряд выпадет решка. Тогда шанс не получить все решки или все орлы составляет 100 % — 3,125 % × 2 = 93,75 %. Поэтому вероятность случая, когда по крайней мере одно значение из пяти окажется больше или меньше медианы, составляет 93,75 %, или, если округлить с понижением, 93 % (или даже 90 %, если вы хотите быть очень осторожным). Некоторые читатели, возможно, еще помнят тот раздел статистики, где обсуждаются методы выборочного обследования для малых выборок. Эти методы несколько сложнее Правила пяти, но по причинам, о которых я подробнее расскажу позже, не позволяют получить намного более точные результаты.Дополнительно к такому эмпирическому правилу можно использовать простые методы, позволяющие учесть определенные виды смещения (ошибок). Предположим, что начавшееся строительство удлинило время, затрачиваемое каждым сотрудником на дорогу, или же люди, которые дольше добираются до работы, чаще болеют или не вошли в вашу выборку по другим причинам. Однако даже при всех его недостатках любой человек, желающий развить у себя умение измерять, обязательно должен знать Правило пяти.
Позднее мы поговорим о разных подходах, позволяющих, как доказано, еще более снизить неопределенность. Это и более сложные методы выборочного обследования или проведения экспериментов, и приемы, которые просто снижают погрешность субъективных оценок экспертов. В своем стремлении повысить точность измерений мы должны учесть множество факторов, но важно помнить одно: когда наблюдение сообщает нам нечто, чего мы раньше не знали, это означает, что произведено измерение.
Между тем ответим на вопрос, почему неправ тот, кто считает, что «метода измерения подобного объекта еще не существует». В бизнесе принято приклеивать ярлык нематериального всему, чего нет в бухгалтерской отчетности или базах данных. И даже если измерения считают возможными, то полагают, что они по силам только специалистам, владеющим сложными методами, практически не доступными для бизнесменов. К счастью, обычно это не так. Свой способ измерения может придумать каждый.