Насколько это соответствует действительности? Статистика – точная наука, но анализ закономерностей всегда субъективен. Простая столбиковая диаграмма так же показала бы, что частота употребления этого термина повысилась, и, возможно, это все, что нам стоит знать. Можно выдвинуть предположение, что примерно в этот период кто-то принял решение о введении в употребление нового термина, но это так и останется лишь предположением.
Суть в том, что простое составление таблиц или графиков – это еще не способ принимать более эффективные решения. Важно улавливать закономерности. Они либо указывают на необходимость понимания того, что происходит, если мы не знаем причин появления этой закономерности, либо показывают, что какой-то фактор оказывает влияние, если мы понимаем какой. Чем лучше прослеживается закономерность и чем ближе располагаются точки к линии, тем больше это указывает на то, что нужно искать причину.
10. Ищите среднее
Усреднение может сделать информацию яснее. Однако существует больше чем одно среднее значение, и выбор неверного может скрыть от вас то, что вам действительно стоит знать.
В 1918 году Джон Меклин ввел в употребление фразу, которую то и дело применяют специалисты по статистике. Он впервые использовал ее в названии своей научной работы «Тирания обычного человека», опубликованной в журнале International Journal of Ethics.
О какой тирании идет речь? Меклин объясняет. «Очарование острова Капри полностью покоряет путешественников даже без колких фраз Тацита, напоминающих им о…» Постойте, это не тот отрывок. «Наш современный тиран – с головой гидры, с бесчисленным количеством рук…» И это не то! В конце концов автор сообщит нам, что он против «кричащей и банальной сентиментальности дешевого романа, глупого остроумия воскресного приложения к газете, абсолютно пустых песен популярных эстрадных шоу».
Претензия Меклина, высказанная в столь резкой форме, тем не менее обоснованна и заключается в том, что мы уделяем слишком много внимания вкусам большинства и игнорируем тех, кто выделяется из общей массы. Меклин работает в Университете Питтсбурга, издалека наблюдает за процессом зарождения массового социализма и распространением демократических идей, и его одновременно интересуют и пугают привычки обычных людей, от которых, по его словам, будет зависеть процесс принятия решений.
Здесь необходимо сделать пояснение, что это эссе отражает исключительно субъективное мнение автора, который не приводит примеров «обычного» вкуса, не показывает, чем он отличается от вкусов богатых и успешных людей, которыми он так восхищается, и не обосновывает, действительно ли выбор большинства объективно хуже любого другого.
Кроме того, это мнение далеко не всегда справедливо. Мы живем в мире, где слушают музыку и Адель, и Rage Against The Machine, где играют в футбол или в 3D-шахматы. Тем не менее для целей нашей книги у Меклина можно почерпнуть важную мысль. Среднее значение часто отвлекает от более полезной информации.
Есть три средних значения, которые обычно применяются, и все они в определенных ситуациях бывают полезны.
• Среднее арифметическое. Именно это значение большинство людей понимают под средним. Это сумма всех статистических элементов, деленная на их количество. Среднее арифметическое последовательности 1, 3, 3, 4, 4, 6 – это 21/6, или 3,5. Если мы хотим, например, узнать уровень рождаемости, среднее арифметическое будет наиболее полезным статистическим показателем. В Великобритании в 1964 году, по данным Всемирного банка, уровень рождаемости составил 18,8 на 1000 человек. В 2013 году этот показатель был 12,2. Интересно.
• Медианное значение. Проблема со средним арифметическим показателем состоит в том, что при наличии резко отклоняющихся значений – как в большую, так и в меньшую сторону – результат получается искаженным. Например, если покупатели тратят 1, 3, 3, 4, 4, 6 и 28, то получается, что в среднем каждый из них тратит 49/7, или 7. Медиана – это уровень показателя, который делит некоторый набор данных на две равные половины. В данном случае это четвертый элемент из семи, то есть 4. Это более адекватное среднее значение при наличии чрезвычайно высоких показателей.
• Мода. В статистике мода – это значение во множестве наблюдений, которое встречается наиболее часто. Это то, что делает самая большая группа (или каким признаком она обладает), так что по этому показателю можно выстраивать приоритеты. Если среднее арифметическое товаров, которые покупают пользователи вашего сайта, равно 7, но при этом 8 из 10 пользователей не покупают ничего, то мода уровня покупок равна 0. И, возможно, с этого и стоит начинать, если вы хотите что-то менять.