Глядя новости или читая комментарии к ним, мы порой недоумеваем: «Есть в этом мире нормальные люди?!» Вроде должны быть, ведь нас много и в среднем мы наверняка нормальны. Но при этом мудрецы говорят, что каждый из нас уникален. А подростки уверены, что они-то уж точно отличаются от серой массы «нормальных людей» и ни на кого не похожи.
Небольшое отступление о том, что такое «в среднем». Часто можно услышать шутливые фразы о «средней температуре по больнице» или «средней зарплате», не отражающей действительное распределение. В статистике встречаются несколько разных средних. Чаще всего применяются три вида — выборочное среднее (или просто среднее), выборочная медиана и мода.
Пусть у нас есть выборка
Однако бывают случаи, когда выборочное среднее не отражает «нужную среднесть». Представьте, что вы считаете средний доход в городе. Если там живет Билл Гейтс, то вы получите завышенный результат с точки зрения любой практической задачи. Для исправления ситуации можно использовать, например, медиану.
Возьмем ту же выборку и упорядочим числа по возрастанию:
Наконец, мода — просто самое частое значение в нашей выборке. Приведем простой пример. Представим себе маленькую компанию, в которой работают пять человек. Директор получает 200 тысяч рублей, его заместитель — 100 тысяч, бухгалтер — 50 тысяч, а два рядовых работника — по 20 тысяч. Тогда выборочное среднее (200 000 + 100 000 + 50 000 + 20 000 + 20 000) / 5 = 78 000. Медиана — 50 000 (есть две зарплаты больше этого числа и две меньше). Мода — 20 000 (это значение встречается два раза — чаще других вариантов). Если компания будет зазывать новых работников и утверждать, что средняя зарплата в ней равна 78 000, то это будет формально верно, а на деле надувательство. Здесь нужно ориентироваться на моду: раз вас зовут, то, надо думать, рядовыми работниками, а не директорами.
В этой главе мы поговорим о средних значениях и их репрезентативности. До сих пор мы рассматривали
Начнем с многомерного арбуза
Одна из особенностей многомерной геометрии — увеличение доли пограничных значений в ограниченном объеме. Вот что имеется в виду. Рассмотрим классическую задачу об арбузе в пространствах с различной размерностью и зададимся целью выяснить, сколько чудесной сахарной мякоти нам достанется от этого огромного, крепкого и аппетитного арбуза, если, надрезав его, мы выяснили, что толщина его корки не превышает 15 % от его радиуса? Кажется, что это многовато, но посмотрите на рис. 5.1: пожалуй, арбуз с такими пропорциями мы сочтем вполне приемлемым. Рассмотрим сначала одномерный арбуз, в виде розового столбика. Его корка представляет собой два маленьких белых отрезочка по краям, ее суммарная длина будет мерой (обобщенным объемом) в одномерном мире и составит 15 % от общей меры арбуза. У двумерного, блинообразного арбуза мера корки в виде площади белого кольца будет меньше, чем внутренняя часть, уже всего в три раза. В привычном нам трехмерном мире такая корка составит почти 40 % общего объема. Чувствуете подвох?
Рис. 5.1.
Задача об арбузеТакую возрастающую роль границ мы уже встречали, когда рассматривали туристический закон подлости. Но тогда мы ограничились двумерным случаем, вполне естественным для топографических карт. Сейчас мы пойдем дальше.
Для шара, как, впрочем, и для тела произвольной формы, можно точно вычислить зависимость доли корки от общего объема тела. Ее легко получить и обобщить на произвольно многомерные пространства, вновь воспользовавшись анализом размерности и общим понятием меры. Для сплошного тела в пространстве размерности