У меня радикальное предложение. Если у вас очень небольшой объем данных, скажем пять цифр или меньше, и вы хотите представить их, почему бы не оставить все в форме таблицы, как раньше? В таблице содержится вся информация, представленная в предыдущих двух диаграммах, она быстрее читается, и ее невозможно неправильно понять.
Сколько времени вы добираетесь до работы?
9. Устанавливайте закономерности
Графики часто рассказывают историю взаимосвязи данных. Разобравшись с этой историей, вы сможете принять правильное решение.
Графики, как мы увидим далее, не доказывают наличия взаимосвязи, но определенно помогают ее выявить, и по многим причинам с этого стоит начинать. Ниже приводится таблица, демонстрирующая, как часто британское правительство называло состоятельных людей «производителями материальных благ», год за годом.
Я не буду комментировать, действительно ли люди, у которых больше денег, производят материальные блага (создавая компании и новые рабочие места или покупая большие дома, позволяя тем самым заработать другим) или потребляют их (если они покупают несколько домов, которые стоят пустыми, кто-то другой мог бы на эти деньги приобрести необходимое жилье). Это относится к разряду субъективных мнений, и у разных политиков своя точка зрения на этот счет.
Как мы видим, цифры увеличиваются, но не сильно. Теперь мы можем составить точечную диаграмму, как показано далее.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Это весьма интересно: теперь стало очевидно, что цифры увеличиваются. При анализе диаграммы слева направо вырисовывается определенная история. Кажется, мы уловили закономерность.
Сейчас впервые в этой книге настало время серьезно задуматься о проблеме интерпретации данных. Точки на диаграмме рассеивания – это статистические данные. Статистика представляет собой информацию, но это не сама информация. В данном случае это измерение количества статей в прессе в базе данных под названием Factiva.com, которая собирает публикации газет и журналов со всего мира. Тем не менее статистика тоже может ошибаться (база данных может быть неполной), и закономерности в реальной жизни не бывают такими же четкими, как в школьных научных экспериментах. Эти данные подвержены влиянию множества факторов. Так что история, которую я рассказываю, – это всего лишь один из многих возможных вариантов.
В чем заключается моя история? Есть веские основания предполагать наличие закономерности: политики все чаще использовали этот термин на протяжении периода времени, обозначенного на диаграмме. Обратите внимание, если бы я просто отметил первый и последний годы и показатель последнего года был бы выше, речь шла бы о разнице, а не о закономерности.
Тогда, может быть, стоит соединить точки, чтобы сделать закономерность более очевидной, как на следующей диаграмме.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Визуально стало лучше, но можно пойти дальше. Никто не может предполагать, что количество статей было в точности таким. Одна хаотичная линия внесла ясность в диаграмму, но не в историю, которая стоит за ней. Лучше провести прямую линию, чтобы обозначить закономерность.
Чтобы начертить такую линию, прибегнем к методу наименьших квадратов, который активно используется в статистике. Для этого берутся все точки и рассчитывается линия с минимальным квадратом расстояния от каждой точки до линии. Эта черта называется линией наилучшего соответствия. Не переживайте, если до этого вы не имели дела со статистикой, – функция для создания этой линии заложена в программу по работе с таблицами. Однако одна линия может оказаться не слишком информативной. Как видно, точки располагаются не по прямой. Получается, что в начале и конце графика большинство точек находятся выше линии наилучшего соответствия, а в середине большинство точек располагаются под этой линией. Это не очень хорошо.
Взгляните на следующий график. Я разделил данные на две части. В период с 2000 по 2006 год линия наилучшего соответствия была горизонтальной. В период с 2006 по 2012 год она пошла вверх. Из этого можно сделать вывод, что термин «производители материальных благ» начал активно вводиться в употребление после 2006 года.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)