В первом случае количество фильмов закодировано только длиной столбика. Во втором – еще и степенью яркости цвета самого столбика. В этом нет необходимости.
Существует огромное количество геометрических фигур и их визуальных свойств. А число их комбинаций и вовсе стремится к бесконечности. Однако базовых типов визуализации данных совсем немного. Давайте посмотрим на них.
Типы сравнения
Как вы помните, в третьей главе «Формулируем сообщение» мы говорили о том, что ваши находки по результатам анализа данных формулируются в терминах повышения, снижения, влияния одних переменных на другие, характера распределения значений, описания тренда или значений, которые выбиваются.
Можно выделить несколько основных видов взаимоотношений между данными, соответствующих возможным видам сообщений:
1. В основе почти всех взаимоотношений между данными, которые мы можем визуализировать, лежит сравнение. Чаще всего с помощью визуализации данных мы пытаемся понять, какие из значений
Понятно, что почти все виды визуализации данных (кроме, может быть, связей) позволяют сравнивать: наглядно видеть, какие числовые значения больше, а какие меньше. Однако первый тип фокусируется именно на сравнении.
Если при этом отсортировать значения, чаще всего от большего к меньшему, то к сравнению добавляется функция ранжирования. Мы получаем возможность ответить на вопрос «на каком месте?».
Основные слова в сообщении для этого типа визуализации – «больше, чем», «меньше, чем», «равно», а также указание на место (при ранжировании).
Примеры сообщений:
Больше всего в 2018 году подорожало пшено – на 38 %.
АФК «Система» занимает третье место по выручке среди системных интеграторов России.
Больше всего пожаров, приведших к человеческим жертвам, было в Смоленской области.
НТВ получило в два раза меньше финансирования, чем Первый канал.
Основной вид визуализации здесь – столбиковая диаграмма:
Второй график – сгруппированная столбиковая диаграмма. Она позволяет сравнивать ряды данных по нескольким категориям (обычно 2–3).
2. Сравнение части с целым. Здесь появляется новое измерение для сравнения: мы можем сравнивать значения, но при этом визуально воспринимать их еще и как отношение доли к целому.
Сообщение формулируется в терминах доли, процентов от целого. Основные слова в сообщении для этого типа визуализации – «доля», «проценты от целого».
Примеры сообщений:
Нелегальные эмигранты составляют четверть всех граждан США, родившихся за границей.
Больше 80 % всей выручки в ритейле уходит пяти компаниям.
Жители Москвы составляют половину всех активных пользователей Facebook в России.
Основной вид визуализации – круговая диаграмма или столбиковая с накоплением:
3. Временное сравнение наглядно фокусируется не на значениях отдельных точек, а на характере изменения показателя во времени.
Сообщение формулируется в терминах, описывающих характер изменения показателя: «растет/падает», «плавно/резко». Также сообщение может фокусироваться на пиках или провалах в динамике.
Примеры сообщений:
Уровень безработицы остается выше на Кавказе в сравнении с другими федеральными округами.
За последние три года в России на 10 % выросла средняя ожидаемая продолжительность жизни.
Количество инвестиций в сельское хозяйство резко снизилось.
Пожалуй, ни один другой тип визуализации, кроме линейного графика, не может показать изменения во времени нагляднее:
Эти три основных вида взаимоотношений между данными закрывают 80–90 % ситуаций, в которых требуется визуализация данных в презентациях.
Реже встречаются следующие типы сравнений:
4. Частотное сравнение или распределение показывает, сколько единиц данных попадает в определенные последовательные интервалы.
Сообщение формулируется в терминах структуры, концентрации, диапазонов.
Примеры сообщений:
Большинство покупок в августе попадало в диапазон от 1000 до 2000 рублей.
В структуре подписчиков канала преобладают люди 25–30 лет.
Основной вид визуализации – гистограмма.
5. Связь (корреляция) между количественными переменными показывает, есть ли зависимость между переменными или ее нет.
Обычно описывается как «при росте X отмечается снижение Y», «чем больше X, тем больше/меньше Y».
Примеры сообщений:
При увеличении площади торговых залов размер средней покупки снижается.
Стаж специалиста не влияет на уровень его заработной платы в компании.
Для двух числовых переменных (ось X, ось Y) классическим способом визуализации зависимости между ними является график рассеивания: