Однако основная проблема лепестковой диаграммы даже не в плохом считывании. Дело в том, что этот график акцентирует внимание на фигурах, образованных линиями. Но эти фигуры не несут в себе никакого посыла. В отличие от линейного графика здесь нет непрерывной шкалы времени, порядок категорий обычно случаен. Если поменять этот порядок, формы фигур полностью изменятся.
Это приводит нас к выводу: соединять линиями значения категориальных переменных не стоит. Лучше соединять линиями только значения непрерывных числовых шкал.
Возьмем для примера датасет с рейтингом городов:
Попробуем сделать лепестковую диаграмму:
Скорее всего, мы сможем считать какой-то основной паттерн, но более тонкие различия – нет. Особенно сложно становится читать лепестковую диаграмму, когда на ней представлено больше одного ряда данных. Некоторые пытаются сделать лепестковую диаграмму для каждой категории. Это крайне неэкономно в плане использования пространства, хотя и лучше предыдущего варианта. Но по-прежнему ненаглядно:
Лепестковую диаграмму лучше всего заменить либо тепловой картой, либо рядами линейчатых диаграмм. На примере тепловая карта. Города ранжированы по суммарному рейтингу, от большего к меньшему:
Визуализация, составленная из рядов линейчатых диаграмм:
Для каждого критерия добавлена линия, соответствующая среднему значению по каждому критерию. Столбики раскрашены по принципу больше среднего/меньше среднего по каждому критерию. Это позволяет быстро просматривать каждый город и понимать, в чем он лучше и хуже других и в какой степени.
При использовании подобных диаграмм в презентациях будет требоваться акцентное выделение. Оно поможет донести ваше сообщение. Дело в том, что эти графики предназначены скорее для самостоятельного изучения, чем для представления результатов.
Что делать, если график выглядит перегруженным. Боремся с лапшой
Даже самый понятный тип визуализации данных можно сделать запутанным, добавляя все больше новых рядов данных. Если бесконтрольно увеличивать количество данных на линейном графике, получится «лапша».
Самые частые причины перегруженности:
• Попытка разместить слишком много данных в одном графике
• Неверно выбранный вид визуализации
• Попытка подписать все значения прямо на графике
Что можно сделать?
• Попробовать подобрать более подходящий вид визуализации
• Разделить данные на несколько графиков
• Попробовать сгруппировать часть данных, тем самым уменьшив их количество или улучшив организацию и читаемость. Обычно читаемость повышает создание категории «Прочее»
• Убрать часть данных
• Убрать подписи значений с графика
Вот пример перегруженного графика. Если разделить его на несколько, он становится читабельным и понятным:
А вот пример уменьшения хаоса и добавления читаемости с помощью изменения вида визуализации, группировки значений и избавления от подписей значений:
Сюда черточками можно нанести и сам индекс счастья, но и в таком виде визуализация достаточно наглядна.
– Но будьте осторожны, упрощая и группируя, – говорит Нейтан Яу. В информации могут скрываться важные детали. Нужно понимать задачу, соблюдать баланс и стремиться к объективности.
Если линейный график перегружен, обычно работает только две стратегии:
1. Использование серого цвета для основной массы линий. Эти линии мы оставляем для сохранения контекста или фона. Далее делаем акцент на нескольких, о которых идет речь в нашем сообщении:
В этом случае мы сохраняем общий паттерн снижения уровня безработицы по всем регионам. При этом мы отчетливо видим пик – последствия кризиса 2008 года. И, наконец, делаем акцент на лидере и аутсайдере в 2018 году.
2. Разбить данные на несколько мини-графиков. Важно, что все они должны быть в одной размерности для того, чтобы сохранить адекватность сравнения между ними.
Вот прекрасный пример от Нью-Йорк Таймс об эффективности различных методов контрацепции:
Если вам важно сохранить наглядный показ всех данных, но вы не хотите превращать график в лапшу, серии мини-графиков – практически единственный адекватный вариант визуализации.
Еще раз об алгоритме выбора графиков
Итак, выбор типа и конкретного вида визуализации данных – ключевой этап в донесении вашего сообщения графически. Для этого нужно качественно провести анализ данных. Затем получить информацию от экспертов о том, как именно следует интерпретировать эти данные. По результатам этого процесса вы сформулируете несколько сообщений, которые хотите донести. Я рекомендую отталкиваться от представленного ранее списка объединенных в группы видов визуализации. В 80 % случаев эффективно работает первый вид визуализации в каждой группе. Когда ваше сообщение попадает сразу в несколько категорий, важно понять, какой вид взаимоотношений между данными как вывод наиболее важен.