Я считаю, что в ряде случаев графики рассеивания все же могут быть эффективными и наглядными, в том числе и в презентациях. Безусловно, они предполагают личное объяснение.
Кроме того, существует прием, который может сделать графики рассеивания гораздо более наглядными. Это объединение точек в группы и разделение пространства системы координат на смысловые зоны. Выделение смысловых зон можно сделать по среднему или медианному значению по каждой из переменных (губернаторы на примере ниже). Или на основе других значений.
Работа автора
Выделение смысловых зон значительно облегает считывание информации на графике. Оно позволяет донести сообщение с помощью объединения значений в группы.
Альтернативы
Одна из популярных альтернатив для показа взаимосвязи между двумя переменными – две линейчатые диаграммы, расположенные рядом. Они делают очевидной обратно пропорциональную связь: в одном ряду значения возрастают, а в другом, соответственно, убывают.
Часто для показа взаимосвязи используют комбинированные диаграммы, сочетающие столбиковую диаграмму и линейный график. Обычно, это не самое удачное решение, так как может создавать ложное ощущение корреляции.
Если вы все же решили использовать подобную комбинированную диаграмму, стоит соблюдать несколько правил:
• Не больше двух рядов данных на одном графике. Если нужно больше, лучше сделать несколько графиков
• Четкое указание на то, какая шкала к какому ряду данных относится
• Использование сопоставимых размерностей у шкал. Если в одной размерности определенное расстояние означает, что показатель изменился вдвое, то и в другой должно быть то же самое. Иначе можно легко ввести читателя в заблуждение относительно предполагаемой причинной связи между переменными
• Если это уместно, лучше использовать проценты от исходного уровня вместо абсолютных значений
В этом варианте графика крайне сложно понять степень роста каждого показателя относительно друг друга. Чтобы сделать его очевидным, перестроим оба графика:
Для более глубокого понимания передаваемых сообщений с помощью пяти основных видов диаграмм рекомендую обратиться к классическому труду Джина Желязны «Говори на языке диаграмм».
Отклонение значений/разница
В ряде случаев основное сообщение сфокусировано на разнице одних значений с другими. Например, вам нужно рассказать о достижении плана или перерасходе бюджетных средств.
Посмотрим на таблицу, которая характеризует годовую выручку компании по федеральным округам в миллионах рублей. Рядом приведены данные по средней выручке топ-3 компаний на рынке в этих же федеральных округах:
Обычный график мог бы выглядеть так. Мы отсортировали округа по выручке и можем удобно сравнить их по этому параметру. Еще мы можем сравнить результаты со средней выручкой лидеров в округе:
Нагляднее и компактнее среднюю выручку лидеров показывать чертой:
Однако считать разницу между выручкой и референсом на глаз неудобно, поэтому можно посчитать ее и показать на графике:
Чтобы оценивать эффективность работы филиалов, логично пересчитать эти данные в процентах:
На чем в итоге остановиться? Это зависит от того, какой параметр выбран для оценки эффективности и какое именно сообщение вы хотите передать. В каких-то ситуациях адекватно будут выглядеть два графика рядом.
Здесь на одном филиалы ранжированы по выручке, на втором изображено, как выручка отличается от средней по лидерам в процентах:
Если ключевое – именно рейтинг разницы, логично показать только его. Остальную информацию можно донести текстом.
Очевидно, что отрицательные значения должны идти влево, а положительные – вправо. В горизонтальной версии графика отрицательные значения идут вниз, а положительные – вверх.
Если требуется и сохранить рейтинг в абсолютных значениях, и передать разницу по динамике, может выручить компактная гантельная диаграмма. В данном случае информацию можно показать двумя столбиками для каждого округа, но изучать разницу при этом сложно. Гантельная диаграмма решает задачу гораздо нагляднее:
Потоки
Распределение бюджета или воронку продаж удобнее всего показывать с помощью диаграммы Санкея. К сожалению, в Excel этот график построить нельзя. Альтернатива – столбиковая диаграмма. Вот пример уместного использования диаграммы Санкея:
Работа автора
Мультикатегориальное сравнение
Много сложностей и непонимания вызывает необходимость сравнения нескольких категорий по нескольким критериям – составление профилей или мультикатегориальное сравнение.
Хотелось бы сразу предостеречь от использования лепестковой (радарной) диаграммы. Она очень популярна. Однако считывание данных в виде круга происходит гораздо хуже, чем в обычной системе декартовых координат.