Как выбрать диаграмму? В первую очередь, стоит ответить на вопрос, что вы хотите показать. Есть четыре стандартных варианта. Они представлены на схеме ниже.
После того как вы поняли, на какой вопрос вы хотите дать ответ, можно переходить к выбору диаграммы. В этом вам поможет следующая схема. Это краткий вариант алгоритма выбора диаграммы. Далее в этой главе вы найдете расширенную версию.
Типы данных
Итак, с помощью двух схем, которые приведены выше, вы можете сделать первые шаги к выбору подходящей диаграммы. Однако останавливаться на этом не стоит. Для того чтобы правильно выбрать диаграмму, важно понимать, данными какого типа вы располагаете. Их существует два типа: непрерывные и категориальные. Чем же они различаются?
Непрерывные данные – такие, значения которых могут иметь различные показатели в некотором интервале (например, вес, ширина, объем, величина брака и т. д.).
Категориальные данные представляют собой набор нечисловых значений, качественно характеризуют исследуемый процесс или объект и показывают, к какой категории относится каждый из рассматриваемых объектов. Обычно они не имеют количественного выражения (например, названия городов, наименования товаров, ФИО сотрудников и клиентов, пол, должность, название отдела и т. д.).
В некоторых случаях могут использоваться кодирующие эти категории числа.
Разные диаграммы строятся на основе данных одного типа. Например, если у вас непрерывные данные, то вы можете построить линейную диаграмму, а если дискретные, то рейтинг, точечную диаграмму и пай-чарт.
Ниже представлена расширенная версия схемы выбора диаграммы, которая учитывает тип данных, статика это или динамика, сложность построения диаграммы.
Рассмотрим конкретные примеры диаграмм. В этой главе вы познакомитесь подробнее с одной привычной диаграммой (круговой) и тремя более редкими (каскадной, диаграммой Дельта и диаграммой санкей).
Круговая диаграмма
Диаграмма круговая (пай-чарт) – способ графического изображения структуры, состава данных. Круг наглядно выражает всю совокупность, целое. Относительная величина каждого значения изображается в виде сектора круга, площадь которого соответствует вкладу этого значения в сумму значений. Сумма значений секторов всегда должна быть равна 100 % или целому значению.
Пай-чарт внешне похож на пирог, который нарезан на кусочки. С его помощью удобно показывать, как общий объем распределяется на части по определенному критерию. Например, так можно показать распределение населения России по разным возрастным группам.
Круговую диаграмму стоит использовать, когда количество частей целого, секторов, не больше пяти. Если их будет больше, то станет сложно увидеть различия между частями. Представьте, как и с пирогом: если его разрезать на 20 тоненьких кусочков, то сложно будет выбрать самый большой из них.
Если вернуться к примеру про распределение населения России по возрастным группам, то пай-чарт будет нагляден, если это будут крупные группы: например, 0–18, 18–36, 36–50, 50–65, 65 и старше. Если же нам нужно посмотреть, как распределено население по каждому возрасту: 0, 1, 2, и т. д., то лучше использовать столбиковую диаграмму.
Как вы уже поняли, недостаток пай-чарта – невозможность отразить множество категорий.
Несмотря на популярность пай-чарта, часто он не помогает эффективной визуализации, потому что используется некорректно.
Познакомимся с самыми частыми ошибками при использовании круговых диаграмм.
1. Попытка показать на пай-чарте сектор с отрицательным значением. Пай-чарт – это изображение целого и его составных частей. Все значения должны быть положительные, потому что в целом не может быть «минус сколько-то».
2. Использование в пай-чарте не целого и его частей, а просто отдельных категорий показателей. В этом случае сумма значений всех секторов не будет равна ста процентам. Она будет или больше, или меньше целого.
Вот, например, столбиковая (или столбчатая) диаграмма и пай-чарт, на которых показана статистика подачи предложений по улучшениям.
Есть три категории, которые обозначены разными цветами: подано, принято и реализовано. Однако те предложения, которые были реализованы, точно были ранее приняты, а еще ранее – поданы. Получается, что данные в разных категориях дублируются и никак не могут составлять одно целое. В этом случае правильным было бы построить столбчатую диаграмму, где высота столбика равна числу поданных предложений, а сам столбик поделен на три части: реализовано, принято и остаток. А если говорить о пай-чартах, то можно было бы построить диаграмму с категориями «принято» и «не принято» (сумма будет равна числу поданных предложений) и диаграмму «реализовано» и «не реализовано» (сумма может быть равна или числу поданных предложений, или числу принятых – в зависимости от того, что нам важно показать).
3. Использование пай-чарта для отображения рейтинга, а не состава.
Посмотрите на рисунок. Какой вывод приходит вам на ум, когда вы смотрите на этот пай-чарт?
Наверняка это что-то вроде: «Размер секторов примерно одинаковый, поэтому задолженность распределена равномерно». На самом деле задача этой диаграммы в том, чтобы показать рейтинг, то есть сравнение уровней задолженности. Не «Наша задолженность состоит из…», а «Вот кто должен нам больше, а кто меньше». Когда перед нами стоит задача сравнения, лучше использовать столбчатую диаграмму.
Выбор наиболее подходящего вида диаграммы обеспечивает эффективную передачу сообщения и помогает донести до собеседника именно ту мысль, которую вы сформулировали. Для ускорения процесса выбора диаграммы используйте схему выбора по четырем вопросам.
Мы с вами рассмотрели пай-чарт и упомянули столбиковые (столбчатые) диаграммы. Это популярные инструменты, знакомые каждому.
Пора перейти к более редким видам. Мы рассмотрим три примера: каскадную диаграмму, диаграмму Дельта и диаграмму санкей.
Каскадная диаграмма
Диаграмма каскадная (водопад) – это форма графической визуализации, которая позволяет определить общий (кумулятивный) эффект, последовательно представляет положительные и отрицательные значения факторов. Диаграмма отображает последовательность факторов, которые влияют на конечный результат.
Каскадную диаграмму удобно использовать, когда есть задача показать, как на первоначальное значение повлияли промежуточные факторы, какой вклад они внесли в начальное значение и что получилось в итоге.
Рассмотрим на примере. Представим, что на диаграмме изображено изменение показателя «Количество жалоб клиентов на качество сервиса, находящихся в обработке, по месяцам».
В первый месяц количество жалоб равнялось высоте крайнего левого столбика. Второй столбик слева показывает, что во второй месяц число жалоб выросло. Третий столбик демонстрирует, что жалобы в обработке уменьшились в третьем месяце (возможно, было мало новых жалоб, а возможно, было обработано очень много жалоб), а в четвертом вновь выросли. Итоговое значение количества жалоб равняется верхней границе четвертого столбика.
Обратите внимание: диаграмма показывает одновременно и то, что происходило в каждом месяце, и накопительный итог. В четвертом столбике размер самого столбика показывает, сколько жалоб поступило за месяц, а его итоговая высота – сколько всего жалоб в обработке прямо сейчас с учетом всех предыдущих месяцев.
Ниже вы найдете пример применения каскадной диаграммы для отображения структуры прибыли логистической компании. Даже мимолетного взгляда достаточно, чтобы понять, что самый большой вклад в чистую прибыль вносят доходы от перевозок, а самая большая категория расходов – это расходы на персонал. Все остальные категории расходов и доходов, а также размер итоговой чистой прибыли тоже визуально понятны.
Важно. Столбцы на каскадной диаграмме могут иметь отрицательные значения, то есть располагаться ниже оси X. Все, как в жизни: мы можем уходить «в минус».
Диаграмма Дельта
Диаграмма Дельта (отклонения) – это способ визуализации отклонений. Применяется, например, для отражения результатов деятельности в разных периодах (недовыполнили план – перевыполнили план).
Давайте посмотрим, как выглядит диаграмма Дельта для показателя «Изменение тем электронных писем по сравнению с предыдущим периодом».
Визуально понятно, что люди стали отправлять больше писем об автомобилях и меньше о приготовлении еды.
Диаграмма Дельта
Диаграмма санкей
Диаграмма Sankey (санкей, количественная схема) – это диаграмма процесса, которая показывает ключевые шаги процесса и интенсивность его протекания на каждом из участков в виде соединяющихся и разветвляющихся линий разной толщины (в зависимости от величины параметра). Линии на диаграмме Sankey объединяют в себе две характерные черты: линиями показаны взаимосвязи объектов, а ширина линии – сила этой связи.
Диаграмма санкей используется, например, в Google Analytics. Она помогает интернет-маркетологам анализировать, откуда и сколько трафика к ним приходит.
Этот вид диаграммы удобно использовать, если ваша цель – визуализировать движение потока через различные узлы. Это может быть поток денег, энергии, воды и т. д. Например, так можно отобразить нагрузку электросети, пропускную способность нефтепровода, движение финансовых потоков.
Рассмотрим два примера диаграммы санкей. На первой диаграмме проанализирован поток жалоб на некачественный капитальный ремонт зданий. Попробуйте рассмотреть диаграмму и сделать выводы самостоятельно.
Итак, мы видим, что было опубликовано 188 жалоб. Больше половины жалоб (58 %) было связано с ремонтом подъездов, а меньше всего жалоб было получено на ремонт фасадов.