6. Визуализация данных Flashcards
Line chart
Стандартный способ показать изменения данных во времени.
- Можно делать с двумя осями, но лучше с одной.
- Можно поставить маркер на точке, на которой нужно сделать акцент или подписать конец/начало линии.
- Нельзя подписывать все значения точек на графике.
Также не рекомендуется использовать данный тип графика, когда по оси x расположено не время.
Bar chart
Хорошо подходит для того, чтобы сравнить долю разных категорий или их ранг (топ-N значений).
- Лучше использовать горизонтальные столбики.
- Вертикальные рекомендуется использовать только в том случае, когда по оси X — время.
Pie chart
Pie = Пирог
Хорошо подходит только для одной задачи: показать соотношение небольшого количества категорий, образующих одно целое.
Почему этот тип графика критикуется? Определить точные значения по пайчарту довольно проблематично: считывание угла — довольно сложная операция, и на глаз такой график воспринимается плохо.
Area chart
График подойдет для ситуаций, в которых важно показать суммарный тренд и примерное распределение составляющих его компонент.
- Внизу располагается наибольшая или наиболее важная компонента.
- При комбинации с line chart можно показывать плановые и фактические значения.
Частая ошибка – предположение, что по данному графику “легко отследить динамику каждого компонента”. Это не так: график хорошо работает для отслеживания общей динамики и понимания примерной разбивки.
Scatter plot
График для отражения корреляции между двумя величинами. Размерами точки можно показать, например, удельный вес для этой точки.
KPI и Фактоиды
KPI и Фактоиды – крупные цифры, которые обозначают текущее значение метрики и тренд за какой-либо период.
- Самое важное значение лучше делать самым крупным.
- Показывать название метрики, которая отображается.
- Можно показывать дополнительную информацию (например, прирост в процентах).
Полезны для отображения текущих значений и трендов, особенно в операционных дашбордах.
Таблица
Хорошо позволяет считать точное значение или сравнить несколько разрезов по нескольким метрикам.
Параметры (dimensions)
Параметры (dimensions) – срезы, которые делят наши данные по каким-то смысловым категориям. Например, по региону или продукту. Чаще всего – какие-то дискретные значения, не агрегированы
Меры (measures)
Меры – метрики; то по каким параметрам мы хотим узнать что-то про измерения, т.е. то поле, которое мы агрегируем (например, число пользователей).
Дискретные значения
Создает разбивку(группировку)/таблицу, всегда не агрегированы
Примеры:
* Dimensions: Пол (м/ж), Регион, Тип пользователя, возрастная группа (18-22, 23-30 и тд)
- Measures: таких нет
Непрерывные значения
Создает ось
Примеры:
* Dimensions: оценка в школе (1, 2, 3.6), дата (янв. 2017, фев. 2017, янв. 2018)
- Measures: прибыль (1000, 2000, 2300), возраст, кол-во голосов и тп. Данные, которые можно агрегировать