6. Визуализация данных Flashcards
Line chart
Стандартный способ показать изменения данных во времени.
- Можно делать с двумя осями, но лучше с одной.
- Можно поставить маркер на точке, на которой нужно сделать акцент или подписать конец/начало линии.
- Нельзя подписывать все значения точек на графике.
Также не рекомендуется использовать данный тип графика, когда по оси x расположено не время.
Bar chart
Хорошо подходит для того, чтобы сравнить долю разных категорий или их ранг (топ-N значений).
- Лучше использовать горизонтальные столбики.
- Вертикальные рекомендуется использовать только в том случае, когда по оси X — время.
Pie chart
Pie = Пирог
Хорошо подходит только для одной задачи: показать соотношение небольшого количества категорий, образующих одно целое.
Почему этот тип графика критикуется? Определить точные значения по пайчарту довольно проблематично: считывание угла — довольно сложная операция, и на глаз такой график воспринимается плохо.
Area chart
График подойдет для ситуаций, в которых важно показать суммарный тренд и примерное распределение составляющих его компонент.
- Внизу располагается наибольшая или наиболее важная компонента.
- При комбинации с line chart можно показывать плановые и фактические значения.
Частая ошибка – предположение, что по данному графику “легко отследить динамику каждого компонента”. Это не так: график хорошо работает для отслеживания общей динамики и понимания примерной разбивки.
Scatter plot
График для отражения корреляции между двумя величинами. Размерами точки можно показать, например, удельный вес для этой точки.
KPI и Фактоиды
KPI и Фактоиды – крупные цифры, которые обозначают текущее значение метрики и тренд за какой-либо период.
- Самое важное значение лучше делать самым крупным.
- Показывать название метрики, которая отображается.
- Можно показывать дополнительную информацию (например, прирост в процентах).
Полезны для отображения текущих значений и трендов, особенно в операционных дашбордах.
Таблица
Хорошо позволяет считать точное значение или сравнить несколько разрезов по нескольким метрикам.
Параметры (dimensions)
Параметры (dimensions) – срезы, которые делят наши данные по каким-то смысловым категориям. Например, по региону или продукту. Чаще всего – какие-то дискретные значения, не агрегированы
Меры (measures)
Меры – метрики; то по каким параметрам мы хотим узнать что-то про измерения, т.е. то поле, которое мы агрегируем (например, число пользователей).
Дискретные значения
Создает разбивку(группировку)/таблицу, всегда не агрегированы
Примеры:
* Dimensions: Пол (м/ж), Регион, Тип пользователя, возрастная группа (18-22, 23-30 и тд)
- Measures: таких нет
Непрерывные значения
Создает ось
Примеры:
* Dimensions: оценка в школе (1, 2, 3.6), дата (янв. 2017, фев. 2017, янв. 2018)
- Measures: прибыль (1000, 2000, 2300), возраст, кол-во голосов и тп. Данные, которые можно агрегировать
Шаги алгоритма по созданию дашборда
1) Создание команды
Создать список участников и распределить задачи и роли в создании дашборда. Важнее всего акцентировать на ролях, так как команда может быстро меняться. Определить способ коммуникации внутри команды.
2) Организация интервью с заказчиком и понимание задачи
Исполнитель приступает к созданию дашборда лишь в том случае, если он полностью понимает задачу, а заказчик согласен с его пониманием. Необходимо понять модель бизнеса и определить его цель. А также понять, как сейчас существует бизнес и какие решения или прототипы решения уже есть.
3) Создание портрета пользователя
Создание такого портрета зависит от количества целевых пользователей. Если их мало (до 15 человек), то можно охватить всех человек. Если же пользователей больше, то нужно охватить все возможные группы пользователей, так как разным представителям будут интересен разный функционал. Топ-менеджер захочет оценить глобальную картину, в то время как менеджеру в конкретном подразделении будет интересна специфические показатели его отдела.
4) Контекст и формат взаимодействия
Какие требования от дашборда — в каких условиях человек взаимодействует с дашбордом. Необходимо описать эти условия — работа на ноутбуке или мобильная версия.
5) Вопросы от заказчика, ответы на них и возможные варианты бизнес-решений
Необходимо определить конкретные вопросы, на которые будет отвечать дашборд. Чем лучше написаны эти вопросы, тем лучше будет этот дашборд выполнять свою функцию. Эти вопросы выясняются при тесном взаимодействии с заказчиком. Вы должны четко понять, какие бизнес-задачи будет решать дашбод.
6) Определение источников и блоков для поступающих данных
Необходимо описать типы и структуры данных, понять источники их получения. Вам нужно задать вопрос, откуда физически возьмутся ваши данные — это поможет детальнее понять процессы и, возможно, выявить новые переменные, на которые стоит обратить внимание
7) Определение основных блоков отчета и типов графиков
Сформулируйте вопросы, на которые должен отвечать дашборд. В качестве ответа на каждый можно предложить график.
8) Создание прототипа и защита прототипа
Прототип (мокап) создается еще до первого создания дашборда — можно накидать макет и утвердить концепцию. Затем приступайте к созданию дашборда.
9) Запуск и тестирование
Самый простой способ понять сделали ли вы то, что надо — показать заказчику дашборд и понаблюдать за его работой. Также можно провести развернутый опрос, чтобы выявить проблемные места. Самый крутой вариант — сделать набор вопросов, на которые можно ответить с помощью вашего дашборда.
Как проводить интервью для оценки качества дашборда?
К нему стоит подготовится, а именно сделать следующее:
1) Составьте план интервью, тех тем и вопросов, которые вы хотите обсудить. Иногда это лучше делать с тем, кто запишет ваш разговор.
2) Используйте только понятные термины.
3) Старайтесь больше слушать в ходе интервью и меньше командовать. Ни в коем случае не давите знаниями!
4) Перефразируйте ваш вопрос, чтобы найти ту формулировку, которая поможет получить нужную информацию.
5) Не задавайте слишком много вопросов.
6) Применяйте тактику Коломбо — старайтесь вести себя просто, не сыпьте техническими терминами и дайте своему собеседнику почувствовать себя уверенно. Тут есть лайфхак, задайте вопрос: “А что я забыл спросить?”.
7) Напишите письмо-резюме, в котором будет тезисно изложена информация, полученная на интервью. Тогда вы будете уверены, что правильно поняли коллег.
Чек-лист перед запуском дашборда в продакшн
1) Отчёт сделан на сертифицированном источнике данных
2) Настроены уведомления в случае падения сборки данных
3) Отчёт грузится менее чем за X секунд
4) Отчёт оформлен по стайлгайду
5) Есть описание отчёта, отчёт назван в соответствии с требованиями
6) Есть документация на отчёт, ссылки на документы есть в отчёте
7) Проведено обучение основных пользователей отчёта
8) Сделана рассылка о появлении нового отчёта
9) Отчет добавлен в реестр отчётов
Способы подключения к данным в Tableau
Процесс подключение к данным в Tableau выглядит так же, как и в любой другой системе работы с данными. При запуске Tableau, в левом столбце вам будут указаны доступные типы подключений. Для подключения к данным можно использовать четыре способа:
1) Подключение к источнику данных на Tableau Server
Вы используете заранее созданные подключения к базе данных и опубликованные на сервере (Tableau server). Кликнув, вы переходите во внутренний интерфейс, где указаны доступные источники данных на сервере. Подключение к ним доступно по клику, доступы и авторизация вшиты внутрь, и вы можете выбрав таблицу, подключиться к ней.
2) Подключение к файлу
Пользователю доступны форматы и расширения (excel, csv, json, pdf и другие), которые поддерживает Tableau и встроенный инструмент парсинга. Такой тип подключения удобен, если вам необходимо совместить данные из внешней базы данных и локальной таблицей на вашем рабочем месте (ноутбуке).
3) Подключение к серверу
Это возможность подключения к различным базам данных. В начале этого списка будут показаны часто используемые вами виды подключений. По клику на строку More, вы можете посмотреть весь список предлагаемых вариантов. В последней версии Tableau есть так называемые Installed Connector - драйвера, которые умеют соединять Tableau с какой-нибудь базой данных и Additional Connectors (дополнительные) - драйвера, представленные в галерее, не установленные на ваш компьютер и которые Tableau изначально не прописало коннектор.
Кроме баз данных, Tableau предоставляет возможность подключения к облачным хранилищам.
Выбирая необходимый коннектор, вы заполняете параметры доступа и подключаетесь. После этого у вас появляется база данных и таблицы, доступные пользователю. Необходимую таблицу можно перетащить из левого столбца в правый либо можно создать custom SQL или Union.
После подключения к БД, у вас отображается интерфейс, знакомый вам по Tableau Public:
- область сборки данных (сверху);
- данные и значения, отображаемые в таблице (нижняя часть
4) Сохраненные источники
Если вы сделали какой-либо источник и используете его регулярно, он сохраняется у вас для быстрого доступа. Довольно удобно и экономно по времени.