13 Visualização de Dados Flashcards
A dashboard is a type of graphical user interface which often provides at-a-glance views of key performance indicators (KPIs) relevant to a particular objective or business process (Wikipedia)
Tradução = Painel de Controle?
Pra que serve um texto?
Comunicar, informar, revelar, explicar, convencer, seduzir, doutrinar, mostrar um viés político
INTERPRETAÇÃO
Gráficos e textos são linguagens informais
Dependem de contexto, background cultural
Para serem úteis precisam ser interpretados, aprendidos, transformados em informação e conhecimento
Interpretações frequentemente são conflitantes
Público alvo de Dashboards ocasionalmente nem encosta no computador, varia muito
Toda informação é processada pré-atentivamente (Sistema 1)
Para maximizar o poder e eficácia de uma visualização, devemos codificar o máximo possível de informação em características pré-atentivas (Sistema 1)
Informação que tem maior relevância (para que uma pessoa está pensando no momento) é selecionada para ser processada conscientemente (Sistema 2)
Toda informação é processada pré-atentivamente (Sistema 1)
Para maximizar o poder e eficácia de uma visualização, devemos codificar o máximo possível de informação em características pré-atentivas (Sistema 1)
Informação que tem maior relevância (para que uma pessoa está pensando no momento) é selecionada para ser processada conscientemente (Sistema 2)
Números e textos não são percebidos pré-atentivamente porque são aprendidos (Sistema 2)
Como se percebe uma visualização?
Sistema 1 - rápido, automático, frequente, emocional, subconsciente, estereotipado
Sistema 2 - lento, trabalhoso, infrequente, lógico, consciente, calculista
A percepção é uma Ilusão!
Cuidado ao produzir suas visualizações, para os usuários não ficarem vendo sempre na mesma ótica
A percepção é uma Ilusão!
Cuidado ao produzir suas visualizações, para os usuários não ficarem vendo sempre na mesma ótica
Dá impressão ao usuário de que ele viu tudo
Representações visuais são aprendidas, percebemos mais facilmente o que já conhecemos
Podemos entender gráficos complexos e compactos, mas podemos nos enganar na primeira impressão
Objetivo da visualização é encontrar maneira mais simples e precisa para compreender e comparar dados: transformá-los em informação e conhecimento
Revelar o Invisível!
A visualização de dados permite trabalhar com universos e dimensões que não existem no mundo das coisas visíveis
Espectros de luz invisível
Quatro ou mais dimensões físicas
Ondas e linguagens sonoras
Infinitamente grande e infinitamente pequeno
Abstrações matemáticas e filosóficas, conceitos e idéias, quantidades, estatísticas
Por que visualizar?
Para ter uma visão abrangente dos dados (é difícil lembrar de muitos números em uma tabela)
Para comparar valores rapidamente
Para descobrir padrões dentre os valores
Para comparar padrões
Por que visualizar?
Para ter uma visão abrangente dos dados (é difícil lembrar de muitos números em uma tabela)
Para comparar valores rapidamente
Para descobrir padrões dentre os valores
Para comparar padrões
O poder de um gráfico é permitir que informação quantitativa seja organizada de forma a revelar padrões e estruturas que não são facilmente detectadas por outros meios de análises de dados
As representações mais eficientes…
Mais simples (rapidamente compreendidas)
Mais atraentes (prendem a atenção)
Seguem convenções (usam formas já aprendidas)
Mais fáceis de comparar (posições, comprimentos)
Mas compactas (pontos mais próximos são mais fáceis de comparar)
Não deixe de olhar o público (mais preciso para o menos preciso):
1) posição em uma escala comum
2) posições em escalas não alinhadas
3) comprimento, direção, ângulo
4) área
5) volume, curvatura
6) sombras, saturação de cor
A importância da precisão é maior quanto mais analítica ou exploratória for a visualização
Nos outros casos é possível escolher o nível ideal de compromisso entre precisão e interesse visual necessária para a história que está sendo contada e seu público
Você consegue imaginar ter que interpretar sozinho milhões de linhas de dados sem ter gráficos para traduzir essas informações de forma visual?
DESAFIOS:
Gerenciar a qualidade dos dados exibidos, para garantir decisões certeiras
Integrar dados de diferentes fontes, inclusive dados em tempo real
Traçar uma linha de raciocínio clara na análise dos dados, com técnicas de storytelling
Integrar os painéis gerenciais nas atividades diárias com plataformas mobile
OLAP = OnLine Analytical Process
Anos 90
Ferramentas utilizadas para apoiar os gestores, visando obter novos insights para auxiliá-los no processo de tomada de decisão
Dado é a matéria prima da informação
Transformação de dado em informação é conhecimento
Informação é o dado tratado dentro de um contexto
Conhecimento é a capacidade de resolver problemas baseados nas informações prévias
De onde vem os dados?
Os dados que serão lidos podem estar armazenados em Data Warehouse ou em Data Lake, ou ainda em uma planilha, arquivo texto, CSV dentre outros
O importante é ter conector para estas origens e apresentar os dados, gerando as informações que serão consumidas pelos gestores
O conhecimento por vir de uma correta história contada pela visualização produzida
ROLAP - relacional
MOLAP - multidimensional
HOLAP - híbrido
DOLAP - desktop (local)
WOLAP - web
JOLAP - API java
SOLAP - Spatial, SIG + OLAP
Requisitos funcionais para OLAP
Suporte para múltiplas dimensões, fontes de dados diversas, hierarquias, fórmulas dimensionais, pivoteamento, drill e interações
Segundo Thomsen (2002) uma "meta" normalmente indicada para os sistemas OLAP é oferecer um tempo médio de resposta de 5 segundos ou menos, não importa o tipo de consulta ou o tamanho do banco de dados. IMPOSSÍVEL !
Algumas ferramentas famosas
Business Objects (SAP)
Cognos (IBM)
MicroStrategy
Mondrian (Pentaho)
OBIEE+ (Oracle)
Power BI (Microsoft)
Qlik Sense (Qlik)
Tableau
ThoughtSpot
Gartner (2019)
Leaders: ability to execute and completness of vision
PBI, Tableau, Qlik, ThoughtSpot
Challengers: only ability to execute OK
MicroStrategy
Visionaries: only completness of vision OK
Salesforce, Sisense, TIBCO, SAS, SAP
Niche players: incompletos
demais, incluindo Oracle e IBM
É a exploração visual/interativa e a relativa representação gráfica de dados de qualquer dimensão, a sua natureza e origem
Permite em síntese, identificar fenômenos e tendências invisíveis a uma primeira análise de dados
É necessário que o analista e/ou usuário saibam como devem ser organizados seus dados, a fim de que eles possam ser corretamente apresentados e interpretados
Uma vez publicados em produção estes dados passam a ser institucionalizados na empresa e decisões passarão a ser tomadas com as informações geradas
A capacidade de ver a história por trás dos números faz da visualização de dados uma ferramenta poderosa para compartilhar e comunicar informações
A visualizações de dados pode ser usada para: demonstrar tendências, desempenho dos negócios, dar embasamento a novas estratégias, mostrar correlações e muito mais
Requisitos funcionais para OLAP:
Suporte para múltiplas dimensões, fontes de dados diversas, hierarquias, fórmulas dimensionais, Drill, Pivoteamento, Slice and Dice, Interações
Drill Down
Ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade
Ex: UF para cidade
Drill Up
Ocorre quando o usuário aumenta a granularidade, diminuindo o nível de detalhamento da informação
Ex: cidade para UF
Drill Across
Pular de uma dimensão para outra dimensão. É necessário a utilização de duas tabelas fatos e essas tabelas tem que compartilhar a mesma dimensão intermediária.
Drill Across
Pular de uma dimensão para outra dimensão. É necessário a utilização de duas tabelas fatos e essas tabelas tem que compartilhar a mesma dimensão intermediária.
“uma operação sobre dois cubos, os dados nos dois cubos são combinados nas dimensões comuns aos mesmos”
“embora correlacionados, estão em estruturas separadas, porém unidas por algumas dimensões coerentes”
Drill Throught
Possui o funcionamento parecido com o Drill Down, porém tem como característica a possibilidade de buscar os dados, ou informações, fora da estrutura principal. Por exemplo, após alcançar o nível máximo de detalhe em uma tabela fato, tem necessidade de se obter mais detalhe sobre determinada célula, como a nota fiscal, por exemplo, é possível acessar o arquivo de origem dessa informação, diminuindo a granularidade, aumentando o nível de detalhe e saindo da estrutura principal do DW ou de Data Mart.
Pivoteamento
Como em uma tabela dinâmica no Excel, poder ver os dados hora por linha e depois mover (pivotear) para colunas e vice-versa
Slice and Dice
Serve para modificar a posição de uma informação, trocar linhas por colunas de maneira a facilitara compreensão dos usuários e girar o cubo sempre que tiver necessidade
No OLAP as informações são armazenadas em cubos multidimensionais, que gravam valores quantitativos e medidas, permitindo visualização através de diversos ângulos. Estas medidas são organizadas em categorias descritivas chamadas de dimensões e formam, assim, a estrutura do cubo.
STORYTELLING
O que é?
Há uma história em seus dados. Mas suas ferramentas não sabem que a história é essa
As histórias de dados exploram e explicam como e por que os dados mudam ao longo do tempo, geralmente por meio de uma série de visualizações vinculadas
Embora a visualização seja quase sempre um elemento-chave nas histórias de dados, ela é apenas uma parte de uma estratégia de três partes:
Visualização + Narrativa + Contexto
É importante que os números sejam vistos como personagens ou que tenham um significado por trás de alguma estatística
No entanto quando os transformamos em uma história, ao invés de apenas apresentá-los chegamos a conclusões
Dicas importantes:
- contar a história certa para sua audiência
- encontre a narrativa por de trás dos números
- contextualize todos os dados para torná-los relevantes
- agregar para depois detalhar
- aplique a melhor visualização (tipo de gráfico, planilha, mapa, nuvem de palavras, etc) para ajudar na comunicação
- comece sempre trazendo a informação mais agregada e através do movimento da esquerda para direita e de cima para baixo, vá detalhando a história que gerou aquela agregação
2 medidas: gráficos de dispersão
3 medidas: gráficos de bolhas
Gráfico busca expressar visualmente dados ou valores obtidos, com o intuito de facilitar a compreensão
Sua importância está ligada à facilidade e rapidez com que podemos interpretar as informações. Os dados coletados podem ser organizados em gráficos e apresentados de uma forma mais clara e objetiva.
Muitas vezes, é realizado uma escolha errada do tipo de gráfico para ser configurado e visualizado no Dashboard
Também a repetição do mesmo formato de gráfico fica cansativo aos olhos de um analista, não combina com todos os tipos de resultados apresentados
A história da criação dos gráficos é antiga.
Jean Heinrichi Lambert, físico e matemático alemão, foi quem primeiro criou o diagrama estatístico.
William Playfair construiu o gráfico de pizza, linhas, barras e área. Ambos no século XVIII.
Studies have shown that we have about
3–8 seconds with our audience, during which time they decide
whether to continue to look at what we’ve put in front of them or
direct their attention to something else.
.
I typically design my visuals in shades of grey and pick a single bold color to draw attention where I want it. My base color is grey, not black, to allow for greater contrast since color stands out more against grey than black. For my attention‐grabbing color, I often
use blue for a number of reasons: (1) I like it, (2) you avoid issues of colorblindness that we’ll discuss momentarily, and (3) it prints well in black‐and‐white. That said, blue is certainly not your only option
(and you’ll see many examples where I deviate from my typical blue for various reasons).`
Blue Positive
Orange Negative
.Saturação de cores!
Não precisa usar sempre as mesmas cores em gráficos diferentes, especialmente se forem do mesmo tema.
Mudar cor ajuda a mostrar que mudou tópico.
Color evokes emotions.
Roughly 8% of men (including my husband and a former boss) and
half a percent of women are colorblind. This most frequently manifests itself as difficulty in distinguishing between shades of red and
shades of green. In general, you should avoid using shades of red
and shades of green together.
When I’m designing a visual and selecting colors to highlight both
positive and negative aspects, I frequently use blue to signal positive
and orange for negative
See your graphs and slides through colorblind eyes
T here are a number of sites and applications with colorblindness simulators that allow you to see what
your visual looks like through colorblind eyes. For example,
Vischeck (vischeck.com) allows you to upload images
or download the tool to use on your own computer.
Color Oracle (colororacle.org) offers a free download for
Windows, Linux, or Mac that applies a full‐screen color
filter independent of the software in use. CheckMyColours
(checkmycolours.com) is a tool for checking foreground
and background colors and determining if they provide
sufficient contrast when viewed by someone having
color‐sight deficiency
“You know you’ve achieved perfection, not when you
have nothing more to add, but when you have nothing to take away”
Airman’s Odyssey, Antoine de Saint‐Exupery, 1943
When detail isn’t needed, summarize.
You should be familiar with the detail, but that doesn’t mean your audience needs to be.
Make it legible: use a consistent, easy‐to‐read font (consider both typeface and size).
Keep it clean: make your data visualization approachable by leveraging visual affordances.
Remove unnecessary complexity: when making a choice between simple and complicated, favor simple.
Use straightforward language: choose simple language over complex, choose fewer words over more words, define any specialized language with which your audience may not be familiar, and spell out acronyms (at minimum, the first time you use them or in a footnote).
Text is your friend
The title bar at the top of your PowerPoint slide is precious real estate: use it wisely! This is the first thing your audience encounters on the page or screen and yet so often it gets used for redundant descriptive titles (for example, “2015 Budget”). Instead use this space for an action title. If you have a recommendation or something you want your audience to know or do, put it here (for example, “Estimated 2015 spending is above budget”). It means your audience won’t miss it and also works to set expectations for what will follow on the rest of the page or screen.
When it comes to communicating with data, is it really necessary to “make it pretty?”
The answer is a resounding Yes
It is a fact of human nature that most people experience some level of discomfort with change. Lidwell et al. in Universal Principles of
Design (2010) describe this tendency of general audiences to resist the new because of their familiarity with the old. Because of this, making significant changes to “the way we’ve always done it” may
require more work to gain acceptance than simply replacing the old with the new.
Articulate the benefits of the new or different approach.
Show the side‐by‐side.
Provide multiple options and seek input.
Get a vocal member of your audience on board.
Bing
Bang
Bongo
Falar 3 vezes a mesma coisa ao longo da apresentação:
Setup
Conflict
Resolution