Análise de Dados Flashcards
O que são dados estruturados?
Possuem uma estrutura rígida, os metadados estão definidos. Exemplo: esse será um dado do tipo decimal cujo nome será valor, porque é um dado de dinheiro.
O exemplo mais comum é o Bancos de dados.
O que são dados semiestruturados?
São dados que estão entre os dados estruturados e os dados não estruturados. Quando se fala de dados semiestruturados o que se tem é o dado acompanhado de uma certa descrição.
Exemplos: XML, HTML, pois existe uma organização nesses dados em que será possível pegar apenas pedaços de dados e colocar entre tags, mas não consegue controlar o que está ali dentro.
O que são dados não estruturados?
São os dados presentes em forma bruta, não existindo nenhuma espécie de planejamento de como organizar e armazenar aquele dado. A estrutura é flexível, não tem uma lógica prévia.
Exemplos: texto, imagem, vídeo. Não é possível organizar a forma com que os pixels aparecerão em uma imagem. Existe uma liberdade, pois qualquer coisa entre zero e dois, cinco, cinco, em um pixel de 256 cores é possível colocar o que quiser
O que é OLAP (Online Analytical Processing)?
OLAP é um tipo de processamento de dados que organiza, consolida e permite o acesso a dados de múltiplas fontes para tomada de decisão.
Permite extrair as informações dos dados armazenados no modelo dimensional, no Data Warehouse.
Abordagem e tecnologia usada para a análise interativa de dados multidimensionais.
Projetado para fornecer respostas rápidas a consultas analíticas complexas, permitindo que os usuários explorem os dados de maneira flexível e intuitiva.
O que é tabela fato?
A tabela fato contém os dados quantitativos do negócio, ou seja, os eventos que podem ser medidos e analisados. Contém métricas (fatos), como valores de vendas, quantidade de produtos vendidos, tempo de atendimento, etc.
Tabela Fato = Dados numéricos e transacionais (exemplo: vendas, pedidos, acessos).
O que é tabela dimensão?
A tabela dimensão contém dados qualitativos que descrevem os fatos e permitem análises detalhadas. Armazena atributos que ajudam a dar contexto à tabela fato.
Tabela Dimensão = Dados descritivos e qualitativos (exemplo: clientes, produtos, tempo, localização).
Quais as operações OLAP?
- MOLAP
- OLAP Multidimensional
- ROLAP
- OLAP Relacional
- HOLAP
- OLAP Híbrido
- WOLAP
- OLAP baseado em web.
- DOLAP
- Desktop OLAP
- RTOLAP
- OLAP em tempo real
- GOLAP
- OLAP gráfico
Quais as características do MOLAP?
- Forma clássica de OLAP (conhecido como OLAP).
- Armazena dados em um modelo de dados multidimensional.
- Pré-computação (cubo de dados) (MOLAP tradicional) ou computação sobre demanda (MOLAP rápido).
- As consultas são mais rápidas.
- Precisa de menos espaço em disco.
- Propensa à explosão de dados.
Quais as características do ROLAP?
- Trabalham diretamente com bancos de dados relacionais.
- Não realizam pré-computação.
- Os dados são mantidos como tabelas relacionais.
- As cargas são mais rápidas.
- Mais escalável.
- Tempo de desenvolvimento maior.
Quais as características do HOLAP?
- Permite armazenar dados em MOLAP e em ROLAP.
- Particionamento vertical:
- Agregações em MOLAP.
- Dados detalhados em ROLAP.
- Particionamento horizontal:
- Dados mais novos em MOLAP.
- Dados mais antigos em ROLAP
Quais as características do WOLAP?
- OLAP baseado em web.
- Análises e consultas baseadas em ambiente web.
- Navegação pelos dados de forma interativa.
Quais as características do DOLAP?
- Desktop OLAP.
- Dados acessados e analisados localmente.
Quais as características do RTOLAP?
- OLAP em tempo real.
Quais as características do GOLAP?
- OLAP gráfico.
- Utiliza gráficos e visualizações para auxiliar na análise e exploração dos dados.
Quais as principais operações OLAP?
Principais operações OLAP:
-
Roll-up (Consolidação ou Agregação)
- Resume os dados, agregando informações em um nível mais alto de abstração.
- Exemplo: Subir da granularidade “vendas por cidade” para “vendas por estado”.
-
Drill-down (Detalhamento ou Exploração)
- Faz o oposto do roll-up, descendo para níveis mais detalhados de dados.
- Exemplo: De “vendas por estado” para “vendas por cidade” ou até “vendas por loja específica”.
-
Slice (Fatiamento)
- Extrai um subconjunto dos dados fixando um valor em uma dimensão específica.
- Exemplo: Exibir apenas “vendas do mês de janeiro” em um cubo multidimensional.
-
Dice (Segmentação ou Corte)
- Similar ao slice, mas seleciona um subconjunto dos dados considerando múltiplas dimensões.
- Exemplo: Filtrar “vendas de janeiro e fevereiro” apenas para “a região sul”.
-
Pivot (Rotação ou Transposição)
- Altera a perspectiva dos dados trocando linhas por colunas para facilitar análises.
- Exemplo: Converter “vendas por região e mês” para “vendas por mês e região”.
-
Drill-through
- Permite acessar os dados transacionais detalhados que alimentam os agregados.
- Exemplo: Clicar em uma célula que mostra “total de vendas” e ver os detalhes individuais de cada transação.
Defina dado
Definição: Um elemento bruto, sem contexto ou significado por si só. Pode ser um número, um texto ou qualquer registro armazenado.
Exemplo: “25°C”, “João”, “R$100,00” são apenas dados isolados.
Defina informação
Definição: Quando os dados são organizados e contextualizados, tornando-se úteis para um propósito específico.
Exemplo: “A temperatura hoje é 25°C” → agora sabemos que “25°C” refere-se ao clima do dia.
Defina conhecimento
Definição: A interpretação da informação com base na experiência e análise, permitindo a tomada de decisões.
Exemplo: “Se a temperatura está em 25°C, posso sair sem casaco.” Aqui, há uma ação baseada na informação.
Defina inteligência
Definição: O nível mais alto da hierarquia, onde o conhecimento é aplicado estrategicamente para prever cenários, otimizar processos e inovar.
Exemplo: “A análise dos últimos anos mostra que quando a temperatura atinge 25°C, há um aumento na venda de sorvetes. Vamos aumentar o estoque antes dos dias quentes.”
Essa hierarquia é fundamental na análise de dados e tomada de decisões, sendo amplamente utilizada em Big Data, Business Intelligence (BI) e Inteligência Artificial (IA).