Modelagem de Dados Multidimensional Flashcards
De que se trata a Modelagem de Dados multidimensional?
A Modelagem de Dados Multidimensional ou apenas Dimensional é uma técnica de design
que é frequentemente usada para auxiliar na criação de sistemas de suporte à decisão, como Data
Warehouses. Esta técnica é caracterizada pela visualização de dados em várias dimensões e
facilita a realização de consultas complexas e agregações de dados.
Sobre Modelagem de Dados multidimensional
Defina FATOS
Fatos são os eventos ou ocorrências que são registrados no sistema. Eles são geralmente
representados por valores numéricos, como “valor venda” ou “valor compra”. Os fatos registram as as medidas e se materializam como tabelas no banco de dados
Sobre Modelagem de Dados multidimensional
Defina Dimensões
Dimensões são as categorias pelas quais os fatos podem ser divididos. Elas são geralmente
representadas por substantivos, como “produto” ou “tempo”. Também são representadas como tabelas
no baco de dados.
Sobre Modelagem de Dados multidimensional
Defina Medidas
Medidas são os valores numéricos associados a cada fato. Resumindo, os fatos são os valores numéricos subjacentes que representam os dados quantitativos, enquanto as medidas são as métricas derivadas ou calculadas a partir desses fatos para fornecer análises e insights específicos sobre os dados.
Ex: Se o fato é a quantidade de produtos em estoque, a medida associada seria simplesmente o número exato de unidades disponíveis.
Sobre Modelagem de Dados multidimensional
O que é uma Surrogate Key?
Uma surrogate key é uma chave artificial, geralmente numérica, que é adicionada a uma tabela de banco de dados para servir como identificador exclusivo para cada registro. Ela é diferente das chaves naturais, que são derivadas dos próprios dados, como um número de identificação de funcionário ou um código de cliente. As surrogate keys são usadas principalmente em situações onde não existe uma chave natural adequada ou quando é preferível ter uma chave estável e simples de ser gerenciada.
IdSurrogate IdClient Nome
1 1001 João
Sobre Modelagem de Dados multidimensional
O que é uma Role Playing(interpretação de papéis ) Dimension?
Role Playing Dimension: Uma dimensão que é usada várias vezes em um modelo
dimensional, em diferentes papéis. Por exemplo, a dimensão ‘Data’ pode ser usada como ‘Data
de Venda’, ‘Data de Entrega’ e ‘Data de Pagamento’.
Sobre Modelagem de Dados multidimensional
O que é uma dimensão degenerada?
Dimensão Degenerada: Uma dimensão representada por uma coluna diretamente na tabela
fato, sem uma tabela de dimensão correspondente. Comum em chaves primárias e
identificadores únicos, como um número de pedido.
Sobre Modelagem de Dados multidimensional
O que é uma Slowly Changing Dimension?
Slowly Changing Dimension: Uma dimensão que muda lentamente ao longo do tempo.
Existem diferentes tipos de implementações para lidar com essas mudanças, como manter
histórico completo, a versão mais recente ou uma combinação de ambas.
Sobre Modelagem de Dados multidimensional
Explique Métricas Aditiva, Não Aditiva e Semiaditiva
- Métricas Aditiva: Valores numéricos em uma tabela fato que podem ser somados ao longo de
qualquer dimensão, como vendas ou custos. - Métricas Não Aditiva: Valores que não podem ser somados ao longo de uma ou mais
dimensões, como temperaturas médias ou taxas de juros. - Métricas Semiaditiva: Valores que podem ser somados ao longo de algumas dimensões, mas
não todas, como saldo bancário, que pode ser somado ao longo de clientes, mas não ao longo
do tempo.
Sobre granularidade dos dados:
maior granularidade e menor granularidade
- maior granularidade → granularidade grossa → alta granularidade → menor detalhamento - Drill-up (roll up)
- menor nível de granularidade → granularidade fina → baixa granularidade → maior
detalhamento - Drill-down
Sobre granularidade dos dados:
Defina a tabela fato sem fato
Fato sem fato (factless table, fato de associação ou intersecção): Usada para cruzar
informações entre duas dimensões quando não há métrica para comparação. Pode capturar apenas a associação entre entidades dimensionais em um dado momento.
Sobre granularidade dos dados:
Defina a tabela de Fatos Não Aditivos
Fatos Não Aditivos são medidas que não podem ser somadas para qualquer dimensão no Data Warehouse. Por exemplo, uma média é um fato não aditivo porque a média de médias não fornece um resultado significativo