3.1 Noções de Modelagem Dimensional - I Flashcards
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
O Data Warehouse possui como características ser uma coleção de dados (1) orientada por assuntos, (2) integrada, (3) não volátil, (4) variante no tempo e (5) granularidade
Relacione as características acima com seus respectivos conceitos
( ) os dados são sempre inseridos, nunca excluídos. Ou seja, não existem alteração de dados, salvo quando é necessário fazer correções de dados previamente carregados.
( ) nível de sumarização dos elementos e de detalhes disponíveis nos dados
( ) consistência de nomes, das unidades, das variáveis etc, no sentido de que os dados foram transformados até um estado uniforme.
( ) são organizados conforme diferentes visões de negócio, sobre temas específicos importantes para a empresa.
( ) os dados referem-se a algum momento específico
(3) os dados são sempre inseridos, nunca excluídos. Ou seja, não existem alteração de dados, salvo quando é necessário fazer correções de dados previamente carregados.
(5) nível de sumarização dos elementos e de detalhes disponíveis nos dados
(2) consistência de nomes, das unidades, das variáveis etc, no sentido de que os dados foram transformados até um estado uniforme.
(1) são organizados conforme diferentes visões de negócio, sobre temas específicos importantes para a empresa.
(4) os dados referem-se a algum momento específico
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
Qual a diferença entre um Data Warehouse e um Data Mart? Como um pode auxiliar na construção do outro?
Data Warehouse: é um repositório único e central com os dados de todas as áreas da empresa.
Data Mart: são vários repositórios de dados, cada um referente à respectiva área da empresa.
Quando o Data Warehouse é segmentado para formar os Data Mart, damos o nome de Top-Down; já quando os Data Mart são unidos para formar um Data Warehouse damos o nome de Bottom-up.
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
O que é um Staging Area?
É uma área temporária em que os dados, após serem extraídos das fontes de dados externas, serão transformados, limpos e preparados para a etapa de carregar no Data Warehouse.
Ou seja, o Staging Area é uma área intermediária no processo de Extract, Transform and Load, em que, após a extração, para que os dados possam ser preparados para serem carregados no sistema, eles ficam nesta Staging Area até que estejam limpos e organizados para serem inseridos no sistema final.
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
O que é uma Tabela de Fatos? E uma Tabela de Dimensões?
Uma tabela de fatos é uma tabela que carrega o registro dos fatos que são importantes para o negócio e que é composta pelo relacionamento entre várias outras tabelas que irão compor a informação final.
Imagine que vamos fazer uma tabela das Vendas da MAQVAC, utilizando para isto da tabela de Produtos, da tabela de Clientes, da tabela de Transportadoras, da tabela de Método de Pagamento, interligando cada informação destas respectivas tabelas para criar uma nova tabela que vai conter os registros das Vendas.
Já a tabela de dimensões são as subtabelas que irão compor a tabela de fatos. No exemplo acima, as Tabelas Dimensões são justamente as subtabelas Produtos, Clientes, Transportadoras, Método de Pagamento etc, que juntas formam uma Tabela de Fatos.
Portanto, as Tabelas de Dimensões são as condições, os parâmetros, por assim dizer.
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
O que é o cubo?
Os cubos são massas de dados que retornam das consultas feitas ao banco de dados e podem ser manipulados e visualizados por inúmeros ângulos e diferentes níveis de agregação. É uma representação intuitiva do fato porque todas as dimensões coexistem para todo ponto no cubo e são independentes uma das outras.
É apenas uma representação conceitual ou uma metáfora visual.
É como se cada dimensão do cubo representasse as características do fato. Imagine que eu esteja falando sobre carros: uma das dimensões carrega as cores possíveis, outra dimensão os modelos, em outra as possíveis marcas e por aí vai.
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
Qual a diferença entre o modelo Estrela e o modelo Floco de Neve?
Estrela: Tabela de Fatos fica no centro do esquema e as tabelas dimensões que a compõem ficam em volta. Recebe o nome estrela pois é como se a tabela de fatos fosse a própria estrela e suas pontas fossem as tabelas dimensões.
Floco de Neve: é uma variação do modelo estrela, em que alguma ponta da estrela “explode” em mais tabelas
No modelo estrela, todas as tabelas se relacionam com a tabela de fatos; já no modelo floco de neve algumas tabelas se relacionam apenas com outras tabelas dimensões.
Em Matéria de Tecnologia da Informação, quanto às Noções de Modelagem Dimensional,
O tratamento de dados linguísticos pode se dar pela abordagem (1) linguística ou (2) temática. Relacione-as com as definições abaixo
( ) trata o texto de acordo com a língua na qual ele está escrito, sendo sua utilização muito complexa e pouco flexível (uma análise deve ser feita para cada língua).
( ) utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa
(1) trata o texto de acordo com a língua na qual ele está escrito, sendo sua utilização muito complexa e pouco flexível (uma análise deve ser feita para cada língua).
(2) utiliza a análise de strings de caracteres para classificar o texto em determinadas categorias, que são definidas previamente de acordo com o objetivo da empresa