Business Intelligence Flashcards

1
Q

Quais os principais objetivos do Business Intelligence?

A
  • Permitir o acesso interativo (por vezes em tempo real) aos dados;
  • Permitir a manipulação de dados;
  • Dar aos gestores e analistas a capacidade de realizar análise adequada.

BI utiliza como principais ferramentas os softwares para consulta e relatórios de banco de dados, ferramentas para análise multidimensional de dados e o data mining.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Componentes de uma BI:

A
  • O Data Warehouse (DW) com suas fontes de dados;
  • O Business Analytics, uma coleção de ferramentas para manipulação, mineração,
    análise de dedados do DW;
  • O Business Performance Management (BPM) para monitoramento e análise de
    performance;
  • A Interface com o usuário, por exemplo, um dashboard.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Em BI, consultas criadas sob demanda especificamente para um conteúdo, layout ou cálculo, agilizando ou facilitando a tomada de decisão, são chamadas de:

A

Em Business Intelligence (BI), as consultas de dados que NÃO estão disponíveis em
relatórios periódicos, ou seja, consultas criadas sob demanda especificamente para um
conteúdo, layout ou cálculo, agilizando ou facilitando a tomada de decisão, são chamadas
de consultas ad hoc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Defina Data Warehouse (DW):

A

Podemos definir um DW como um grande repositório de dados, não volátil e histórico, que tem como objetivo permitir consultas rápidas e complexas, principalmente através de ferramentas OLAP, a fim de auxiliar na manutenção do negócio e na tomada de decisão estratégica.

Banco de dados, com ferramentas de consulta e relatório, que armazena dados atuais e históricos extraídos de vários sistemas operacionais e consolidados para fins de análises e relatórios administrativos (Laudon&Laudon).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quais as Caracterírsticas de um Data Warehouse?

A
  • Orientado por Assuntos (Temas);
  • Integrados;
  • Não volátil;
  • Variável no tempo (série temporal);
  • Granularidade de dados.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

DW: Orientado por assuntos (Temas)

A
  • Os dados são organizados por assunto pormenorizado, como vendas, produtos ou
    cliente.
  • Refere-se ao fato do DW armazenar informações sobre temas específicos importantes para o negócio da empresa.
  • Exemplos típicos de temas são: produtos, atividades, contas, clientes, etc.
  • A orientação por assunto proporciona uma visão mais abrangente da organização.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

DW: Integrado

A
  • Os data warehouses devem colocar os dados de diferentes fontes em um formato consistente.
  • Refere-se à consistência de nomes, das unidades das variáveis, etc, no sentido de que os dados foram transformados até um estado uniforme.
  • Se um elemento de dado é medido em centímetros em uma aplicação, em polegadas em outra, ele será convertido para uma representação única ao ser colocado no Data Warehouse (Campos, 1999).

Por exemplo, considere-se sexo como um elemento de dado.
Uma aplicação pode codificar sexo como M/F, outra como 1/0 e uma terceira como H/M. Conforme os dados são inseridos para o Data Warehouse, eles são convertidos para um estado uniforme, ou seja, sexo é codificado apenas de uma forma.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

DW: Não-volátil

A
  • Após os dados serem inseridos em um DW, os usuários não podem alterar ou atualizá-los.
  • Significa que o Data Warehouse permite apenas a carga inicial dos dados e consultas a estes dados.
  • Após serem integrados e transformados, os dados são carregados em bloco para o Data Warehouse para que estejam disponíveis aos usuários para acesso.
  • No ambiente operacional, ao contrário, os dados são, em geral, atualizados registro a registro, em múltiplas transações.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

DW: Variável no Tempo (Série Temporal)

A
  • Um data warehouse mantém dados históricos.
  • Segundo W.H.Inmon todos os dados no DW são precisos em algum instante no tempo, como eles podem estar corretos somente em um determinado momento, é dito que esses dados “variam com o tempo”.
  • O tempo é um dimensão importante à qual todo DW deve oferecer suporte.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

DW: Granularidade dos dados

A
  • Refere-se ao nível de sumarização dos elementos e de detalhe disponíveis nos dados.
  • Em um nível de granularidade muito alto, o espaço em disco e o número de índices necessários se tornam bem menores, há, porém, uma diminuição da possibilidade de utilização dos dados para atender a consultas detalhas.
  • Quanto maior o nível de detalhes, menor o nível de granularidade.
  • O nível de granularidade afeta diretamente o volume de dados armazenado no DW e ao mesmo tempo o tipo de consulta que pode ser respondida.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Cite algumas das principais diferenças entre Data Warehouses e Banco de Dados tradicionais:

A

Banco de Dados Tradicionais
- São transacionais (relacionais, OO, em rede ou hierárquicos).
- Têm suporte para o processamento de transação on-line (OLTP - Online Transaction Processing).
- Inclui inserções, atualizações e exclusões.

Data Warehouse
- Tem a característica de servir principalmente para aplicações de apoio à decisão.
- Eles são otimizados para recuperação de dados, e não para processamento de transação de rotina.
- Utiliza o online analytical processing (OLAP) para a análise de dados complexos.
- Contem quantidades muito grandes de dados de várias fontes, que podem incluir bancos de dados de diferentes modelos de dados e, às vezes, arquivos adquiridos e sistemas e plataformas independentes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Formam a estrutura de um Data Warehouse:

A
  • Sistemas operacionais de origem;
  • Data Staging Area (DAS);
  • Data Presentation Area (Apresentação dos Dados);
  • Data Access Tools (Ferramentas de acesso a dados).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Sistemas operacionais de origem

A
  • São considerados externos ao DW porque não existe pouco ou nenhum controle sobre o conteúdo e o formato dos dados.
  • As principais propriedades desse sistema são o desempenho e a disponibilidade de processamento.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Data Staging Area (DAS)

A
  • Parte do Data Warehouse responsável por receber a extração, transformação e carga (ETL) das informações dos sistemas transacionais
    legados, para posterior geração dos Data Marts de destino.
  • A Staging Area é considerada área fora do acesso dos usuários, por isso não deve suportar consultas dos Usuários.
  • Ela pode ser composta por arquivos textos ou tabelas de banco de dados normalizadas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Passos de obtenção dos dados do Data Staging Area (DAS)

A
  1. Extração para o Staging Area
  2. Transformações
    2.1. Filtragem dos dados
    2.2. Combinação dos dados
    2.3. Cancelamento de dados duplicados
  3. Carga
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Data Presentation Area (Apresentação dos Dados)

A
  • Área responsável pela apresentação dos dados, não deve ser utilizada para limpeza ou transformação de dados.
  • Organizada em Data Marts, orientados a processos de negócios, e não a unidades de negócio, departamentos ou funções específicas.
  • Um Data Mart é composto por dados atômicos e dados sumarizados para uma melhor performance.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Data Access Tools (Ferramentas de acesso a dados)

A
  • O último componente principal do ambiente de DW.
  • O termo ferramenta refere-se à variedade de recursos com que usuários de negócio podem contar para melhorar a tomada de decisões analítica.

Ad Hoc query tools, report writers, aplicações analíticas, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Conceito de Armazenamento Operacional de Dados (ODS)

A
  • No âmbito dos DWs, representa um armazenamento intermediário que facilita a integração dos dados de ambiente operativo antes da sua atualização no DW.
  • Os ODS são cópias bastante integradas e frequentemente atualizadas de dados operacionais.
  • A frequência de atualização e o nível de integração de um ODS dependem das exigências especificas.
  • Atualmente, alguns autores passaram a denominá-lo Dynamic Data Storage (DDS).

O ODS pode ser um terceiro sistema físico localizado entre os sistemas operacionais e o DW ou uma partição automática especialmente administrada do DW propriamente dito.
Inicialmente, um ODS era considerado um repositório temporário que armazenava apenas informações correntes antes de serem carregadas para o DW.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Data Mart

A
  • Um data warehouse une bancos de dados de toda uma empresa;
  • Os Data Marts (DM) são repositórios de dados especializados em uma determinada área ou departamento do negócio.
  • Assim, o DM é um subconjunto dos dados de um Data Warehouse e, dependendo da abordagem, podem ser construídos antes ou depois do DW.
  • É como se fossem DW departamentais, ou seja, categorizados por tema ou área.
  • DM normalmente é menor e se concentra em um assunto ou departamento específico.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

As principais distinções entre um data mart e um data warehouse são as de que um data mart é ESPECIALIZADO e VOLÁTIL.

A
  • Por especializado entende-se que o data mart (ferramenta OLTP) possui uma estrutura baseada em um ambiente, tema, situação, área, setor ou aplicação específica, enquanto o DW (ferramenta OLAP) se baseia em várias fontes de diversas aplicações, fontes e situações para facilitar um suporte a decisão gerencial.
  • Por volátil, entende-se que os dados do data mart são alterados frequentemente, enquanto os do DW, por guardarem histórico, só são alterados quando uma carga foi feita de forma errada, mas não frequentemente como em um data mart (que é baseado em aplicações)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Modelagem Multidimensional

A
  • A modelagem multidimensional é um sistema baseado em recuperação que suporta acessos com alto volume de consultas.
  • A representação multidimensional dos dados, junto com todos os agregados, é conhecida como cubo de dados, sendo este uma generalização do que é conhecido na terminologia estatística como tabulação cruzada.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Na modelagem dimensional (ou multidimensional) temos 2 tipos principais de tabelas. São elas:

A

Tabela Fato e Tabela Dimensão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Tabela Fato

A
  • Tabela central do projeto dimensional.
  • Armazena atributos quantitativos (ou métricas) sobre um fato registrado.
  • Ela contém chave(s) estrangeira(s) que aponta(m) para uma tabela dimensão.
  • Servem para o armazenamento, medidas numéricas associadas a eventos de negócio.
  • Cada uma das medições é obtida na interseção de todas as dimensões.
  • Em consultas a tabela de fatos são usados centenas, milhares ou até milhões de
    registros para a construção da resposta.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Tabela Dimensão

A
  • Contém atributos qualitativos (ou descritivos) sobre os fatos registrados.
  • Representa entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente, etc.
  • Consiste em tuplas de atributos da dimensão.
  • As tabelas dimensão têm uma relação 1:N com a tabela fato.
  • A tabela de fatos contém os dados, e as dimensões identificam cada tupla nesses dados.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Medidas

A
  • Aditivas: São as mais frequentes e são obtidas por meio da soma de valores gerados pela seleção de membros das dimensões. Exemplo: lucro líquido;
  • Semi-aditivas: São medidas obtidas a partir da soma de apenas partes de suas dimensões. Exemplo: quantidade em estoque (não faz sentido somá-la através da dimensão tempo);
  • Não-aditivas: São medidas que não podem ser somadas através de nenhuma de suas dimensões. O exemplo mais comum desse tipo de medidas são valores percentuais.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Dimensão

A
  • Representação dos contextos relevantes para a análise de um fato.
  • Exemplo:
    ▪ Fato: Vendas.
    ▪ Dimensões: Clientes, Produtos, Tempo, Locais, …
  • Uma dimensão pode conter membros; ser organizada em hierarquias.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Chave Surrogada (surrogate key)

A
  • Tem as características de uma Primary Key;
  • É utilizada para referenciar a dimensão na fato;
  • É auto incremental;
  • É uma chave artificial;
  • É criada no Data Warehouse;
  • Seu valor não é derivado dos dados
    armazenados no banco de dados;
  • Não pode ser manipulável ou alterável pelo usuário;
  • Não pode se repetir.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

São Técnicas de Modelagem Multidimensional

A
  • Esquema Estrela (Star Schema);
  • Esquema Flocos de Neve (Snowflake)
28
Q

Esquema Estrela (Star Schema)

A

-No esquema estrela existe uma tabela fato no centro e apenas uma única tabela para cada dimensão, pois elas não estão normalizadas.

Normalização é o processo de organização de dados em um banco de dados. Isso inclui a criação de tabelas e o estabelecimento de relações entre essas tabelas de acordo com as regras projetadas para proteger os dados e tornar o banco de dados mais flexível, eliminando a redundância e a dependência inconsistente.

29
Q

Esquema Flocos de Neve (Snowflake)

A
  • Esquema Flocos de Neve (Snowflake)
  • O esquema floco de neve é uma variação do esquema estrela.
  • Existe uma tabela fato no centro e múltiplas tabelas dimensão conectadas a ela.
    ▪ Essas dimensões são organizadas em uma hierarquia porque elas são normalizadas.

A normalização das tabelas de dimensão em um star schema conduz a um: esquema snowflake.

30
Q

O que é normalização de dados?

A

Normalização é o processo de organização de dados em um banco de dados. Isso inclui a criação de tabelas e o estabelecimento de relações entre essas tabelas de acordo com as regras projetadas para proteger os dados e tornar o banco de dados mais flexível, eliminando a redundância e a dependência inconsistente.

31
Q

Constelação de Fatos

A

É um conjunto de tabelas fatos que compartilham algumas tabelas dimensão.

32
Q

Conformed Dimension

A
  • As tabelas de dimensões estão em conformidade quando os atributos em tabelas de dimensões separadas têm os mesmos nomes de coluna.
  • As informações de tabelas fato separadas podem ser combinadas em um único relatório usando atributos de dimensão conformes que estão associados a cada tabela de fato.
  • Quando tabelas de dimensão distintas possuem os mesmos nomes de colunas e conteúdos de domínio para diversas tabelas Fatos.
    ▪ Conformed Dimension são reutilizadas em tabelas de fatos fornecendo assim uma consistência analítica e uma redução de custo de desenvolvimento futuro.
  • Mesma dimensão usada para diferentes fatos com mesmo significado.
  • É uma dimensão que tem o mesmo significado para todas as fatos com que se relaciona. Uma boa prática é deixar todas as dimensões conformadas.
33
Q

Degenerate Dimension

A
  • Quando um atributo da dimensão é armazenado como parte da tabela fato e não em uma tabela separada.
  • É a dimensão que não mereceu ser uma tabela dimensão e foi inserida como coluna na fato.
34
Q

Role-playing Dimension

A
  • Uma única dimensão pode ser referenciada várias vezes em uma tabela fato, com cada referência vinculada a uma função logicamente distinta para a dimensão.
  • Mesma dimensão, usada em diferentes fatos, porém com significados diferentes.
35
Q

Slowly Changing Dimension

A
  • Slowly Changing Dimensions SCD (Dimensões que Mudam Lentamente, em português) e retrata as dimensões que sofrem atualizações em seus campos e os classifica pelo tipo de mudança existente em cada uma delas.
  • Todas as dimensões são SCD, porque elas vão precisar atualizar para se manterem sincronizadas com o transacional.
  • A única exceção é a dimensão de tempo, chamada de tipo 0, porque depois que os dados foram inseridos, não precisam ser atualizados.
36
Q

Snowflaked Dimension

A

Neste esquema os atributos são removidos da tabela de dimensões e separadas em tabelas de dimensões secundárias normalizadas, ou seja, ligadas à tabela original através de chave artificial.

37
Q

Junk Dimension

A

A dimensão lixo é simplesmente uma estrutura que fornece um local para armazenar os atributos ou uma coleção de códigos transacionais aleatórios que não estão relacionados a nenhuma dimensão específica.

38
Q

Tabela de Fatos sem Fatos (Factless fact table)

A
  • As tabelas de fatos sem fatos são usadas para rastrear um processo ou coletar estatísticas.
  • Elas são chamadas assim porque a tabela de fatos não tem valores numéricos agregáveis ou informações.
  • Existem dois tipos de tabelas de fatos sem fatos: aquelas que descrevem eventos e aquelas que descrevem condições.
  • Ambos podem desempenhar papéis importantes em seus modelos dimensionais.
39
Q

A técnica de modelagem multidimensional utilizada para normalizar a dimensão, movendo os campos de baixa cardinalidade para tabelas separadas e ligadas à tabela original através de chaves artificiais, é chamada de:

A

Snowflaked Dimension

40
Q

Os principais componentes do esquema estrela de modelagem de dados multidimensionais são:

A

A tabela de fatos, as dimensões, os atributos e a hierarquia de atributos.

41
Q

O que é ETL (Estract, Transform, Load)

A
  • ETL é o processo para obter o dado, ajustá-lo, para melhorar a qualidade da informação, e colocá-lo em um ambiente para consumo.
  • Embora o ETL seja geralmente explicado como três etapas distintas, isso na verdade o simplifica muito, pois é realmente um processo amplo que requer uma variedade de ações.
42
Q

Etapas de ETL: Extração

A
  • Nesta etapa, os dados são identificados e extraídos de uma ou mais fontes (arquivos, planilhas, banco de dados).
  • Geralmente, não é possível identificar o exato conjunto de interesse, assim mais dados do que é necessário podem ser extraídos, para garantir que aquilo que é essencial esteja no conjunto de dados obtido.
  • A extração de dados normalmente ocorre de três maneiras:
    1. Notificação de atualização
    2. Extração incremental
    3. Extração completa
43
Q

Etapas de ETL: Transformação

A

A transformação de dados pode incluir diversas operações para melhorar sua qualidade, tais como: Limpeza, junção com outro conjunto de dados, validação de formato e/ou, até mesmo, geração de novos dados, a partir dos dados preexistentes.

O estágio de transformação no processo ETL deve ser capaz de selecionar determinadas colunas (ou nenhuma) para carregar; transformar múltiplas colunas em múltiplas linhas;
traduzir e unificar códigos heterogêneos de um mesmo atributo, oriundos de diversas fontes de dados (tabelas).

44
Q

Etapas de ETL: Carga

A
  • Consiste em colocar o dado transformado no local de destino.
    ▪ Esse destino pode ser um banco de dados ou um data warehouse.
  • A carga pode ser completa ou incremental.
    ▪ A completa geralmente ocorre quando os dados são carregados de uma só vez.
    ▪ Já a incremental ocorre em intervalos regulares - os dados novos vão gradativamente complementando os dados recebidos anteriormente.
45
Q

A extração de dados normalmente ocorre de três maneiras:

A
  1. Notificação de atualização
    * O sistema notifica quando um registro é alterado.
    * Normalmente, isso é conhecido como o método mais fácil de extração.
  2. Extração incremental
    * Alguns sistemas podem não fornecer notificações de atualizações, portanto, eles identificam quando os registros foram modificados e fornecem uma extração desses registros específicos.
  3. Extração completa
    * Alguns sistemas não são capazes de identificar quando os dados foram alterados, então a única maneira de retirá-los do sistema é recarregar tudo.
    * Isso geralmente é recomendado apenas para pequenas quantidades de dados como último recurso.
46
Q

Benefícios do ETL

A

− Transforma dados de várias fontes e os carrega em vários destinos;
− Fornece um contexto histórico profundo para empresas e organizações;
− Permite que as organizações analisem e relatem dados de maneira mais eficiente e fácil;
− Aumenta a produtividade à medida que move rapidamente os dados sem exigir as habilidades técnicas de ter que codificá-los primeiro;
− Evolui e se adapta às mudanças nas diretrizes de tecnologia e integração.

47
Q

Processamento Analítico Online (OLAP)

A

OLAP - On-Line Analytical Processing
- Recurso que permite manipular e analisar grandes volumes de dados sob múltiplas perspectivas. (Laudon&Laundon)
- Basicamente os produtos de OLAP oferecem recursos de modelagem, análise e visualização de grandes conjuntos de dados, ou para sistemas de gerenciamento de banco de dados (SGBD) ou, mais frequentemente, para sistemas de data warehouse.
- Voltado para a tomada de decisões, proporciona uma visão dos dados orientado à análise, além de uma navegação rápida e flexível.
- Possui dados atuais e históricos e não há necessidade de backups regularmente, sendo que ele possui informações do OLTP.
- As tabelas no banco de dados OLAP não são normalizadas.

O uso de tecnologias e de sistemas OLAP e datawarehouse é mais justificável no nível estratégico que no nível operacional.

48
Q

Ligação do DW e OLAP

A
  • O DW é utilizado para armazenar informações e o OLAP para recuperá-las, ambos são especializados para exercer suas funções de forma eficiente.
  • As duas tecnologias são complementares de modo que um bom DW é planejado com produção de relatórios em mente.
  • Desta forma, para explorar o DW completamente é necessário o OLAP que irá extrair e alavancar totalmente as informações nele contidas.
49
Q

Ligação do Data Mining e OLAP

A
  • O OLAP e Data Mining são partes integrantes de todo e qualquer processo de suporte à decisão.
  • Ainda, nos dias de hoje, a maioria dos sistemas de OLAP tem o foco no provimento de acesso aos dados multidimensionais, enquanto os sistemas de Data Mining lidam com a análise de influência para os dados de uma única dimensão.
  • Diferentemente de datamining, que não possibilita a interação do usuário na busca por informações úteis, o OLAP permite ao usuário extrair informações de um data warehouse ou de um datamart, de forma customizada e interativa.
50
Q

São operações OLAP:

A
  • Roll Up ou Drill Up
  • Drill Down
  • Drill Accross
  • Drill Throught
  • Dice
  • Slice
  • Pivot ou Pivoteamento
  • Cross-Join
  • Rank
  • Nest-unnest
  • Slipt
  • Push/Pull
51
Q

Roll Up ou Drill Up

A
  • A funcionalidade pré-programada de resumir os dados, com generalização crescente.
  • Diminui o nível de detalhe dos dados, ou seja, aumenta a granularidade;
  • Aplica uma agregação sobre o cubo de dados.
  • Por exemplo: Semanal para Trimestral para Anual.

CESPE
A técnica roll-up é a combinação de células de uma ou mais dimensões definidas em um cubo.

52
Q

Drill Down

A
  • Uma consulta mais detalhada das informações denomina-se drill-down.
  • Operação oposta ao roll up/drill up.
  • Aumenta o nível de detalhe dos dados, ou seja, diminui a granularidade;
  • Níveis cada vez maiores de detalhes são revelados.
53
Q

Drill Across

A

Quando, em um modelo multimensional, o usuário pular um nível intermediário dentro de uma mesma dimensão, como por exemplo, sendo a dimensão tempo composta por ano, semestre, trimestre, mês e dia e o usuário pular de ano para mês, a operação executada corresponde a: drill across.

54
Q

Drill Throught

A
  • Ocorre quando o usuário passa de uma informação contida em uma dimensão para outra.
    ▪ Por exemplo: Inicia na dimensão do tempo e no próximo passo analisa a informação por região.

  • Quando, em um modelo multimensional, o usuário pular de uma informação contida em uma dimensão para outra como por exemplo, da dimensão tempo para a dimensão região, a operação executada corresponde a: drill trought.
  • Numa aplicação de business intelligence, buscar uma informação fora da estrutura dimensional é possível com a operação: drill-through.
55
Q

Slice and Dice

A

Dice:
- Seleciona uma ou mais dimensões do cubo que satisfazem algum critério, retornando um “subcubo”;
- Mudando desta forma a orientação segundo a qual os dados são visualizados.

Slice:
- Parecida com a operação de dice, mas permite que selecione uma única dimensão;
- Corta o cubo, mas mantém a mesma perspectiva de visualização dos dados;
- Redução do escopo dos dados em análise, além de mudar a ordem das dimensões.

Na arquitetura OLAP, o módulo responsável por girar o cubo ou mesmo trocar linhas por colunas de modo a facilitar o entendimento do usuário para a análise da informação é chamado de slice and dice.

Redução do escopo dos dados em análise, além da mudança de ordem das dimensões e consequentemente da orientação de acordo com a qual os dados são visualizados. Trata-se da operação básica do OLAP slice and dice.

56
Q

Pivot ou Pivotiamento

A
  • Também conhecida como rotate ou rotação;
  • É uma operação de visualização que rotaciona os eixos de um determinado cubo, provendo uma visão alternativa dos dados.
  • A operação pivot (ou rotate) roda os eixos de um cubo para oferecer uma alternativa de visualização dos dados.

A troca de linhas por colunas em uma tabela e a rotação dos cubos de dados para mostrar uma diferente orientação dos eixos são funcionalidades de ferramentas de data warehouse do tipo pivot.

57
Q

Cross-Join

A
  • É usado para gerar um produto cartesiano entre os conjuntos passados como parâmetro.
  • O processo onde se faz a junção dos dados e transforma-se as colunas em linhas e as linhas em colunas, gerando dados cruzados, é chamado de cross-join.
58
Q

Rank

A
  • Ordena os membros de uma dimensão de acordo com algum critério.
  • Essa operação basicamente cria um ranking dos n maiores ou n menores itens em uma lista.
  • É possível ainda calcular as médias, o crescimento dos índices, a taxa de retorno
    interno, depreciação e funções estatísticas.
  • Os resultados dessas operações são tipicamente visualizados em uma forma de tabela cruzada (cross-tabular).
59
Q

Nest-unnest

A

Redução das dimensões.

60
Q

Slipt

A

Planificação das faces do cubo.

61
Q

Push/Pull

A

Junção de valores.

62
Q

Classificação dos cinco tipos de servidores OLAP:

A
  • MOLAP (Multidimensional On Line Analytical processing);
  • ROLAP (Relational On Line Processing);
  • HOLAP (Hybrid On Line Analytical Processing);
  • DOLAP (Desktop On Line Analytical Processing);
  • WOLAP (Web On Line Analytical Processing).
63
Q

MOLAP – Multidimensional OLAP Server

A
  • É a arquitetura clássica.
  • Tem baixa escalabilidade.
  • Os dados são armazenados em modelos multidimensionais (cubo de dados).
  • Requer pré-processamento do cubo de dados, mas apresenta uma eficiência maior na execução das consultas;
  • Apresenta como uma de suas limitações a possibilidade dos dados serem esparsos ocorrendo a chamada explosão de armazenamento de dados, ou seja, um imenso banco de dados multidimensional contendo poucos dados armazenados.
  • Estratégia pela qual são usados gerenciadores de banco de dados proprietários, com características de armazenamento especiais e ferramentas para tratamento dimensional de dados.
  • Embora disponha de propriedades especiais de armazenamento como matrizes esparsas, operações com array e indexações de bitmap, não oferece toda a gama de recursos encontradas num SGBDR.
64
Q

ROLAP – Relational OLAP Server

A
  • Trabalha diretamente em bancos de dados relacionais.
  • Não requer pré-processamento.
  • Mais escalável mas costuma ter uma performance pior que a MOLAP;
  • É uma simulação da tecnologia OLAP feita em banco de dados relacionais que, por utilizar a estrutura relacional, possui a vantagem de não restringir o volume de armazenamento de dados.
  • Esse é um servidor intermediário que fica entra a base de dados relacional de back-end e as ferramentas de front-end.
  • Eles usam SGBDs relacionais ou relacionais estendidos para gravar e gerenciar os dados do DW, e um middleware OLAP para dar suporte os pedaços faltantes.
  • Oferece todas as vantagens de um SGBDR, porém exige um projeto cuidadoso do ponto de vista de desempenho, em que o excesso de tabelas normalizadas poderá comprometer a performance das buscas.
65
Q

HOLAP – Hybrid OLAP Server

A
  • ROLAP + MOLAP
  • Dá liberdade para que o designer escolha qual porção dos dados será armazenada através da arquitetura MOLAP e qual será na ROLAP.
  • Consegue combinar a capacidade e a escalabilidade das outras ferramentas OLAP com o desempenho superior dos bancos de dados relacionais.
66
Q

DOLAP – Desktop OLAP Server

A
  • Apresenta como vantagem a redução da sobrecarga no servidor de banco de dados uma vez que todo o processamento OLAP acontece na máquina cliente.
  • Pouco tráfego de rede.
  • Limitação do cubo de dados.
67
Q

WOLAP

A

Diferentemente das outras ferramentas utiliza a Web, facilitando assim, a distribuição da ferramenta, o acesso remoto dos dados a serem analisados e a utilização da aplicação independente de plataforma.