Business Intelligence Flashcards

Question

Medidas

Answer 1

- **Aditivas**: São as mais frequentes e são obtidas por meio da **soma de valores gerados pela seleção de membros das dimensões.** Exemplo: lucro líquido; - **Semi-aditivas:** São medidas obtidas a partir da soma de apenas partes de suas dimensões. Exemplo: quantidade em estoque (não faz sentido somá-la através da dimensão tempo); - **Não-aditivas:** São medidas que não podem ser somadas através de nenhuma de suas dimensões. O exemplo mais comum desse tipo de medidas são **valores percentuais.**

Answer 2

- Representação dos contextos relevantes para a análise de um fato. - Exemplo: ▪ Fato: Vendas. ▪ Dimensões: Clientes, Produtos, Tempo, Locais, ... - Uma dimensão pode conter membros; ser organizada em hierarquias.

Answer 3

- Tem as características de uma Primary Key; - É utilizada para referenciar a dimensão na fato; - É auto incremental; - É uma chave artificial; - É criada no Data Warehouse; - Seu valor não é derivado dos dados armazenados no banco de dados; - Não pode ser manipulável ou alterável pelo usuário; - Não pode se repetir.

Answer 4

- Esquema Estrela (Star Schema); - Esquema Flocos de Neve (Snowflake)

Answer 5

-No esquema estrela existe **uma tabela fato no centro e apenas uma única tabela para cada dimensão**, pois elas **não estão normalizadas**. ## Footnote Normalização é o processo de organização de dados em um banco de dados. Isso inclui a criação de tabelas e o estabelecimento de relações entre essas tabelas de acordo com as regras projetadas para proteger os dados e tornar o banco de dados mais flexível, eliminando a redundância e a dependência inconsistente.

Answer 6

- Esquema Flocos de Neve (Snowflake) - O esquema floco de neve é uma variação do esquema estrela. - **Existe uma tabela fato no centro e múltiplas tabelas dimensão conectadas a ela.** ▪ Essas dimensões são organizadas em uma hierarquia porque elas **são normalizadas**. ## Footnote A normalização das tabelas de dimensão em um star schema conduz a um: **esquema snowflake**.

Answer 7

Normalização é o processo de organização de dados em um banco de dados. Isso inclui a criação de tabelas e o estabelecimento de relações entre essas tabelas de acordo com as regras projetadas para proteger os dados e tornar o banco de dados mais flexível, eliminando a redundância e a dependência inconsistente.

Answer 8

É um conjunto de tabelas fatos que compartilham algumas tabelas dimensão.

Answer 9

- As tabelas de dimensões estão em conformidade **quando os atributos em tabelas de dimensões separadas têm os mesmos nomes de coluna**. - As informações de tabelas fato separadas podem ser combinadas em um único relatório usando atributos de dimensão conformes que estão associados a cada tabela de fato. - Quando tabelas de dimensão distintas possuem os mesmos nomes de colunas e conteúdos de domínio para diversas tabelas Fatos. ▪ Conformed Dimension são reutilizadas em tabelas de fatos fornecendo assim uma consistência analítica e uma redução de custo de desenvolvimento futuro. - Mesma dimensão usada para diferentes fatos com mesmo significado. - É uma dimensão que tem o mesmo significado para todas as fatos com que se relaciona. **Uma boa prática é deixar todas as dimensões conformadas.**

Answer 10

- Quando um atributo da dimensão é armazenado como parte da tabela fato e não em uma tabela separada. - É a dimensão que não mereceu ser uma tabela dimensão e foi inserida como coluna na fato.

Answer 11

- Uma única dimensão pode ser referenciada várias vezes em uma tabela fato, com cada referência vinculada a uma função logicamente distinta para a dimensão. - Mesma dimensão, usada em diferentes fatos, porém com significados diferentes.

Answer 12

- Slowly Changing Dimensions SCD (Dimensões que Mudam Lentamente, em português) e retrata as dimensões que sofrem atualizações em seus campos e os classifica pelo tipo de mudança existente em cada uma delas. - Todas as dimensões são SCD, porque elas vão precisar atualizar para se manterem sincronizadas com o transacional. - A única exceção é a dimensão de tempo, chamada de tipo 0, porque depois que os dados foram inseridos, não precisam ser atualizados.

Answer 13

Neste esquema os atributos são removidos da tabela de dimensões e separadas em tabelas de dimensões secundárias normalizadas, ou seja, ligadas à tabela original através de chave artificial.

Answer 14

A dimensão lixo é simplesmente uma estrutura que fornece um local para armazenar os atributos ou uma coleção de códigos transacionais aleatórios que não estão relacionados a nenhuma dimensão específica.

Answer 15

- As tabelas de fatos sem fatos são usadas para rastrear um processo ou coletar estatísticas. - Elas são chamadas assim porque a tabela de fatos não tem valores numéricos agregáveis ou informações. - **Existem dois tipos** de tabelas de fatos sem fatos: aquelas **que descrevem eventos** e aquelas **que descrevem condições**. - Ambos podem desempenhar papéis importantes em seus modelos dimensionais.

Answer 16

Snowflaked Dimension

Answer 17

A tabela de fatos, as dimensões, os atributos e a hierarquia de atributos.

Answer 18

- ETL é o processo para obter o dado, ajustá-lo, para melhorar a qualidade da informação, e colocá-lo em um ambiente para consumo. - Embora o ETL seja geralmente explicado como três etapas distintas, isso na verdade o simplifica muito, pois é realmente um processo amplo que requer uma variedade de ações.

Answer 19

- Nesta etapa, os dados são identificados e extraídos de uma ou mais fontes (arquivos, planilhas, banco de dados). - Geralmente, não é possível identificar o exato conjunto de interesse, assim mais dados do que é necessário podem ser extraídos, para garantir que aquilo que é essencial esteja no conjunto de dados obtido. - A extração de dados normalmente ocorre de três maneiras: 1. Notificação de atualização 2. Extração incremental 3. Extração completa

Answer 20

A transformação de dados pode incluir diversas operações para melhorar sua qualidade, tais como: Limpeza, junção com outro conjunto de dados, validação de formato e/ou, até mesmo, geração de novos dados, a partir dos dados preexistentes. ## Footnote O estágio de transformação no processo ETL deve ser capaz de selecionar determinadas colunas (ou nenhuma) para carregar; transformar múltiplas colunas em múltiplas linhas; traduzir e unificar códigos heterogêneos de um mesmo atributo, oriundos de diversas fontes de dados (tabelas).

Answer 21

- Consiste em colocar o dado transformado no local de destino. ▪ Esse destino pode ser um banco de dados ou um data warehouse. - A carga pode ser completa ou incremental. ▪ A completa geralmente ocorre quando os dados são carregados de uma só vez. ▪ Já a incremental ocorre em intervalos regulares - os dados novos vão gradativamente complementando os dados recebidos anteriormente.

Answer 22

1. **Notificação de atualização** * O sistema notifica quando um registro é alterado. * Normalmente, isso é conhecido como o método mais fácil de extração. 2. **Extração incremental** * Alguns sistemas podem não fornecer notificações de atualizações, portanto, eles identificam quando os registros foram modificados e fornecem uma extração desses registros específicos. 3. **Extração completa** * Alguns sistemas não são capazes de identificar quando os dados foram alterados, então a única maneira de retirá-los do sistema é recarregar tudo. * Isso geralmente é recomendado apenas para pequenas quantidades de dados como último recurso.

Answer 23

− Transforma dados de várias fontes e os carrega em vários destinos; − Fornece um contexto histórico profundo para empresas e organizações; − Permite que as organizações analisem e relatem dados de maneira mais eficiente e fácil; − Aumenta a produtividade à medida que move rapidamente os dados sem exigir as habilidades técnicas de ter que codificá-los primeiro; − Evolui e se adapta às mudanças nas diretrizes de tecnologia e integração.

Answer 24

**OLAP - On-Line Analytical Processing** - Recurso que permite manipular e analisar grandes volumes de dados sob múltiplas perspectivas. (Laudon&Laundon) - Basicamente os produtos de OLAP oferecem recursos de modelagem, análise e visualização de grandes conjuntos de dados, ou para sistemas de gerenciamento de banco de dados (SGBD) ou, mais frequentemente, para sistemas de data warehouse. - Voltado para a tomada de decisões, proporciona uma **visão dos dados orientado à análise**, além de uma **navegação rápida e flexível.** - Possui dados atuais e históricos e não há necessidade de backups regularmente, sendo que ele possui informações do OLTP. - As tabelas no banco de dados OLAP não são normalizadas. ## Footnote O uso de tecnologias e de sistemas OLAP e datawarehouse é mais justificável no nível estratégico que no nível operacional.

Answer 25

- O DW é utilizado para armazenar informações e o OLAP para recuperá-las, ambos são especializados para exercer suas funções de forma eficiente. - As duas tecnologias são complementares de modo que um bom DW é planejado com produção de relatórios em mente. - Desta forma, para explorar o DW completamente é necessário o OLAP que irá **extrair** e **alavancar** totalmente as informações nele contidas.

Answer 26

- O OLAP e Data Mining são partes integrantes de todo e qualquer processo de suporte à decisão. - Ainda, nos dias de hoje, a maioria dos sistemas de OLAP tem o foco no provimento de acesso aos dados multidimensionais, enquanto os sistemas de Data Mining lidam com a análise de influência para os dados de uma única dimensão. - Diferentemente de datamining, que não possibilita a interação do usuário na busca por informações úteis, o OLAP permite ao usuário extrair informações de um data warehouse ou de um datamart, de forma customizada e interativa.

Answer 27

- Roll Up ou Drill Up - Drill Down - Drill Accross - Drill Throught - Dice - Slice - Pivot ou Pivoteamento - Cross-Join - Rank - Nest-unnest - Slipt - Push/Pull

Answer 28

- A funcionalidade pré-programada de resumir os dados, com **generalização crescente.** - Diminui o nível de detalhe dos dados, ou seja, **aumenta a granularidade**; * Aplica uma agregação sobre o cubo de dados. * Por exemplo: Semanal para Trimestral para Anual. ## Footnote CESPE A técnica roll-up é a combinação de células de uma ou mais dimensões definidas em um cubo.

Answer 29

- Uma consulta mais detalhada das informações denomina-se drill-down. - Operação oposta ao **roll up/drill up**. - **Aumenta o nível de detalhe** dos dados, ou seja, **diminui a granularidade**; - Níveis cada vez maiores de detalhes são revelados.

Answer 30

Quando, em um modelo multimensional, o usuário **pular um nível** intermediário **dentro de uma mesma dimensão**, como por exemplo, sendo a dimensão tempo composta por ano, semestre, trimestre, mês e dia e o usuário pular de ano para mês, a operação executada corresponde a: drill across.

Answer 31

- Ocorre quando o usuário passa de uma informação contida em **uma dimensão para outra**. ▪ Por exemplo: Inicia na dimensão do tempo e no próximo passo analisa a informação por região. ## Footnote - Quando, em um modelo multimensional, o usuário pular de uma informação contida em uma dimensão para outra como por exemplo, da dimensão tempo para a dimensão região, a operação executada corresponde a: drill trought. - Numa aplicação de business intelligence, buscar uma informação **fora da estrutura dimensional** é possível com a operação: drill-through.

Answer 32

**Dice:** - Seleciona uma ou mais dimensões do cubo que satisfazem algum critério, retornando um "subcubo"; - Mudando desta forma a orientação segundo a qual os dados são visualizados. **Slice:** - Parecida com a operação de dice, mas permite que selecione uma única dimensão; - Corta o cubo, mas mantém a mesma perspectiva de visualização dos dados; - Redução do escopo dos dados em análise, além de mudar a ordem das dimensões. Na arquitetura OLAP, o módulo responsável por **girar o cubo** ou mesmo **trocar linhas por colunas** de modo a facilitar o entendimento do usuário para a análise da informação é chamado de slice and dice. ## Footnote Redução do escopo dos dados em análise, além da mudança de ordem das dimensões e consequentemente da orientação de acordo com a qual os dados são visualizados. Trata-se da operação básica do OLAP **slice and dice.**

Answer 33

- Também conhecida como rotate ou rotação; - É uma operação de visualização que rotaciona os eixos de um determinado cubo, provendo uma visão alternativa dos dados. - A operação pivot (ou rotate) roda os eixos de um cubo para oferecer uma alternativa de visualização dos dados. ## Footnote A troca de linhas por colunas em uma tabela e a rotação dos cubos de dados para mostrar uma diferente orientação dos eixos são funcionalidades de ferramentas de data warehouse do tipo pivot.

Answer 34

- É usado para gerar um produto cartesiano entre os conjuntos passados como parâmetro. - O processo onde se faz a **junção dos dados** e transforma-se as colunas em linhas e as linhas em colunas, gerando **dados cruzados**, é chamado de **cross-join.**

Answer 35

- Ordena os membros de uma dimensão de acordo com algum critério. - Essa operação basicamente cria um ranking dos n maiores ou n menores itens em uma lista. - É possível ainda calcular as médias, o crescimento dos índices, a taxa de retorno interno, depreciação e funções estatísticas. - Os resultados dessas operações são tipicamente visualizados em uma forma de tabela cruzada (cross-tabular).

Answer 36

Redução das dimensões.

Answer 37

Planificação das faces do cubo.

Answer 38

Junção de valores.

Answer 39

* MOLAP (Multidimensional On Line Analytical processing); * ROLAP (Relational On Line Processing); * HOLAP (Hybrid On Line Analytical Processing); * DOLAP (Desktop On Line Analytical Processing); * WOLAP (Web On Line Analytical Processing).

Answer 40

* É a arquitetura clássica. - **Tem baixa escalabilidade.** * Os dados são armazenados em modelos multidimensionais (cubo de dados). * Requer pré-processamento do cubo de dados, mas apresenta uma eficiência maior na execução das consultas; * **Apresenta** como uma de suas limitações a **possibilidade** dos dados serem esparsos ocorrendo a chamada **explosão de armazenamento de dados**, ou seja, um **imenso banco de dados multidimensional contendo poucos dados armazenados.** * Estratégia pela qual são usados gerenciadores de banco de dados proprietários, com características de armazenamento especiais e ferramentas para tratamento dimensional de dados. * Embora disponha de propriedades especiais de armazenamento como **matrizes esparsas**, **operações com array** e **indexações de bitmap**, não oferece toda a gama de recursos encontradas num SGBDR.

Answer 41

* Trabalha diretamente em bancos de dados relacionais. * **Não requer pré-processamento.** * **Mais escalável mas costuma ter uma performance pior que a MOLAP;** * É uma simulação da tecnologia OLAP feita em **banco de dados relacionais** que, por utilizar a estrutura relacional, possui a vantagem de **não restringir o volume de armazenamento de dados.** * Esse é um servidor intermediário que fica entra a base de dados relacional de back-end e as ferramentas de front-end. * Eles usam SGBDs relacionais ou relacionais estendidos para gravar e gerenciar os dados do DW, e um middleware OLAP para dar suporte os pedaços faltantes. * Oferece todas as vantagens de um SGBDR, porém **exige um projeto cuidadoso do ponto de vista de desempenho**, em que o excesso de tabelas normalizadas poderá comprometer a performance das buscas.

Answer 42

* ROLAP + MOLAP * Dá liberdade para que o designer escolha qual porção dos dados será armazenada através da arquitetura MOLAP e qual será na ROLAP. * **Consegue combinar a capacidade e a escalabilidade das outras ferramentas OLAP com o desempenho superior dos bancos de dados relacionais.**

Answer 43

- Apresenta como vantagem a redução da sobrecarga no servidor de banco de dados uma vez que todo o **processamento OLAP acontece na máquina cliente.** - Pouco tráfego de rede. - Limitação do cubo de dados.

Answer 44

Diferentemente das outras ferramentas utiliza a Web, facilitando assim, a distribuição da ferramenta, o acesso remoto dos dados a serem analisados e a utilização da aplicação independente de plataforma.