BI (Business Intelligence) e Data Warehouse Flashcards

1
Q

O que é o BI?

A

☆ Business Intelligence (Inteligência de Negócio) é um termo criado pelo Gartner Group utilizado para representar um conjunto de processos, técnicas, metodologias, habilidades, ferramentas e capacidades utilizadas para acessar, coletar, organizar, tratar, analisar, cruzar, processar, compartilhar e monitorar dados de diversas fontes com o intuito de gerar informações e relatórios analíticos que suportem a gestão corporativa, a definição de estratégias e a tomada de decisão em ambientes de negócio.

Outras definições:
• Business Intelligence é o processo de recolhimento e tratamento de informações que apoiarão a gestão de um negócio.
• Business Intelligence é o processo inteligente de coleta, organização, análise, compartilhamento e monitoração de dados que, depois de processados, geram informações para o suporte e para a tomada de decisões no ambiente de negócios.
• Business Intelligence trata da capacidade de cruzar informações de diferentes bancos de dados, gerando relatórios analíticos diversos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O Business Intelligence é capaz de fornecer uma visão dos dados facilitando análises diagnósticas, descritivas e até preditivas para suportar a tomada de decisão.
O que é uma Análise Descritiva?

A

Análise descritiva: é o exame de dados ou conteúdos para responder à pergunta: “O que aconteceu?” ou “o que está acontecendo?”. É caracterizado pelo Business Intelligence tradicional e visualizações como gráficos de pizza, gráficos de barras, etc que servem para que gestores tomem decisões;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O Business Intelligence é capaz de fornecer uma visão dos dados facilitando análises diagnósticas, descritivas e até preditivas para suportar a tomada de decisão.
O que é uma Análise Diagnóstica?

A

• Análise Diagnóstica: é uma forma de análise avançada que examina dados ou conteúdos para
responder à pergunta: “Por que isso aconteceu?”, e é caracterizada por técnicas como detalhamento, descoberta de dados, mineração de dados e correlações. Esse é o tipo de análise empregada em investigações de causa-raiz;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O Business Intelligence é capaz de fornecer uma visão dos dados facilitando análises diagnósticas, descritivas e até preditivas para suportar a tomada de decisão.
O que é uma Análise Preditiva?

A

• Análise Preditiva: combina técnicas de estatística, mineração de dados e aprendizagem de máquina (Machine Learning) para encontrar significado em grandes quantidades de dados, trabalhando com probabilidades, entre outros para antecipar comportamentos futuros com base em eventos passados. Responde à pergunta: “O que vai acontecer?”;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Business Intelligence é capaz de fornecer uma visão dos dados facilitando análises diagnósticas, descritivas e até preditivas para suportar a tomada de decisão.
O que é uma Análise Prescritiva?

A

• Análise Prescritiva: é uma forma de análise avançada que examina os dados ou os conteúdos para responder à pergunta: “O que deve ser feito?” ou “O que podemos fazer caso algo aconteça?”, e é caracterizada por técnicas como análise de gráficos, simulação, redes neurais, mecanismos de recomendação, heurísticas, aprendizado de máquina, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quais são as 4 habilidades do BI?

A

• memória organizacional,
• informação integrada,
• criação de conhecimento (insight),
• apresentação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quais são os componentes de que formam a Aquitetura do BI (Business IntelligenceI) ?

A

(1) Data Warehouse, com seus dados-fonte;

(2) Análise de Negócio, uma coleção de ferramentas para manipular e analisar os dados do Data Warehouse, incluindo Data Mining;

(3) Business Performance Management (BPM), para monitoria e análise do desempenho; e

(4) uma interface de usuário, como um dashboard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que é o DataWarehouse? Dentro da arquitetura BI?

A

Trata-se de uma coleção de dados orientados por assunto, integrados, variáveis com o tempo e não-voláteis, para dar suporte ao processo de tomada de decisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é o Ambiente de Análise de Negócio, de um BI?

A

Trata-se de um conjunto de ferramentas para manipular, minerar
e analisar dados, criar relatórios, realizar consultas sob demanda, entre outros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é o BPM em uma arquitetura BI?

A

Trata-se de um conjunto de ferramentas que permitem comparar
e compartilhar o desempenho de negócios de uma organização em
relação às metas estabelecidas.

☆ BPM : Business Performance Management.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é a interface do usuário na arquitetura do BI?

A

Trata-se de um conjunto de ferramentas que permitem a rápida e
abrangente visualização de dados por meio de dashboards e
softwares similares.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é um DW (DataWarehouse)?

A

• Data Warehouse significa Armazém de Dados! É algo maior que um banco de dados… é um armazém de dados!

• Data Warehouse é um banco de dados especializado em gerar relatórios, logo sua performance para
esse tipo de processamento é extremamente eficiente.

• Banco de dados construídos no interesse de suporte à decisão de negócios e contêm dados históricos
sumarizados e consolidados provenientes de registros individuais de bancos de dados operacionais.

• Coleção de dados4 orientados por assunto, integrados, variáveis com o tempo e não-voláteis, para dar
suporte ao processo de tomada de decisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Como os relatórios do DW são alimentados?

A

Isso é realizado por meio de um processo chamado ETL (Extract, Transform, Load).
• Extract – extrai as informações do banco de dados transacional;
• Transform – transforma as informações para o formato adequado;
• Load – carrega as informações no Data Warehouse!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

O que significa dizer que o Data Warehouse é orientado por assunto?

A

Um Data Warehouse é montado por assunto, isto é, ele trata de temas específicos e importantes para o negócio da organização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que significa dizer que o Data Warehouse é não volátil?

A

• Data Warehouse é não-volátil, logo ele não muda com facilidade. Na verdade, os dados – em tese – jamais devem mudar (serem alterados ou deletados) após inseridos.
• Em outras palavras, podemos dizer que os dados ficam disponíveis apenas para que os usuários realizem consultas e façam relatórios que auxiliem a tomada de decisão por parte dos gestores de uma organização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que significa dizer que o Data Warehouse é integrado?

A

Significa que as inconsistências são removidas e os conflitos de informações são consertados antes de serem inseridos ou carregados em um Data Warehouse! Dessa forma, podemos afirmar que os dados de um Data Warehouse são integrados
de múltiplas fontes diferentes de forma consistente, padronizada e uniforme.

• Ex: no sistema deve cintas bancos com apenas uma nomenclatura, (Caixa) pra não haver divergência ou duplicidade já que cada pessoa escreve de u a maneira.

17
Q

O que significa dizer que o Data Warehouse é histórico (variável com o tempo)?

A

Dados históricos são mantidos em um Data Warehouse. Por exemplo: pode-se recuperar dados de três, seis, doze meses ou até mesmo dados mais antigos de um Data Warehouse.

Isso contrasta com os bancos de dados transacionais, em que geralmente apenas os dados mais recentes são
mantidos.

18
Q

Quais são os 3 tipos de Data Warehouse?

A

• Enterprise Data Warehouse (EDW),
• Operational Data Store (ODS) e
• Data Mart (DM)

19
Q

O que é o Enterprise Data Warehouse (EDW)?

A

É um dos tipos de DW, Traduzido como Armazém de Dados Corporativos/Abrangentes/Empresariais, é um repositório central tático/estratégico que contém todas as informações de negócio de uma organização de forma acessível para toda empresa com a finalidade de suportar as análises de decisões.

• A Grosso modo, é possível afirmar que um EDW é um DW de larga escala – grande e abrangente – que é utilizado pela organização como um todo e que integra informações de diversas fontes de dados.

20
Q

O que é um Operational Data Store (ODS)?

A

Traduzido como Armazenamento de Dados Operacionais, trata-se de um repositório intermediário de dados utilizado para relatórios operacionais e como uma fonte de dados para o Enterprise Data Warehouse (EDW).

• É um elemento complementar a um EDW em um cenário de suporte a decisões, e é usado para relatórios, controles e tomada de decisões operacionais – em oposição ao EDW, que é utilizado para suporte de decisões táticas e estratégicas.

21
Q

O que é um Data Mart (DM)?

A

• Traduzido como Mercado de Dados, trata-se de um subconjunto de dados de um Data Warehouse. Geralmente são dados referentes a um assunto em especial.
• Data Marts geralmente lidam um único assunto, sendo frequentemente construídos e gerenciados por um único departamento comercial. Eles normalmente obtêm dados de apenas um pequeno número de fontes e – como consequência – são geralmente menos complexos, mais econômicos, mais fáceis de construir e mais fáceis de manter do que Data Warehouses.

22
Q

Quais são as características de um Data Mart?

A

• Um Data Mart permite um acesso mais rápido aos dados, recuperando um conjunto específico de dados para BI e Relatórios. Como resultado, ajuda a acelerar os processos de negócios;

• Sendo focado em um assunto, é mais fácil implementar um Data Mart, sendo mais econômico em comparação com a construção de uma empresa Data Warehouse;

• O uso de um Data Mart é fácil, visto que ele é projetado de acordo com os requisitos de um grupo específico de usuários que trabalham em um departamento específico;

• Um Data Mart é comparativamente mais adaptável que um Data Warehouse. Qualquer alteração no modelo de dados pode ser fácil e rapidamente incorporada no Data Mart;

• Em um Data Mart, os dados são particionados e segmentados, o que permite um controle de acesso em um nível mais granular.

23
Q

Quais os tipos de Data Mart?

A
  • Dependente, Independente, Híbrido.

• Dependente:Nesse caso, um conjunto de fontes de dados operacionais são integradas em um EDW, que – por sua vez – são divididos em diversos Data Marts dependentes.

• Independente: Nesse caso, um conjunto de fontes de dados operacionais são permitem gerar um ou mais Data Marts independentes, sem a necessidade de criar um EDW.

• Híbrido: Nesse caso, um conjunto de fontes de dados operacionais podem ser tanto integradas em um EDW para posteriormente permitir a criação de Data Marts quanto podem gerá-los de
maneira independente.

24
Q

Do que se trata a Abordagem de Inmon para a construção de um DW?

A

DW -> DM
Recomenda a construção do DW que siga a abordagem de cima para baixo.
Na filosofia de Inmon, é começando com a construção de um grande Enterprise Data Warehouse centralizado, onde todos os dados disponíveis dos sistemas transacionais são consolidados em uma coleção de dados orientada ao assunto, integrada, variante no tempo e não volátil que suporta a tomada de decisões.
Em seguida, os Data Marts são construídos para necessidades analíticas de departamentos.

25
Q

Do que se trata a Abordagem de Kimball na construção de um DW?

A

DM -> DW
Recomenda a construção do DW que segue a abordagem de baixo para cima. Na filosofia de Kimball, inicia-se primeiro com Data Marts de missão crítica que atendem às necessidades analíticas dos departamentos.
Em seguida, integram-se esses Data Marts para consistência de dados por meio do chamado barramento de informações. Kimball faz uso do modelo dimensional para atender às necessidades dos departamentos em várias áreas da empresa.

26
Q

Qual a parte mais demorada e crítica da construção de um Data Warehouse? Há uma forma de agilizar essa etapa?

A

ETL (Extract, Transform e Load).
O ETL se refere a um processo mais amplo e, não, a três etapas bem definidas.
É demorado, uma vez que consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e limpeza destes dados; e na carga dos dados no DW.

A forma de agilizar esse processo demorado é o ELT (Inversão das ordens de carga e transformação)

ETL - (1) Extração (2) Transformação (3) Carga.

ELT - (1) Extração (2) Carga (3) Transformação

O ELT é um processo mais ágil para o carregamento e o processamento de dados, visto inverte a ordem das etapas de transformação de dados da abordagem tradicional de ETL.

27
Q

O que são factless fact table.?

A

Tabelas de fatos sem fatos(factless fact table) são usadas para rastrear um processo ou coletar estatísticas. Elas são chamadas assim porque a tabela de fatos não tem valores numéricos agregáveis ou informações, possuem apenas relacao de chaves primarias.

28
Q

O que é o índice bitmap?

A

índice bitmap é empregado na indexação da junção estrela e de tabelas de dimensão em DW convencionais.
Ele é indicado para ser aplicado em consultas onde as colunas possuem baixas cardinalidades, ou seja, colunas que tem um número baixo de valores distintos na linha de uma tabela.

29
Q

O que é uma tabela Role playing dimension?

A

Uma tabela de fato Role playing dimension é uma tabela em que há vários relacionamentos entre si com uma tabela dimensão conhecida. Por exemplo, na nossa tabela, temos uma relação da tabela fato Venda por várias vezes com a tabela dimensão Tempo, esta é uma característica desse tipo de tabela de fato.

30
Q

O que é Slowly changing dimensional?

A

Slowly changing dimension é uma dimensão que armazena e gerencia dados atuais e históricos ao longo do tempo em um data warehouse. É considerada e implementada como uma das tarefas ETL mais críticas no rastreamento do histórico de registros de dimensão.

31
Q

O que é JUNK DIMENSION?

A

A dimensão lixo é simplesmente uma estrutura que fornece um local para armazenar os atributos ou uma coleção de códigos transacionais aleatórios que não estão relacionados a nenhuma dimensão específica

32
Q

Quais os tipos de métricasque normalmente podem está contidos dentro de um DW?

A

❖ Medidas aditivas ou fatos aditivos: são os fatos mais úteis e frequentes em um DW, obtidos por meio da soma de valores gerados pela seleção de membros das dimensões. São medidas cruciais, pois as aplicações de data warehouse quase nunca recuperam uma única linha de dados. Em vez disso, eles trazem centenas, milhares ou milhões de linhas de fato ao mesmo tempo, e a coisa mais útil a fazer com tantas linhas é somá-las. Ex.: lucro líquido.

❖ Medidas semi-aditivas ou fatos semi-aditivos: são as medidas obtidas a partir da soma de apenas uma parte das dimensões. Ex.: quantidade em estoque (não utiliza dimensão tempo).

❖ Medidas não-aditivas ou fatos não-aditivos: não podem ser adicionados. Em geral, para agregar as linhas é necessário percorrer uma linha por vez. Ex.: porcentagem de vendas.