Business Intelligence Flashcards

1
Q

Tipos de OLAP

A

ROLAP / MOLAP / HOLAP

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

ROLAP

A

VANTAGENS

ARQUITETURA BASEADA EM BANCO DE DADOS RELACIONAIS

ESCALABILIDADE
FLEXIBILIDADE
ATUALIZAÇÃO DE DADOS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

ROLAP

A

DESNVANTAGENS

DESEMPENHO
COMPLEXIBILIDADE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

MOLAP

A

VANTAGENS

BASEADO EM BANCO DE DADOS MULTIDIMENSIONAIS

DESEMPENHO, EFICIENCIA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

MOLAP

A

DESVANTAGENS

ESCALABILIDADE

FLEXIBILIDADE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

HOLAP

A

ARQUITETURA

COMBINAÇÃO DE MOLAP E ROLAP

VANTAGENS

BALANCEIA DESEMPENHO E ESCALABILIDADE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

HOLAP

A

DESVANTAGENS

COMPLEXIBILIDADE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

FGV - 2024 - Analista em Gestão Municipal (Pref SJC)/Tecnologia da Informação
* Com relação ao Data Warehousing e ao Business Intelligence, avalie as afirmativas a seguir e assinale V para a afirmativa verdadeira e F para a
falsa.
* ( ) Eles têm como meta construir e manter o ambiente técnico e os processos técnicos e de negócios necessários para fornecer dados integrados
em apoio às funções operacionais, requisitos de conformidade e atividades de inteligência de negócios.
* ( ) Ambos visam apoiar e permitir análises de negócios e tomadas de decisões mais eficazes por parte dos trabalhadores do conhecimento.
* ( ) O Data Warehousing concentra-se em permitir um contexto de negócios histórico e integrado em dados operacionais, aplicando regras de
negócios e mantendo relacionamentos de dados de negócios apropriados. O armazenamento de dados também inclui processos que interagem
com repositórios de metadados.

A

E V – V – V.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ROLAP (Relational OLAP)

A

ROLAP permite a análise de dados armazenados em bancos de
dados relacionais, traduzindo as consultas OLAP em SQL para
acessar as tabelas de dados, o que possibilita o uso de grandes
volumes de dados sem a necessidade de pré-agregação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

MOLAP (Multidimensional OLAP)

A

MOLAP utiliza estruturas de dados multidimensionais para
armazenar dados de forma que a consulta e a análise sejam
realizadas de maneira rápida e eficiente, usando cubos OLAP que
contêm dados pré-agregados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

FGV - 2024 - Analista Legislativo (ALETO)/Desenvolvimento de Sistema
* A implementação de sistemas OLAP (On Line Analytical Processing) pode utilizar alguma
opção tecnológica tal como ROLAP, MOLAP, entre outras.
* Assinale a opção que descreve corretamente uma característica do ROLAP (Relational OLAP).

A

C armazena os dados em um banco de dados relacional, aproveitando o poder das consultas
SQL para análises.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

HOLAP (Hybrid OLAP)

A

HOLAP combina as características do MOLAP e do ROLAP,
permitindo que dados detalhados sejam armazenados em bancos
de dados relacionais e dados agregados em cubos OLAP,
proporcionando assim um balanceamento entre desempenho e
flexibilidade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

A arquitetura OLAP representa um método que garante que os dados corporativos sejam analisados de forma mais ágil,
consistente e interativa pelos gerentes, analistas, executivos e outros interessados nas informações. Constitui uma interface
com o usuário e não uma forma de armazenamento de dados, porém se utiliza do armazenamento para poder apresentar as
informações. Entre os métodos de armazenamento, quatro são descritos a seguir.
* I. Os dados são armazenados de forma relacional.
* II. Os dados são armazenados de forma multidimensional.
* III. Uma combinação dos métodos caracterizados em I e em II.
* IV. O conjunto de dados multidimensionais deve ser criado no servidor e transferido para o desktop, além de permitir
portabilidade aos usuários OLAP que não possuem acesso direto ao servidor.

A

B ROLAP, MOLAP, HOLAP e DOLAP

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Para construção de um Data Warehouse é necessário escolher a tecnologia
mais adequada para as necessidades de negócio. Em relação as tecnologias
ROLAP (Relational Online Analytical Processing) e MOLAP (Multidimensional
Online Analytical Processing), assinale a alternativa correta.
* A MOLAP armazena os dados em memória com valores pré-agregados.
* B ROLAP fornece melhor tempo de resposta por utilizar diretamente bancos
relacionais.
* C ROLAP é utilizado, geralmente, para um volume menor de dados.
* D MOLAP não utiliza cubo de dados.
* E MOLAP, geralmente, são mais simples e demandam menos esforço de
manutenção e modelagem.

A

A) MOLAP armazena os dados em memória com valores pré-agregados.

Justificativa:

MOLAP (Multidimensional Online Analytical Processing): Esta tecnologia armazena os dados em estruturas multidimensionais conhecidas como cubos de dados. Esses cubos são pré-calculados e podem ser carregados em memória, contendo valores pré-agregados que aceleram significativamente o tempo de resposta das consultas analíticas. Isso permite acesso rápido a dados resumidos e facilita a execução de análises complexas em grandes volumes de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Modelagem Dimensional

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  • CEBRASPE (CESPE) - 2022 - Auditor Fiscal de Controle Externo
    (TCE-SC)/Ciências da Computação
  • A respeito de inteligência do negócio, julgue o item a seguir.
  • Uma dimensão degenerada é caracterizada por não possuir uma
    tabela própria, mas apenas residir na tabela fato como um atributo
    pertencente à chave primária.
A

Correto

17
Q

Ao construir um modelo de dados usando a modelagem dimensional para um Data
Warehouse, seguindo um modelo estrela, um engenheiro de dados encontrou uma dimensão
que se encaixava perfeitamente no conceito de dimensão degenerada, de apenas um
atributo.
* Qual é a maneira correta de tratar uma dimensão degenerada?
* A Criar uma tabela dimensão com o produto cartesiano de todas as dimensões degeneradas.
* B Eliminar a dimensão do modelo estrela.
* C Incluí-la como uma coluna na tabela fato.
* D Mantê-la como uma tabela dimensão e usar o atributo como chave.
* E Mantê-la como uma tabela dimensão e usar uma chave artificial.

A

C Incluí-la como uma coluna na tabela fato.

18
Q

FGV - 2024 - Analista da Comissão de Valores Mobiliários (CVM)/Ciência de Dados/Perfil 7
* Para apoiar análises sobre os fundadores de empresas ao longo do tempo, elaborou-se, inicialmente, o seguinte modelo multidimensional de dados, no qual a tabela FATO FUNDAÇÃO
EMPRESAS se relaciona com múltiplos valores da tabela DIMENSÃO FUNDADOR.
* No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada
por meio da aplicação da técnica de modelagem multidimensional:
* A Tabela Ponte (Bridge Tables);
* B Tabela Fato sem Fatos (Factless Fact Tables);
* C Dimensão Degenerada (Degenerate Dimensions);
* D Dimensão Floco de Neve (Snowflaked Dimensions);
* E Dimensão que Desempenha Múltiplos Papéis (Role-Playing Dimensions)

A

A Tabela Ponte (Bridge Tables);

19
Q

VUNESP - 2023 - Analista (CIJUN)/Dados/Estatísticas
* Na modelagem multidimensional de banco de dados para Data Warehouse,
tabelas de dimensão armazenam os dados descritivos relacionados aos fatos.
* Quando uma dimensão é denominada Junk (lixo),
* A está contida dentro da própria tabela fato por ter somente sua chave como
atributo.
* B pode estar relacionada com a tabela fato em visões diferentes pela mesma
chave substituta.
* C tem como vantagem diminuir o tamanho da tabela fato associada.
* D deve possuir conexão com outras dimensões.
* E está normalizada e subdividida em tabelas menores de domínio.

A

C tem como vantagem diminuir o tamanho da tabela fato associada.

20
Q

FGV - 2022 - Auditor de Controle Externo (TCE TO)/Tecnologia da
Informação
* Observe a seguinte modelagem dimensional.
* A técnica utilizada para implementar a dimensão tempo e seus
diferentes relacionamentos com a tabela fato é:
* A Factless table;
* B Fact Constellation;
* C Role playing dimension;
* D Degenerated dimension;
* E Slowly changing dimension

A

C Role playing dimension;

21
Q

ETL – Extração, Transformação e Carga

A

ETL é o processo de extração de dados de sistemas de origem,
transformação desses dados em um formato adequado para
análise e, em seguida, carregamento dos dados transformados em
um sistema de armazenamento, como um data warehouse.

22
Q

ELT

A
  • ELT é um processo de integração de dados que envolve a extração
    de dados de várias fontes, o carregamento desses dados em um
    repositório central (como um data lake ou data warehouse) e, em
    seguida, a transformação dos dados dentro desse repositório,
    utilizando a capacidade de processamento do sistema de
    armazenamento
23
Q

CEBRASPE (CESPE) - 2024 - Especialista em Regulação de
Serviços de Transportes Terrestres (ANTT)/”Sem Área” (e mais 1
concurso)
* Acerca do processo ETL (extrair, transformar, carregar) e da
manipulação, do tratamento e da visualização de dados, julgue o
item que se segue.
* A limpeza de dados consiste no processo de reorganização dos
dados para a garantia de sua qualidade e consistência.

A

Errado

A limpeza de dados, também conhecida como data cleansing ou data cleaning, é o processo de identificar, corrigir ou remover dados incorretos, incompletos, duplicados ou inconsistentes de um conjunto de dados. O objetivo principal é melhorar a qualidade dos dados para que sejam precisos, confiáveis e adequados para análise e tomada de decisão.

Embora a reorganização dos dados possa ser uma parte do processo ETL (Extrair, Transformar, Carregar), a limpeza de dados não se resume a reorganizar dados. Ela envolve uma série de atividades, tais como:

Correção de erros: Ajustar valores incorretos ou imprecisos nos dados.
Remoção de duplicatas: Eliminar registros repetidos que podem distorcer análises.
Tratamento de valores ausentes: Preencher ou excluir dados faltantes de maneira apropriada.
Padronização de formatos: Uniformizar formatos de data, hora, unidades de medida, etc.
Validação de consistência: Garantir que os dados estejam coerentes entre si e dentro do contexto esperado.
Eliminação de dados irrelevantes: Remover informações que não são necessárias para a análise ou que possam introduzir ruído.
Portanto, a afirmação de que a limpeza de dados consiste no processo de reorganização dos dados para garantir sua qualidade e consistência é incompleta e imprecisa. A limpeza de dados abrange um conjunto mais amplo de práticas destinadas a melhorar a qualidade dos dados além da simples reorganização.

24
Q

CEBRASPE (CESPE) - 2024 - Especialista em Regulação de Serviços de
Transportes Terrestres (ANTT)/”Sem Área” (e mais 1 concurso)
* Acerca do processo ETL (extrair, transformar, carregar) e da
manipulação, do tratamento e da visualização de dados, julgue o item
que se segue.
* Em ETL, o armazenamento de dados pode ser feito em bancos de dados
ou em data warehouse, mas não em data lakes, porque estes seguem
um padrão diferente e, geralmente, armazenam seus dados por meio do
armazenamento de objetos ou nos HDFS (hadoop distributed file
systems).

A

Errado.

No processo de ETL (Extrair, Transformar, Carregar), o armazenamento de dados pode ser realizado em bancos de dados, data warehouses e também em data lakes. A afirmação de que o ETL não pode carregar dados em data lakes é incorreta.

Os data lakes são repositórios que armazenam grandes volumes de dados em seu formato original ou bruto, incluindo dados estruturados, semiestruturados e não estruturados. Eles utilizam tecnologias como armazenamento de objetos (por exemplo, Amazon S3, Azure Blob Storage) ou sistemas de arquivos distribuídos como o HDFS (Hadoop Distributed File System) para armazenar os dados.

Embora os data lakes utilizem sistemas de armazenamento diferentes dos bancos de dados relacionais tradicionais, isso não impede que processos ETL sejam aplicados. Na verdade, é comum utilizar ETL para:

Extrair dados de várias fontes (bancos de dados, arquivos, APIs, etc.).
Transformar os dados para padronizar formatos, limpar inconsistências e aplicar regras de negócio.
Carregar os dados transformados em um data lake para armazenamento centralizado e posterior análise ou processamento.
Além disso, existe o conceito de ELT (Extrair, Carregar, Transformar), onde os dados são primeiro carregados no data lake e, em seguida, transformados conforme necessário. Isso é especialmente útil em ambientes de big data, onde o poder de processamento distribuído é utilizado para transformar grandes volumes de dados já armazenados no data lake.

Portanto, afirmar que o ETL não pode carregar dados em data lakes porque eles seguem um padrão diferente é incorreto. Os data lakes são, sim, destinos válidos e comuns para dados processados por ETL em arquiteturas modernas de dados.

25
Q

CEBRASPE (CESPE) - 2024 - Especialista em Regulação de
Recursos Hídricos e Saneamento Básico (ANA)/Especialidade 1 (e
mais 2 concursos)
* Julgue o item a seguir, a respeito de ETL e técnicas de redução de
dimensionalidade.
* Na fase de transformation do ETL, os dados são analisados e
padronizados, mantendo suas propriedades originais.

A

Correto

26
Q

CEBRASPE (CESPE) - 2024 - Analista de Planejamento e
Orçamento (MPO)/Geral (e mais 7 concursos)
* Julgue o item a seguir, a respeito de conceitos e fundamentos de
dados.
* ETL (extract, transform, load) envolve a extração de dados de
múltiplas fontes de dados, inclusive fontes de dados
orçamentários.

A

Correto

27
Q

Data lake

A

Um data lake é um repositório de armazenamento que pode
conter grandes volumes de dados em seu formato bruto e
nativo. Ele permite armazenar dados estruturados, semiestruturados e não estruturados de forma escalável, sem a
necessidade de transformação imediata.

Um data lake é um repositório centralizado que permite que as
organizações armazenem todos os seus dados em um formato
bruto, fornecendo acesso fácil e autoatendimento a usuários de
negócios, enquanto implementam práticas robustas de
governança para garantir a qualidade e a segurança dos dados.

28
Q
A