BI e Data Warehouse - Sistema de suporte à decisão Flashcards

1
Q

Dados os mesmos conjuntos de informações de entrada, um sistema deve obter resultados:

A

semelhantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

As decisões que passam por sistemas de auxílio na tomada de decisão geralmente são resultado de muitos cálculos, necessitam de um volume altíssimo de _____, são altamente ____________ e devem ser ___________.

A

As decisões que passam por sistemas de auxílio na tomada de decisão geralmente são resultado de muitos cálculos, necessitam de um volume altíssimo de dados, são altamente consistentes e devem ser tempestivos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O sistema de suporte à decisão trata-se de um conjunto de ______________ baseados em _______ para processamento de ______ e ___________ para ajudar o seu utilizador a tomar decisões.

A

O sistema de suporte à decisão trata-se de um conjunto de procedimentos baseados em modelos para processamento de dados e julgamento para ajudar o seu utilizador a tomar decisões.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

CERTO OU ERRADO:

Sistemas de apoio à decisão são sistemas que, substituindo a intervenção humana, tomam decisão em situações críticas que envolvem o
processamento de grande volume de informações em paralelo.

A

ERRADO! Não substituem a intervenção humana, esta ainda é necessária.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

CERTO OU ERRADO:

Os sistemas de suporte à decisão utilizam uma coleção de dados relativos a uma empresa. A essa coleção dá-se o nome de Data Warehouse.

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

São várias as definições de Business Intelligence

Business Intelligence é o processo de ____________ e __________ de informações que apoiarão a ______ de um negócio.

A

Business Intelligence é o processo de recolhimento e tratamento de informações que apoiarão a gestão de um negócio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

São várias as definições de Business Intelligence

Business Intelligence é o processo ___________ de ______, ___________, _______, _______________ e ____________ de dados que, depois de processados, geram informações para o _______ e para a ______ de decisões no ambiente de ________.

A

São várias as definições de Business Intelligence

Business Intelligence é o processo inteligente de coleta, organização, análise, compartilhamento e monitoração de dados que, depois de processados, geram informações para o suporte e para a tomada de decisões no ambiente de negócios.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

São várias as definições de Business Intelligence

Business Intelligence trata da capacidade de cruzar ___________ de __________ bancos de dados, gerando __________ _________ ________.

A

São várias as definições de Business Intelligence

Business Intelligence trata da capacidade de cruzar informações de diferentes bancos de dados, gerando relatórios analíticos diversos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

São várias as definições de Business Intelligence

Business Intelligence se refere à aplicação de técnicas __________ para informações sobre _________ de negócio no sentido de _______-___, de uma maneira ______________, mas com a interpretação e respostas _______, de forma a melhorar a ______ __ _________.

A

Business Intelligence se refere à aplicação de técnicas analíticas para informações sobre condições de negócio no sentido de melhora-las, de uma maneira automatizadas, mas com a interpretação e respostas humanas, de forma a melhorar a tomada de decisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

São várias as definições de Business Intelligence

Business Intelligence trata da descrição de habilidades das organizações para acessar _____ e explorar ____________, analisando e desenvolvendo ____________ e ______________ a seu respeito.

A

Business Intelligence trata da descrição de habilidades das organizações para acessar dados e explorar informações, analisando e desenvolvendo percepções e entendimento a seu respeito.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

São várias as definições de Business Intelligence

Business Intelligence são _______, _______ e ___________ de análise de dados para _________ processos de decisão de uma empresa.

A

Business Intelligence são técnicas, métodos e ferramentas de análise de dados para subsidiar processos de decisão de uma empresa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

São várias as definições de Business Intelligence

Business Intelligence nada mais é que uma série de _________ e ____________ para auxiliar na tomada de decisões _____________ nas empresas através principalmente de geração de __________ __________ __________.

A

São várias as definições de Business Intelligence

Business Intelligence nada mais é que uma série de conceitos e metodologia para auxiliar na tomada de decisões estratégicas nas empresas através principalmente de geração de relatórios gerenciais analíticos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

São várias as definições de Business Intelligence

Business Inteligence é um termo utilizado para descrever as ___________ das corporações para _______ dados e ________ informações, _______-___ e desenvolver _____________ para tomada de melhores decisões.

A

São várias as definições de Business Intelligence

Business Inteligence é um termo utilizado para descrever as habilidades das corporações para coletar dados e explorar informações, analisa-las e desenvolver entendimento para tomada de melhores decisões.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

RESUMO DE DEFINIÇÃO DE BI

Business Intelligence (Inteligência de Negócio) é um termo criado pelo Gartner Group utilizado para representar um conjunto de processos, técnicas, metodologias, habilidades, ferramentas e capacidades utilizadas para acessar, coletar, organizar, tratar, analisar, cruzar, processar, compartilhar e monitorar dados de diversas fontes com o intuito de gerar informações e relatórios analíticos que suportem a gestão corporativa, a definição de estratégias e a tomada de decisão em ambientes de negócio.

A

!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O Business Intelligence é realizado sobre dados históricos ____________, provenientes de bases _________________.

A

O Business Intelligence é realizado sobre dados históricos consolidados, provenientes de bases multidimensionais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

DICAS DE PROVA

Não há consenso na literatura sobre os tipos de análise suportadas pelo BI, mas algumas questões não consideram que análises prescritivas são suportadas por essa tecnologia.

A

!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Análise descritiva é o _____ de dados ou conteúdos para responder à seguinte pergunta: “_ ___ _________?” ou “_ ___ ____ ____________?”

A

Análise descritiva é o exame de dados ou conteúdos para responder à seguinte pergunta: “o que aconteceu?” ou “o que está acontecendo?”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Análise descritiva é caracterizado pelo Business Intelligence tradicional e com visualizações como:

A

gráficos de pizza, gráficos de barras, etc que servem para que gestores tomem decisões;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Análise Diagnóstica é uma forma de análise ________ que examina dados ou conteúdos para responder à pergunta: “___ ___ ____ _________?”

A

Análise Diagnóstica: é uma forma de análise avançada que examina dados ou conteúdos para responder à pergunta: “Por que isso aconteceu?”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

A análise diagnóstica é caracterizada por técnicas como:

A

detalhamento, descoberta de dados, mineração de dados e correlações. Esse é o tipo de análise empregada em investigações de causa-raiz;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Análise Preditiva combina técnicas de ___________, _________ de dados e ____________ de máquina (_______ ________) para encontrar ____________ em grandes quantidades de dados, trabalhando com _______________, entre outros para antecipar comportamentos _______ com base em eventos ________. Responde à pergunta: “_ ___ ___ _________?”;

A

Análise Preditiva: combina técnicas de estatística, mineração de dados e aprendizagem de máquina (Machine Learning) para encontrar significado em grandes quantidades de dados, trabalhando com probabilidades, entre outros para antecipar comportamentos futuros com base em eventos passados. Responde à pergunta: “O que vai acontecer?”;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Análise Prescritiva é uma forma de _______ ________ que examina os dados ou os conteúdos para responder à pergunta: “_ ___ ____ ___ _____?” ou “_ ___ ________ _____ ____ ____ ________?”

A

Análise Prescritiva é uma forma de análise avançada que examina os dados ou os conteúdos para responder à pergunta: “O que pode ser feito?” ou “O que podemos fazer caso isso aconteça?”
não consideram que análises prescritivas são suportadas pela tecnologia BI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

A análise prescritiva é caracterizada por técnicas como:

A

análise de gráficos, simulação, redes neurais, mecanismos de recomendação, heurísticas, aprendizado de máquina, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

As aplicações de Business Intelligence, nas últimas décadas, se utilizam de dados multidimensionais, armazenados em Data Warehouse, para gerar visões de negócios baseados em análises:

a) descritivas, diagnósticas, preditivas e prescritivas.
b) prescritivas, preditivas e diagnósticas, apenas.
c) preditivas, prescritivas e descritivas, apenas.
d) diagnósticas, descritivas e preditivas, apenas.
e) descritivas, diagnósticas e prescritivas, apenas.

A

Letra D.
a análise prescritiva não é suportada pela tecnologia BI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Um usuário que desejar utilizar os conceitos de BI precisará de uma infraestrutura _____________ __________ capaz de _______, ______, _______, ___________ e ________ dados ____________ ou ___ ____________ de diversas fontes em depósitos de informações que possam ser acessados por sistemas __________.

A

Um usuário que desejar utilizar os conceitos de BI precisará de uma infraestrutura arquitetural específica capaz de extrair, limpar, formatar, transformar e carregar dados estruturados e não estruturados de diversas fontes em depósitos de informações que possam ser acessados por sistemas analíticos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

O Business Intelligence possui quatro habilidades:

A

memória organizacional, informação integrada, criação de conhecimento (insight) e apresentação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

O principal recurso (habilidade) de Business Intelligence é a:

A

Memória Organizacional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Integração de Informações é a habilidade de ____________ informações de ________ fontes.

A

Integração de Informações é a habilidade de centralizar informações de diversas fontes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Informações centralizadas em um único local (integração de informações) ajudam na Criação de:

A

Insights.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Criar insights significa ___________ a capacidade de ter ________ sobre o negócio para ajudar a melhorar a tomada de decisões.

A

Criar insights significa desenvolver a capacidade de ter intuição sobre o negócio para ajudar a melhorar a tomada de decisões.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

A criação de insights fornece contribuições para o recurso de:

A

Apresentação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Por meio da apresentação, o sistema de Business Intelligence tem a habilidade de gerar __________ e ___________ adequados, ________e __________ para a ________ dos usuários das ferramentas.

A

Por meio da apresentação, o sistema de Business Intelligence tem a habilidade de gerar relatórios e ferramentas adequados, legíveis e inteligíveis para a maioria dos usuários das ferramentas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

CERTO OU ERRADO:

Uma solução de business intelligence, usualmente, provê as seguintes capacidades: memória da organização, integração da informação, criação de insights e apresentação dos dados.

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

De acordo com E. Turban, a arquitetura BI possui quatro grandes componentes:

A

(1) Data Warehouse, com seus dados-fonte;
(2) Análise de Negócio, uma coleção de ferramentas para manipular e analisar os dados do Data Warehouse, incluindo Data Mining;
(3) Business Performance Management (BPM), para monitoria e análise do desempenho; e
(4) uma interface de usuário, como um dashboard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Análise de Negócio é uma coleção de ___________ para _________ e ________ os dados.

A

Análise de Negócio é uma coleção de ferramentas para manipular e analisar os dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

O ambiente de Data Warehousing é sobretudo de responsabilidade de uma ______ _______, e o ambiente de análise (também conhecido como _______ __ ________) está no âmbito dos ________de negócios.

A

O ambiente de Data Warehousing é sobretudo de responsabilidade de uma equipe técnica, e o ambiente de análise (também conhecido como análise de negócio) está no âmbito dos usuários de negócios.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Qualquer usuário pode conectar-se ao sistema BI por meio de uma:

A

interface de usuário.
como um navegador, e a alta administração pode usar o componente de BPM e também o dashboard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Data warehouse é um banco ou ___________ de dados de interesse dos ________ preparado para dar suporte a aplicações de ______ __ _______. As aplicações variam de simples gerações de __________ ou _________ a complexas ___________.

A

Data warehouse é um banco ou repositório de dados de interesse dos gestores preparado para dar suporte a aplicações de tomada de decisão. As aplicações variam de simples gerações de relatórios ou consultas a complexas otimizações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

A Análise de Negócios trata-se de um conjunto de ferramentas para _________, _______ e ________ dados, criar __________, realizar _________ sob demanda, entre outros. Dessa forma, usuários de negócio são capazes de identificar com rapidez e facilidade as tendências de __________.

A

A Análise de Negócios trata-se de um conjunto de ferramentas para manipular , minerar e analisar dados, criar relatórios, realizar consultas sob demanda, entre outros. Dessa forma, usuários de negócio são capazes de identificar com rapidez e facilidade as tendências de desempenho.
Ex: usuários podem isolar e identificar produtos, clientes ou regiões que apresentam tendências significativas de alta ou de baixa, ou que constituem fontes de problemas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

O componente BPM permite otimizar o __________ _____ de uma organização por meio da _______ de ________ com desempenhos _____ da organização. Para tal, utiliza-se da _______, geração de __________ e _________ para comparar o desempenho de negócios às _____ estabelecidas – além de oferecer uma plataforma para compartilhar _____ __ __________ e __________ da empresa.

A

O componente BPM permite otimizar o desempenho geral de uma organização por meio da conexão de métricas com desempenhos reais da organização. Para tal, utiliza-se da análise, geração de relatórios e consultas para comparar o desempenho de negócios às metas estabelecidas – além de oferecer uma plataforma para compartilhar metas de desempenho e resultado da empresa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

O componente Interface do Usuário permite uma visão ______ dos dados por meio de ferramentas de ____________, como __________, _______, _______, ________, ________, etc.

A

O componente Interface do Usuário permite uma visão rápida dos dados por meio de ferramentas de visualização, como dashboards, painéis, portáis, gráficos, cockpit, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Os dashboards fornecem uma visão __________ das _______, __________ e ________ do desempenho corporativo provenientes de _________ áreas do negócio, propiciando uma visão imediata da _____ da organização.

A

Os dashboards fornecem uma visão abrangente das medidas, tendências e exceções do desempenho corporativo provenientes de múltiplas áreas do negócio, propiciando uma visão imediata da saúde da organização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

O Data Warehouse trata-se de uma coleção de dados orientados por _______, __________, _________ com o tempo e ___-________, para dar
suporte ao processo de tomada de decisão.

A

O Data Warehouse trata-se de uma coleção de dados orientados por assunto, integrados, variáveis com o tempo e não-voláteis, para dar
suporte ao processo de tomada de decisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

PARA FIXAR

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Em um sistema de BI, a coleção de ferramentas utilizada como componente para manipular, minerar e analisar os dados no DW (Data Warehouse) denomina-se:

A

Análise de Negócio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Data Warehouse significa como um _______ de Dados.

A

Data Warehouse significa como um armazém de Dados.
ou seja, é muito maior que o banco de dados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Data Warehouse é um banco de dados especializado em gerar __________, logo sua performance para esse tipo de processamento é extremamente _________.

A

Data Warehouse é um banco de dados especializado em gerar relatórios, logo sua performance para esse tipo de processamento é extremamente eficiente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Usando um Data Warehouse relatórios terão que ser alimentados?

A

SIM!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

A alimentação de um Data Warehouse é realizado por meio de um processo chamado:

A

ETL (Extract, Transform, Load).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

O processo ETL realiza três operações:
Extract - _____ as informações do banco de dados ___________;
Transform - _________ as informações para o _______ adequado
Load - _______ as informações no ____ _________.

A

O processo ETL realiza três operações:
Extract - extrai as informações do banco de dados transacional;
Transform - transforma as informações para o formato adequado
Load - carrega as informações no Data
Warehouse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

O modelo Data Warehoue apresenta alta performance, uma vez que os usuários estão ____________; é mais fácil realizar _________ e analisar ___________, uma vez que os dados já estarão organizados em relatórios ___-_________; o processamento é _____________, isto é, uma vez que seja realizado o ETL, os relatórios estarão ___________ e prontos para serem ___________.

A

O modelo Data Warehoue apresenta alta performance, uma vez que os usuários estão distribuídos; é mais fácil realizar consultas e analisar informações, uma vez que os dados já estarão organizados em relatórios pré-definidos; o processamento é reaproveitado, isto é, uma vez que seja realizado o ETL, os relatórios estarão processados e prontos para serem consultados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

CERTO OU ERRADO:

A facilidade em captar e transformar os dados de fontes diversas em algo útil para o Data Warehouse o torna um excelente custo-benefício.

A

ERRADO! O Data Warehouse possui dificuldades em captar e transformar dados de diversas fontes em algo útil, podendo não ser vantajoso pelo custo/benefício.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

A falta de facilidade em fácil captar e transformar os dados de fontes diversas em algo útil para o Data Warehouse pode reduzir a relação _____/_________.

A

A falta de facilidade em fácil captar e transformar os dados de fontes diversas em algo útil para o Data Warehouse pode reduzir a relação custo/benefício.
ferramentas e infraestrutura extras costumam ser necessárias, nem sempre compensando o custo de aquisição, treinamento e operação; a informação pode ficar obsoleta rapidamente; dados pouco estruturados costumam ser difíceis de se trabalhar; entre outros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Caso o Data Warehouse não aguente a quantidade de acessos simultâneos, é possível criar ____________ de Data Warehouse, de acordo com vários critérios.

A

Caso o Data Warehouse não aguente a quantidade de acessos simultâneos, é possível criar subconjuntos de Data Warehouse, de acordo com vários critérios.
por exemplo: assuntos (Concursos, Coaching, Pós-Graduação, Certificação, Vestibulares, Questões, etc);

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Os subconjuntos de Data Warehouse (DW) são
chamados de:

A

Data Mart (DM).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

DADOS OPERACIONAIS:

Tem como conteúdo valores _________.
Sua organização de dados é por _________/_______ de informação.
A natureza dos seus dados é ________.
Possui formato da estrutura __________, próprio de computação ____________.
Possui atualização dos dados _____ a _____.
O seu uso é altamente estruturado em _______, com processamento __________.
O seu tempo de resposta é _________ para faixas abaixo de _ _______.

A

Dados operacionais:

Tem como conteúdo valores correntes.
Sua organização de dados é por sistema/aplicação de informação.
A natureza dos seus dados é dinâmica.
Possui formato da estrutura relacional, próprio de computação transacional.
Possui atualização dos dados campo a campo.
O seu uso é altamente estruturado em tabelas, com processamento repetitivo.
O seu tempo de resposta é otimizado para faixas abaixo de 1 segundo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

DADOS INFORMACIONAIS:

Tem como conteúdo valores ___________, __________, integrado de ______ ______.
Sua organização de dados é por _________/_______.
A natureza dos seus dados é ________ (até a ___________ dos dados, que ocorre de ______ em ______).
Possui formato da estrutura ___________, ____________, próprio para atividades __________.
O seu uso é estruturado em _____, _________, com processamento _________ e _________.
O seu tempo de resposta possui tempo de resposta _______ devido as suas análises mais _________.

A

DADOS INFORMACIONAIS:

Tem como conteúdo valores sumarizados, calculados, integrado de várias fontes.
Sua organização de dados é por assuntos/negócios.
A natureza dos seus dados é estática (até a atualização dos dados, que ocorre de tempos em tempos).
Possui formato da estrutura dimensional, simplificado, próprio para atividades analíticas.
O seu uso é estruturado em fatos, dimensões, com processamento analítico e preditivo.
O seu tempo de resposta possui tempo de resposta maiores devido as suas análises mais complexas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Segundo Ralph Kimball, Data Warehouse é conjunto de ___________ e ________ de projeto que, quando aplicadas às necessidades ___________ dos usuários e aos bancos de dados ___________, permitirá que planejem e construam um Data Warehouse.

A

Segundo Ralph Kimball, Data Warehouse é conjunto de ferramentas e técnicas de projeto que, quando aplicadas às necessidades específicas dos usuários e aos bancos de dados específicas, permitirá que planejem e construam um Data Warehouse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

Segundo Bill Inmon, Data Warehouse é uma _______ de dados orientados por _______, __________, _________ com o tempo e ___-________, para dar _______ ao processo de ______ __ _______.

A

Segundo Bill Inmon, Data Warehouse é uma coleção de dados orientados por assunto, integrado, variáveis com o tempo e não-voláteis, para dar suporte ao processo de tomada de decisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Segundo Arun Sen, Data Warehouse é um banco de dados construídos no interesse de suporte à _______ __ ________ e contêm dados __________ ___________ e ____________ provenientes de registros ___________ de bancos de dados ____________.

A

Segundo Arun Sen, Data Warehouse é um banco de dados construídos no interesse de suporte à decisão de negócio e contêm dados históricos sumarizados e consolidados provenientes de registros individuais de bancos de dados operacionais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

Segundo Kenneth Laudon, Data Warehouse é um banco de dados com ferramentas de ________ e _________, que armazena _____ ______ e __________ extraídos de vários ________/_________ ___________ e consolidados para fins de ________ e relatórios _______________.

A

Segundo Kenneth Laudon, Data Warehouse é um banco de dados com ferramentas de consulta e relatório que armazena, dados atuais e históricos extraídos de vários sistemas/ambientes operacionais e consolidados para fins de análises e relatórios administrativos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

PARA FIXAR

PALAVRAS CHAVE PARA DATA WAREHOUSE

Coleção de dados; ferramentas de consulta e relatório; orientados por assuntos; integrados; variáveis com o tempo; não-voláteis; dados históricos sumarizados e consolidados; suporte à tomada de decisão.

A

!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

“É um conjunto integrado de dados, extraídos de bancos de dados operacionais, históricos, externos e selecionados, editados e padronizados para recuperação e análise, para fornecer inteligência empresarial e nos negócios no processo de tomada de decisões gerenciais”.

Essa citação representa o conceito de:

A

Data Warehouse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

Data Warehouse é orientado por:

A

assunto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Data Warehouse é não-_______.

A

Data Warehouse é não-volátil.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Um Data Warehouse é montado por assunto, isto é, ele trata de temas ___________ e
____________ para o negócio da organização.

A

Um Data Warehouse é montado por assunto, isto é, ele trata de temas específicos e
importantes para o negócio da organização.
uma empresa do ramo de concursos pode ter como assuntos principais: concursos militares, concursos fiscais, concursos policiais, concursos de tribunais, concursos bancários, concursos legislativos, entre outros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Os dados são carregados a partir do Banco de
Dados ____________ para o Data Warehouse.

A

Os dados são carregados a partir do Banco de
Dados Transacional para o Data Warehouse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

O Data Warehouse é não-volátil, logo, ele não muda com __________. Na verdade, os dados,em tese, jamais devem ______ (serem _________ ou _________) após _________.

A

O Data Warehouse é não-volátil, logo, ele não muda com facilidade. Na verdade, os dados,em tese, jamais devem mudar (serem alterados ou deletados ) após inseridos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

Podemos dizer que os dados ficam disponíveis apenas para que os usuários realizem _________ e façam _________ que auxiliem a tomada de decisão por parte dos gestores de uma organização. Logo, os dados disponíveis em um Data Warehouse mostram uma característica de somente _______ para os usuários finais de um banco de dados.

A

Podemos dizer que os dados ficam disponíveis apenas para que os usuários realizem consultas e façam relatórios que auxiliem a tomada de decisão por parte dos gestores de uma organização. Logo, os dados disponíveis em um Data Warehouse mostram uma característica de somente leitura para os usuários finais de um banco de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

Data Warehouse é integrado. Ser integrado
significa que os dados estão ____________ e _________. As inconsistências são _________ e os conflitos de informações são ___________ antes de serem _________ ou __________ em um Data Warehouse!

A

Data Warehouse é integrado. Ser integrado
significa que os dados estão consistentes e uniformes. As inconsistências são removidas e os conflitos de informações são corrigidas antes de serem inseridas ou carregadas em um Data Warehouse!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

Como é feito para corrigir inconsistências para o Data Warehouse?

A

Limpando a base de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

Os dados de um Data Warehouse são integrados de _________ fontes diferentes de forma __________, ___________ e ________.

A

Os dados de um Data Warehouse são integrados de múltiplas fontes diferentes de forma consistente, padronizada e uniforme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

PARA FIXAR

EXEMPLO DE INCONSISTÊNCIA DE DADOS

Um campo em branco e o usuário preenchia livremente qual era o banco em que ele tinha conta corrente. Qual é o problema disso? O problema é que um usuário escrevia “Caixa Econômica”; outro usuário escrevia “Caixa”; outro usuário escrevia “Caixa Econômica Federal”; e – por fim – outro escrevia “CEF”. Se os dados representam a mesma entidade, mas estão com nomes diferentes, podemos dizer que os dados não estão integrados. Em outras palavras, ser integrado significa que os dados estão consistentes e uniformes. Na hora de realizar um relatório, iria dificultar muito pois os dados para o mesmo banco ficariam separados.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

Data Warehouse é histórico, ou seja, variável com o _____. No Data Warehouse são mantido dados __________.

A

Data Warehouse é histórico, ou seja, variável com o tempo. No Data Warehouse são mantido dados históricos.

75
Q

CERTO OU ERRADO:

Um Data Warehouse armazena dados históricos usados no processo de tomada de decisão. Este sistema integra os dados corporativos de uma empresa em um único repositório.

A

CERTO!

76
Q

CERTO OU ERRADO:

Data warehouses são definidos como um conjunto de dados integrado, orientados por departamentos, variante no tempo e não volátil.

A

ERRADO! Não é por departamentos, é por assunto. De resto, tudo certo.

77
Q

Existem basicamente três tipos de Data Warehouse:

A
  • Enterprise Data Warehouse (EDW),
  • Operational Data Store (ODS)
  • Data Mart (DM)
78
Q

Enterprise Data Warehouse (EDW), traduzido como _______ de _____ ____________/___________/_____________, é um repositório _______ ______/___________que contém _____ as informações de negócio de uma organização de forma _________ para toda _______ com a finalidade de suportar as ________ __ ________.

A

Enterprise Data Warehouse (EDW), traduzido como Armazém de dados Corporativos/Abrangentes/Empresariais, é um repositório central tático/estratégico que contém todas as informações de negócio de uma organização de forma acessível para toda empresa com a finalidade de suportar as análises de decisões.

79
Q

É possível afirmar que um Enterprise Data Warehouse é um Data Warehouse?

A

SIM! Um DW de larga escala.

80
Q

É possível afirmar que um EDW é um DW de _____ escala, ______ e __________, que é utilizado pela organização como um ____ e que integra informações de ________ fontes de dados.

A

É possível afirmar que um EDW é um DW de larga escala, grande e abrangente, que é utilizado pela organização como um todo e que integra informações de diversas fontes de dados.

81
Q

Operational Data Store (ODS) traduzido como ________ de Dados ___________, trata-se de um repositório ______________ de dados utilizado para relatórios ____________ e como uma fonte de dados para o __________ ____ _________ (___).

A

Operational Data Store (ODS) traduzido como Armazenamento de Dados Operacionais, trata-se de um repositório intermediário de dados utilizado para relatórios operacionais e como uma fonte de dados para o Enterprise Data Warehouse (EDW).

82
Q

O EDW é utilizado para suporte de que tipo de decisões?

A

Táticas e estratégicas.

83
Q

O Operational Data Store (ODS) um elemento ____________ a um EDW em um cenário de suporte a decisões, e é usado para relatórios, controles e tomada de decisões ___________

A

O Operational Data Store (ODS) um elemento complementar a um EDW em um cenário de suporte a decisões, e é usado para relatórios, controles e tomada de decisões operacionais.

84
Q

O Data Mart (DM), traduzido como _______ de Dados, trata-se de um ____________ de dados de um Data Warehouse.

A

O Data Mart (DM), traduzido como Mercado de Dados, trata-se de um subconjunto de dados de um Data Warehouse.

85
Q

O Data Mart (DM) geralmente são dados referentes a um assunto __________ ou diferentes níveis de ___________, que focalizam uma ou mais áreas ___________. Seus dados são obtidos do ____ _________ de forma ________ para suportar ________ ________.

A

O Data Mart (DM) geralmente são dados referentes a um assunto específico (Ex: Vendas, Estoque, Controladoria, entre outros) ou diferentes níveis de sumarização (Ex: Vendas Anual, Vendas Semestral, Vendas Mensal, entre outros), que focalizam uma ou mais áreas específicas. Seus dados são obtidos do Data Warehouse de forma indexada para suportar intensas pesquisas.

86
Q

O Data Mart é considerado um Data Warehouse de forma _______, ou um ___________/____________ que contém dados de uma organização em geral _________ a uma _______ __ _______ ou a um _________ __ _______ __________ com a finalidade de dar suporte ao processo _________ da ____ _______ por meio da criação de uma visão _____________ dos dados.

A

O Data Mart é considerado um Data Warehouse de forma pequena, ou um subconjunto/segmentação que contém dados de uma organização, em geral, restritos a uma unidade de negócio ou a um processo de negócio específico com a finalidade de dar suporte ao processo decisório da alta direção por meio da criação de uma visão personalizada dos dados.

87
Q

De acordo com Date, trata-se de um repositório ____________ e _______.

A

De acordo com Date, trata-se de um repositório especializado e volátil.
ATENÇÃO: DATE É O ÚNICO AUTOR QUE FALA ISSO

88
Q

Data Marts geralmente lidam com quantos assuntos?

A

Um.

89
Q

Data Marts são frequentemente construídos e gerenciados por um único ____________ _________.

A

Data Marts são frequentemente construídos e gerenciados por um único departamento comercial.

90
Q

O Data Mart normalmente obtêm dados de um ________ número de fontes e, como consequência, são geralmente menos _________, mais ___________, mais fáceis de ________ e mais fáceis de ______ do que Data Warehouses.

A

O Data Mart normalmente obtêm dados de um pequeno número de fontes e, como consequência, são geralmente menos complexos, mais econômicos, mais fáceis de construir e mais fáceis de manter do que Data Warehouses.

91
Q

Um Data Mart permite um acesso mais ______ aos dados, recuperando um conjunto _________ de dados para __ e _________. Como resultado, ajuda a ________ os processos de negócios.

A

Um Data Mart permite um acesso mais rápido aos dados, recuperando um conjunto específico de dados para Bi e Relatórios. Como resultado, ajuda a acelerar os processos de negócios.

92
Q

Sendo focado em um assunto, é mais fácil ____________ um Data Mart, sendo mais __________ em comparação com a construção de uma empresa Data Warehouse;

A

Sendo focado em um assunto, é mais fácil implementar um Data Mart, sendo mais econômico em comparação com a construção de uma empresa Data Warehouse;

93
Q

O uso de um Data Mart é fácil, visto que ele é projetado de acordo com os requisitos de um _____ __________ de usuários que trabalham em um ___________ _________;

A

O uso de um Data Mart é fácil, visto que ele é projetado de acordo com os requisitos de um grupo específico de usuários que trabalham em um departamento específico;

94
Q

Um Data Mart é comparativamente mais _________ que um Data Warehouse. Qualquer alteração no modelo de dados pode ser fácil e rapidamente ___________ no Data Mart;

A

Um Data Mart é comparativamente mais adaptável que um Data Warehouse. Qualquer alteração no modelo de dados pode ser fácil e rapidamente incorporado no Data Mart;

95
Q

Em um Data Mart, os dados são _____________ e ____________, o que permite um controle de acesso em um nível mais ________.

A

Em um Data Mart, os dados são particionados e segmentados, o que permite um controle de acesso em um nível mais granular.

96
Q

O nível de granularidade é a maior ou menor ________ na descrição do _____________ ________ do software em uma _____________ _________.

A

O nível de granularidade é a maior ou menor extensão na descrição do comportamento esperado do software em uma especificação funcional.

97
Q

PARA FIXAR

Data Marts são utilizados por uma única unidade de negócios para armazenar suas informações. Digamos que o departamento de vendas de uma empresa tenha que armazenar seus dados de negócios: eles poderão utilizar um Data Mart para armazenar seus dados.
Quando as informações precisam ser visualizadas pelos superiores, elas são carregadas em um Data Warehouse e são, então, transformadas em insights usando software de Business Intelligence.

A
98
Q

Existem três tipos de Data Mart:

A
  • Independente
  • Dependente
  • Híbrido
99
Q

Um conjunto de fontes de dados operacionais são __________ em um _________ ____ _________, que por sua vez são _________ em diversos Data Marts dependentes.

A

Um conjunto de fontes de dados operacionais são integrados em um Enterprise Data Warehouse, que por sua vez são divididos em diversos Data Marts dependentes.

100
Q

Um Data Mart Dependente é uma _______ de um conjunto de ______ de dados que foram __________ em um Enteprise Data Warehouse.

A

Um Data Mart Dependente é uma divisão de um conjunto de fontes de dados que foram integrados em um Enteprise Data Warehouse.

101
Q

Os data marts dependentes são criados desenhando dados diretamente de fontes ___________, ________ ou _____.

A

Os data marts dependentes são criados desenhando dados diretamente de fontes operacionais, externas ou ambas.

102
Q

Um conjunto de fontes de dados operacionais permitem gerar um ou mais Data Marts _____________, sem a necessidade de criar um __________ ____ __________.

A

Um conjunto de fontes de dados operacionais permitem gerar um ou mais Data Marts independentes, sem a necessidade de criar um Enterprise Data Warehouse.

103
Q

Data Marts independentes são criados sem o uso de:

A

um data warehouse central.

104
Q

No Data Mart híbrido, um conjunto de fontes de dados operacionais podem ser tanto integradas em um ___ para posteriormente permitir a criação de ____ ______ quanto podem gerá-los de maneira _____________.

A

No Data Mart híbrido, um conjunto de fontes de dados operacionais podem ser tanto integradas em um EDW para posteriormente permitir a criação de Data Marts quanto podem gerá-los de maneira independentes.

105
Q

Qual o tipo de Data Mart da imagem?

A

Híbrido.

106
Q

Qual o tipo de Data Mart da imagem?

A

Independente.

107
Q

Qual o tipo de Data Mart da imagem?

A

Dependente.

108
Q

O ERP (sigla para __________ ________ _________) nada mais é que um _______ __ __________ que integra _____ e _________ de uma organização.

A

O ERP (sigla para Enterprise Resource Planning) nada mais é que um sistema de informação que integra dados e processos de uma organização.

109
Q

PARA FIXAR

A
110
Q

Sistemas Legados são aqueles sistemas muito _______ de uma organização (em geral, com tecnologias ______________) que ainda fornecem ________ de negócio __________.

A

Sistemas Legados são aqueles sistemas muito antigos de uma organização (em geral, com tecnologias ultrapassadas) que ainda fornecem serviços de negócio essenciais.

111
Q

Os sistemas legados servem de fontes de dados para um Data Warehouse?

A

SIM!

112
Q

O POS (______ __ ____) são ________ _____________ ou de ______ __ _______ que realizam transações de _____ em determinados ________ e também podem ser importantes ______ de dados.

A

O POS (Points of Sale) são máquinas registradoras ou de cartão de crédito que realizam transações de venda em determinados contexto e também podem ser importantes fonte de dados.

113
Q

PARA FIXAR

A imagem quer mostrar que diversas fontes de dados servem de entrada para um Enterprise Data Warehouse (EDW). No entanto, notem que, antes de serem carregados, eles devem passar pelo processo de ETL.

A
114
Q

Metadados são dados sobre o próprio Enterprise Data Warehouse, por exemplo:

A

estruturas e atributos de tabelas, especificações do modelo de dados, rotinas de acesso, log de extrações, entre outros.

115
Q

Os metadados auxiliam na criação da ____________ dos dados por meio de diversas ___________.

A

Os metadados auxiliam na criação da visualização dos dados por meio de diversas ferramentas.

116
Q

Usuários e aplicações utilizam __________ para acessar Data Marts ou Data Warehouses

A

Usuários e aplicações utilizam middlewares para acessar Data Marts ou Data Warehouses

117
Q

CERTO OU ERRADO:

As estruturas e os atributos das tabelas, a especificação do modelo de dados, as rotinas comuns de acesso a dados e o logging de extrações compõem os metadados de um datawarehouse.

A

CERTO!

118
Q

PARA FIXAR

São componentes principais de um processo de data warehousing fontes de dados, extração de dados, carregamento de dados, banco de dados abrangente, metadados, ferramentas de middleware.

A
119
Q

PARA FIXAR

Os componentes são as Fontes de Dados (Data Sources), Extração de Dados (Extract), Carregamento de Dados (Load), Banco de Dados Abrangente (Enterprise Data Warehouse), metadados (Metadata) e
Ferramentas de Middleware.

A
120
Q

Qual o nome dos autores que foram os pioneiros na teoria sobre Data Warehouse?

A
  • R. Kimball
  • B. Inmon
121
Q

A Arquitetura de Inmon é chamada de __________ ____ _________ e a Arquitetura de Kimball é chamada de ___________ ____ _________.

A

A Arquitetura de Inmon é chamada de Enterprise Data Warwhouse e a Arquitetura de Kimball é chamada de Dimensional Data Warehouse.

122
Q

De maneira simplista, pode-se afirmar que Inmon defende que o Data Warehouse deve ser construído:

A

de cima para baixo (top-down).

123
Q

Kimball defende que o Data Warehouse deve ser construído:

A

de baixo para cima (bottom-up).

124
Q

Inmon acha que a maneira correta é construir o Data Warehouse e depois:

A

dividi-lo em Data Marts;

125
Q

Kimball acha que a maneira correta é construir vários Data Marts e, só então:

A

integrá-los em um Data Warehouse.

126
Q

A abordagem de Inmon recomenda a construção do DW que siga a abordagem de ____ para _____. Na filosofia de Inmon, é começando com a construção de um grande __________ ____ _________ ____________, onde todos os dados disponíveis dos sistemas _____________ são consolidados em uma _______ __ _____ orientada ao _______, _________, ________ no tempo e ___-_______ que suporta a _______ de decisões. Em seguida, os Data Marts são construídos para necessidades __________ de departamentos.

A

A abordagem de Inmon recomenda a construção do DW que siga a abordagem de cima para baixo. Na filosofia de Inmon, é começando com a construção de um grande Enterprise Data Warehouse centralizado, onde todos os dados disponíveis dos sistemas transacionais são consolidados em uma coleção de dados orientada ao assunto, integrada, variante no tempo e não-volátil que suporta a tomamda de decisões. Em seguida, os Data Marts são construídos para necessidades analíticas de departamentos.

127
Q

A abordagem de Kimball recomenda a construção do DW que segue a abordagem de _____ para ____. Na filosofia de Kimball, inicia-se primeiro com Data Marts de missão _______ que atendem às ____________ __________ dos departamentos. Em seguida, se ________ esses Data Marts para ____________ de dados por meio do chamado __________ __ ___________. Kimball faz uso do modelo ___________ para atender às necessidades dos departamentos em várias áreas da empresa.

A

A abordagem de Kimball recomenda a construção do DW que segue a abordagem de baixo para cima. Na filosofia de Kimball, inicia-se primeiro com Data Marts de missão crítica que atendem às necessidades analíticas dos departamentos. Em seguida, se integram esses Data Marts para consistência de dados por meio do chamado barramento de informações. Kimball faz uso do modelo dimensional para atender às necessidades dos departamentos em várias áreas da empresa.

128
Q

PARA FIXAR

Kimball dividia sua abordagem basicamente nessas quatro etapas:

A
129
Q

PARA FIXAR

Kimball vs Inmon

o banco de dados do Kimball não se importa com dados redundantes, já o banco de dados de Inmon se importa (e é normalizado).

A
130
Q

A normalização é um conjunto de ______ aplicadas a um _____ __ _____ para reduzir a ___________, aumentar a ___________ e melhorar o ____________ (exceto de _________).

A

A normalização é um conjunto de regras aplicadas a um banco de dados para reduzir a redundância, aumentar a integridade e melhorar o desempenho (exceto de cosultas).

131
Q

Segundo Kimball, a modelagem dimensional é a única técnica viável para bancos de dados que devem responder _________ em um DW, uma vez que a modelagem relacional é mais ____ para representação de transações.

A

Segundo Kimball, a modelagem dimensional é a única técnica viável para bancos de dados que devem responder consultas em um DW, uma vez que a modelagem relacional é mais útil para representação de transações.

132
Q

Qual a teoria de abordagem considerada mais certa: Kimball ou Inmon?

A

Não existe a mais certa. Ambas estão corretas

133
Q

PARA FIXAR

Na realidade, a maioria das empresas adota a abordagem de Kimball, porque a maioria dos Data Warehouses começam como um esforço departamental e, portanto, originaram-se como um Data Mart.

A
134
Q

Qual das duas imagens se trata da abordagem de Kimball?

A

Se figura 1.

135
Q

Qual imagem se trata da abordagem de Kimball e qual imagem se trata da imagem de Inmon?

A

A de Kimball corresponde a imagem da esquerda e a de Inmon a da direita.

136
Q

É necessário carregar o Data Warehouse regularmente para que possa servir ao propósito de facilitar a análise de negócios. Para fazer isso, os dados de um ou mais sistemas/ambientes operacionais precisam ser _________ e ________ no Data Warehouse.

A

É necessário carregar o Data Warehouse regularmente para que possa servir ao propósito de facilitar a análise de negócios. Para fazer isso, os dados de um ou mais sistemas/ambientes operacionais precisam ser extraídos e copiados no Data Warehouse.

137
Q

O processo de extrair dados de sistemas de origem e trazê-los para o Data Warehouse é
comumente chamado de:

A

ETL (Extract, Transform e Load)

138
Q

PARA FIXAR

Processo ETL.

A
139
Q

O ETL é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que consiste na ________ dos dados de fontes __________ ou ____________ ; na ____________ e _______ destes dados; e na _____ dos dados no DW.

A

O ETL é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e limpeza destes dados; e na carga dos dados no DW.

140
Q

As decisões estratégicas mais importantes de uma organização são tomadas com base nas informações geradas através dos dados armazenados no:

A

Data Warehouse.

141
Q

As decisões estratégicas mais importantes de uma organização são tomadas com base nas informações geradas através dos dados armazenados no Data Warehouse. Se estes dados não forem corretamente trabalhados no processo de extração, as informações geradas através deles farão com que decisões sejam tomadas _____________, podendo afetar diretamente os ________ da organização.

A

As decisões estratégicas mais importantes de uma organização são tomadas com base nas informações geradas através dos dados armazenados no Data Warehouse. Se estes dados não forem corretamente trabalhados no processo de extração, as informações geradas através deles farão com que decisões sejam tomadas erroneamente , podendo afetar diretamente os negócios da organização.

142
Q

A maior parte do esforço exigido no desenvolvimento de um DW é consumido no momento do:

A

processo de ETL.

143
Q

__% do Processo de ETL é só com a Extração.

A

60% do Processo de ETL é só com a Extração.
Dados podem estar distribuídos em dezenas de lugares, tecnologias ou plataformas diferentes necessitando de formas de extração distintas para cada local.

144
Q

No momento da criação de um DW, é comum realizar uma carga de dados inicial, mas com o decorrer do tempo a extração deve estar preparada apenas para fazer cargas:

A

incrementais.

145
Q

No momento da criação de um DW, é comum realizar uma carga de dados inicial, mas com o decorrer do tempo a extração deve estar preparada apenas para fazer cargas incrementais. Essa carga incremental é muito mais _________, visto que carrega apenas os dados que foram inseridos desde a carga inicial. Para onde vão esses dados que foram extraídos, mas ainda não foram transformados e carregados no Data Warehouse?

A

eles vão para um local chamado Stage Area!

146
Q

Os dados devem estar padronizados, consistentes e uniformizados antes de serem carregados no Data Warehouse! Para tal, eles precisam ser limpos, entre outras atividades. Isso tudo ocorre na _____ ____, portanto ela é basicamente uma localização __________ de onde os dados de diversas fontes de origem são ________.

A

Os dados devem estar padronizados, consistentes e uniformizados antes de serem carregados no Data Warehouse! Para tal, eles precisam ser limpos, entre outras atividades. Isso tudo ocorre na stage area, portanto ela é basicamente uma localização temporária de onde os dados de diversas fontes de origem são copiados.

147
Q

Quando se copia e cola algo em um sistema operacional, o que você copiou vai para um local chamada:

A

Área de Transferência!

148
Q

A transformação dos dados é a fase ___________ à extração. Esta fase não só transforma os dados, mas também realiza a _______ dos mesmos.

A

A transformação dos dados é a fase subsequente à extração. Esta fase não só transforma os dados, mas também realiza a limpeza dos mesmos.
ex: correção de erros de digitação, a descoberta de violações de integridade, a substituição de caracteres desconhecidos, a padronização de abreviações podem ser exemplos dessa limpeza.

149
Q

A fase de carga consiste no carregamento dos dados para seu _______ _____.

A

A fase de carga consiste no carregamento dos dados para seu destino final.

150
Q

ELT é uma ________ da ordem das etapas. Em vez de fazermos (1) Extração, depois (2) Transformação e só depois a (3) Carga, fazemos a:

A

(1) Extração, depois a (2) Carga e só depois a (3) Transformação dos dados
CUIDADO PARA NÃO CONFUNDIR AS SIGLAS ELT E ETL!!!!

151
Q

CERTO OU ERRADO:

A diferença dos processos de ETL e ELT, por além de serem diferentes e com ordens diferentes, é que solucionam também problemas diferentes.

A

ERRADO! Eles são diferentes e ordens diferentes mas solucionam o MESMO PROBLEMA.

152
Q

PARA FIXAR

A
153
Q

O ELT é um processo mais ágil para o _____________ e o _____________ de dados, visto _______ a ordem das etapas de transformação de dados da abordagem tradicional de ETL.

A

O ELT é um processo mais ágil para o carregamento e processamento de dados, visto inverte a ordem das etapas de transformação de dados da abordagem tradicional de ETL.
Com a irversão, é possível transformar dados brutos em dados modelados dentro de um Data Warehouse.

154
Q

A simples inversão de ETL para ELT de etapas reduz consideravelmente o tempo de ____________ de dados, permitindo que a transformação de dados seja feita por analistas de dados ______, sem a dependência de profissionais altamente ________ como _______________ e _____________ de dados.

A

A simples inversão de ETL para ELT de etapas reduz consideravelmente o tempo de carregamento de dados, permitindo que a transformação de dados seja feita por analistas de dados comuns, sem a dependência de profissionais altamente técnicos como desenvolvedores e engenheiros de dados.

155
Q

Na prática, os engenheiros de dados se focam apenas nas etapas de ________ e ______________, atribuições características de sua área de atuação.

A

Na prática, os engenheiros de dados se focam apenas nas etapas de extração e carregamento, atribuições características de sua área de atuação.

156
Q

Com a inversão dos processos de ETL para ELT a responsabilidade da transformação de dados fica nas mãos de profissionais ________ à empresa que conhecem as regras de negócio, como _________ e __________ de dados, trazendo benefícios como: menor tempo gasto entre extração e transformação de dados; maior
eficiência na _____________ __ ________; menor dependência de _____________ _________ _________; e independência dos analistas para o ________ de dados ______.

A

Com a inversão dos processos de ETL para ELT a responsabilidade da transformação de dados fica nas mãos de profissionais próximos à empresa que conhecem as regras de negócio, como analistas e cientistas de dados, trazendo benefícios como: menor tempo gasto entre extração e transformação de dados; maior
eficiência na implementação de projetos; menor dependência de profissionais altamente técnicos; e independência dos analistas para o manuseio de dados brutos.

157
Q

Com as operações modernas, as empresas têm optado pelo ETL ou ELT?

A

ELT!

158
Q

O ELT permite analisar grandes volumes de dados de forma ______, com menos ___________ e ______ de recursos, além de possibilitar uma maior ____________ entre equipes de negócio e profissionais técnicos.

A

O ELT permite analisar grandes volumes de dados de forma rápida, com menos manutenção e gastos de recursos, além de possibilitar uma maior colaboração entre equipes de negócio e profissionais técnicos.

159
Q

O ELT é um processo mais ________, exigindo mais esforços nos quesitos de ______ e _______________ do que o ETL.

A

O ELT é um processo mais complexo, exigindo mais esforços nos quesitos de design e infraestrutura do que o ETL.

160
Q

O tempo de carregamento do ETL é mais _____, isto é, o uso de sistemas distintos implica uma maior ______/________ para o carregamento de
dados.

A

O tempo de carregamento do ETL é mais lento, isto é, o uso de sistemas distintos implica uma maior demora/latência para o carregamento de
dados.

161
Q

O tempo de carregamento do ELT é mais ______, isto é, o uso de um sistema de carregamento integrado implica uma menor ______/________ para o carregamento de dados.

A

O tempo de carregamento do ELT é mais rápido, isto é, o uso de um sistema de carregamento integrado implica uma menor demora/latência para o carregamento de dados.

162
Q

No ETL, o tempo de transformação dos dados possui uma ______ considerável, particularmente na transformação de _______ _______ de dados. Além disso, à medida que os volumes crescem, o tempo de transformação
_______.

A

No ETL, o tempo de transformação dos dados possui uma demora considerável, particularmente na transformação de grandes volumes de dados. Além disso, à medida que os volumes crescem, o tempo de transformação
aumenta.

163
Q

No ELT, o tempo de transformação de dados é feita de maneira _________, visto que sua velocidade independe do _______ ou da ____________ dos dados – graças às tecnologias de infraestrutura na _____.

A

No ELT, o tempo de transformação de dados é feita de maneira integrada, visto que sua velocidade independe do tamanho ou da complexidade dos dados – graças às tecnologias de infraestrutura na nuvem.

164
Q

O ETL possui os custos de manutenção _____, dado que a atualização do repositório de dados requer o trabalho recorrente de profissionais _____ e ________ no mercado, como ____________ __ _____ e _______________.

A

O ETL possui os custos de manutenção altos, dado que a atualização do repositório de dados requer o trabalho recorrente de profissionais caros e escassos no mercado, como engenheiro de dados e desenvolvedores.

165
Q

O ELT possui os custos de manutenção ______ pois os dados estão sempre disponíveis e acessíveis para _____ sem a necessidade de _____________ ____________ ______________.

A

O ELT possui os custos de manutenção baixos pois os dados estão sempre disponíveis e acessíveis para todos sem a necessidade de profissionais extremamente caros.

166
Q

No ETL, o processo de implementação requer menos conhecimento aprofundado de _______ e ___________ do repositório de dados.

A

No ETL, o processo de implementação requer menos conhecimento aprofundado de projeto e arquitetura do repositório de dados.
ou seja, possui a complexidade de implementação baixa

167
Q

No ELT, o processo de implementação requer conhecimento profundo de ___________ _________ de ______ e uma arquitetura ___ ____________ do repositório de dados.

A

No ELT, o processo de implementação requer conhecimento profundo de ferramentas avançadas de análise e uma arquitetura bem estruturada do repositório de dados.
ou seja, possui uma grande complexidade de implementação

168
Q

Limitação de Dados

No ETL, os dados devem ser selecionados a ______, ou seja, o que não for selecionado é _______.

A

No ETL, os dados devem ser selecionados a priori, ou seja, o que não for selecionado é perdido.

169
Q

Limitação de Dados

No ELT, os dados brutos ficam ___________, por isso a retenção de dados depende apenas da ________ de retenção eleita pela ________ de dados.

A

Limitação de Dados

No ELT, os dados brutos ficam disponíveis, por isso a retenção de dados depende apenas da política de retenção eleita pela operação de dados.

170
Q

O ETL foi desenvolvido para dar suporte a
banco de dados ___________, ______ e ________ _______.

A

O ETL foi desenvolvido para dar suporte a
banco de dados relacionais, locais e sistemas legados.

171
Q

O ELT foi construído para suportar _______ _______ e ________ fontes de dados, ____________ e ___ ____________, de forma _________ em infraestruturas de nuvem.

A

O ELT foi construído para suportar grandes volumes e diversas fontes de dados, estruturadas e não estruturadas, de forma escalável em infraestruturas de nuvem.

172
Q

O ETL pode ser usado em:

A

Tabelas fixas, cronogramas fixos, predominantemente utilizados por profissionais técnicos de TI, desenvolvedores e engenheiros de dados.

173
Q

O ELT pode ser usado em:

A

Ad hoc, abordagem escalável, flexível e colaborativa, utilizável tanto por profissionais técnicos quanto pelo usuário final de negócio.

174
Q

O custo benefícios do ETL não é muito _________, pois possui uma abordagem não _________, especialmente para empresas de _______ e _____ portes.

A

O custo benefício do ETL não é muito vantajosa, pois possui uma abordagem não econômica, especialmente para empresas de pequeno e médio portes.

175
Q

No ELT, o custo-benefício é mais _________ por ser _________, __________ e _________ para negócios de todos os tamanhos, é uma solução muito mais ______, _________ e _______.

A

No ELT, o custo-benefício é mais vantajoso por ser escalável, adaptável e acessível para negócios de todos os tamanhos, é uma solução muito mais viável, econômica e moderna.

176
Q

O ETL é mais adequado para o armazenamento de dados _________ e _____________, dado que permite a transformação _____ da carga

A

O ETL é mais adequado para o armazenamento de dados sensíveis e confidenciais, dado que permite a transformação antes da carga
Ex: anonimização dos dados

177
Q

O ELT é menos adequado para o _____________ de dados sensíveis e confidenciais, dado que a transformação ocorre somente ____ a carga.

A

O ELT é menos adequado para o armazenamento de dados sensíveis e confidenciais, dado que a transformação ocorre somente após a carga.

178
Q

O ETL é comumente utilizado em:

A

Armazém de Dados (Data Warehouses).

179
Q

O ELT é comumente utilizado em:

A

Lagos de Dados (Data Lakes).

180
Q

O Data Lake é ótimo para realizar análises
de:

A

Machine Learning/Deep Learning, Data Discovery e Análises Preditivas;

181
Q

O Data Warehouse é bastante útil para análises de:

A

Business Intelligence, Visualização de Dados, Criação de Relatórios e Análises Transacionais.

182
Q

CERTO OU ERRADO:

O processo ETL é uma etapa importante no projeto de um Data Warehouse. No processo ETL, somente é possível realizar a carga periódica de dados no data warehouse uma vez a cada semana.

A

ERRADO! Isso não existe! Quem a periodicidade da carga de dados é a organização.

183
Q

CERTO OU ERRADO:

O processo ETL é uma etapa importante no projeto de um Data Warehouse. No processo ETL, um intervalo possível para a carga periódica de dados no data warehouse é de 24 horas.

A

CERTO! O intervalo pode ser o que a organização achar adequado e 24 horas é um período possível.

184
Q

Quem decide a periodicidade da carga de dados no processo de ETL é a:

A

organização.