Módulo 3 - Engenharia de Dados & Analytics Flashcards

1
Q

O que é Engenharia de Dados?

O que faz um engenheiro de dados?

A

É a atribuição que faz com que trabalha, processa e enriquece os dados disponibilizando a informação em um repositório acessível (Data Werehouse).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é Engenharia de Dados?

O que é um “Data Werehouse”?

A

Repositório central de dados confiável, seguro e acessivel de toda empresa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O que é Engenharia de Dados?

Como é feita a subida de informações no Data Werehouse?

A

É feita através de Data Pipelines.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que é Engenharia de Dados?

O que é um “Data Pipelines”?

A

É o processamento (extração, enriquecimento, carregamento de informação) da informação para o Data Werehouse ou Data Lake.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é Engenharia de Dados?

O que é um Data Lake?

A

Semelhante ao Data Werehouse, só que ao invés de informação tratada, ele armazena informações brutas em um repositório em núvem.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que é Engenharia de Dados?

Quantos tipos de Data Pipelines existem e quais são eles?

A

Existem dois tipos: Batch e Streaming

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que é Engenharia de Dados?

Como funciona a pipeline de batch?

A

Funciona com horários agendados, disparando uma rotina com base neste tipo agendamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que é Engenharia de Dados?

Como funciona a pipeline de streaming?

A

Funciona com base em eventos, disparando uma rotina com base neste tipo agendamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é Big Data

O que é o big data?

A

Um grande emaranhado de dados (estruturados ou não) que precisa de tratamento para ser interpretado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Engenharia de Analytics e Storytelling de Dados

O que é engenharia de analytics?

A

Especialidade que, baseado nas necessidades de negócio e utilizando as melhores práticas de engenharia software, cria e evolui produtos de dados e Analytics no contexto de Data Driven.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Engenharia de Analytics e Storytelling de Dados

O que significa a sigla SOR?

A

Source of Record - Cópia fiel dos dados que estão no sistema origem.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Engenharia de Analytics e Storytelling de Dados

O que significa SoT

A

Source of Truth - É a camada que possuí as bases tratadas do sistema origem. Pronta para ser consumida pelo Engenheiro de Analytics para gerar a camada Espec.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Data Lake, Data Mesh e Datawarehouse

O que é um Data warehouse?

A

É um armazém de dados. Indicado para o armazenamento de dados internos, onde não existe muitos fluxos de informação externa. Os dados são estruturados, processados e tratados (SoT).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Data Lake, Data Mesh e Datawarehouse

O que é um Data Lake?

A

É um lago de dados. Indicado para o armazenamento empresas que possuí fluxo de informação com meio externo. Os dados são armazenados de maneira bruta e podem ser não estruturados (SoR)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Data Lake, Data Mesh e Datawarehouse

O que é o Data Mesh?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

AWS para humanos

Quais são os quatro pilares principais da Cloud AWS?

A
  1. On-Primesses
  2. Infrastructure as a Service (Iaas)
  3. Plataform as a Service (Paas)
  4. Software as a Service (SaaS)
17
Q

Qual é definição de um sistema On-Primesses?

A

A empresa é responsável por tudo em seu ambiente local.
1. Capta recurso
2. pré-processamento
3. automatiza
4. processa
5. produto final
6. armazena em um banco de dados.

18
Q

Qual é definição de um sistema IaaS?

A

Aqui você se preocupa com os recursos de infraestrutura de outra empresa, tornando o trabalho mais fácil. As partes de captação de recurso e pré-processamento são eliminadas, restando:

  1. automatiza
  2. processa
  3. produto final
  4. armazena em um banco de dados.
19
Q

Qual é definição de um sistema PaaS?

A

Aqui você se aproveita de recursos e serviços de outra pessoa ou empresa, mais ainda do que no IaaS, reduzindo ainda mais a carga de trabalho manual. Nessa etapa existe apenas:

  1. Ingestão de dados
  2. Produto final

Pra você resta a gestão do acesso.

20
Q

Qual é definição de um sistema SaaS?

A

Modelo mais avançado de Infraestrutura. Todos os benefícios do PaaS, incluindo a gestão de acesso.