Governanca de Dados Flashcards

1
Q

Ciclo de vida

A

Fazer pergunta - questão: descritiva, exploratória, preditiva

Obter dos dados - extração, limpeza

Compreender os dados - análise exploratória dos dados

Compreender o mundo - aplicar o modelo, generalização, algoritmo, modelo estatístico

Comunicar e visualizar os resultados - storyteling, apresentar as descobertas, dashbords

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

As sete etapas

A

Problema
Etl
Ead
Modelo descrição
Avaliação do modelo
Implantação
Monitoramento e manutenção do modelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

7 etapas do ciclo de vida
Abraham musa

A

Problema
Coleta de dados
Limpeza dos dados
Processamento EAD
Modelagem e avaliação
Comunicar os resultados
Manutenção e deployment

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Riscos dos projetos

A

Dependência dos dados
Mudanças de requisitos
Mudanças de dados
Experimentação e pesquisa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Algoritimos preditivos

A

Altamente dependentes dos dados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mudanças de requisitos ou
Mudanças nos dados

A

Clientes pedem alguma mudança
Integrae em nova fonte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Mudanças de requisitos ou
Mudanças nos dados

A

Clientes pedem alguma mudança
Integrae em nova fonte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pesquisa e experimentação

A

Importante ter governança de dados

Planejar, testar em ambientes reduzidos
Clusterizavao, limpeza, outilier, buscando a solução

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Em um projeto de ciência de dados, qual das seguintes etapas é
crucial para garantir a qualidade dos dados antes de avançar para
a construção do modelo?

A

Análise Exploratória de Dados (AED)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

CRISP-DM

A

é um framework que guia as
etapas e atividades envolvidas em um
projeto de mineração de dados, desde
a compreensão inicial do problema até
a implementação e avaliação do
modelo final.
* O modelo é projetado para ser iterativo
e cíclico, permitindo ajustes contínuos
e refinamentos ao longo do projeto

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

A fase do CRISP-DM em que se dá a aplicação das técnicas de
mineração de dados propriamente ditas é denominada

A

modelagem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Etapas do CRISP DM

A

Entendimento do negócio
Entendimento dos dados
Preparação dados
Modelagem
Avaliação
Entrega e deployment

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Preparação

A

ETL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Avaliação, definição das metas do projeto

A

Na avaliação e feito para verificar se foi alcançado as metas, se está tudo ok

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cada uma das fases do CRISP DM

A

Fases
Tarefas genéricas
Tarefas especializadas
Instâncias de processos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Entendimento do negócio

A

Determinar objetivo
Conhecer a situação
Produzir um plano de um projeto

17
Q

Entendimento dos dados

A

Coletar os dados iniciais
Descrever os dados
Explorar os dados
Verificar a qualidade dos dados

18
Q

Preparação dos dados

A

Selecionar os dados
Limpar os dados
Construir os dados
Integrar os dados
Formatar os dados
Descrição da base

19
Q

Modelagem

A

Seleção as técnicas
Projeto de testes
Construção do modelo
Ajuste do modelo

20
Q

Avaliação dos modelos

A

Avaliação dos resultados
Revisao do processo
Determinar os próximos passos ou voltar as etapas

21
Q

Entrega

A

Planejar entrega
Planejar o monitoramento e a manutenção
Produzir um relatório final
Lições aprendidas

22
Q

No que se refere a modelagem dimensional, mineração de dados e
big data, julgue o item subsequente.
* No modelo CRISP-DM, a fase de preparação dos dados é
caracterizada por atividades como análise da qualidade dos dados,
exploração dos dados, geração dos primeiros insights e formulação
de hipóteses

A

ERRADO

23
Q

Com relação a noções de mineração de dados e Big Data, julgue o
item que se segue.
* Na primeira fase do CRISP-DM (cross industry standard process for
data mining), há o entendimento dos dados para que se analise a
qualidade destes

A

ERRADO

24
Q

Assinale a opção correta a respeito do CRISP-DM.
* A CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da
indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias
para a realização de um projeto de mineração de dados.
* B A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados.
* C Durante a fase de preparação dos dados, é realizado um inventário de requisitos,
suposições e restrições de recursos.
* D Na fase de avaliação dos dados, são realizadas as atividades de identificar valores
especiais dos dados e catalogar seu significado.
* E Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de
implantação de cada resultado e estimar o potencial de melhoria do processo atual

A

B

25
Q
A