Módulo 4 - Ciência de Dados Flashcards

1
Q

CRISP-DM Gestão de Projetos de Ciência de Dados

O que é o CRISP-DM

A

É uma metodologia de conduçãod de projetos que envolvam dados e geração de conhecimento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

CRISP-DM Gestão de Projetos de Ciência de Dados

Quais são as etapas do CRISP-DM?

A
  1. Entendimento
  2. Preparação
  3. Desenvolvimento
  4. Implantação
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Modelos de Ciência de Dados

O que é um modelo?

A

É uma simplificação da realidade que considera apenas os aspectos mais importantes do objeto de interesse de forma permitir que algo seja analisado entendido ou generalizado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Modelos de Ciência de Dados

Em ciencia de dados, quais são os 2 ingredientes que combinados, são a base de um modelo?

A
  1. Dados
  2. Instruções (Receita ou algoritmo)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Agrupamento

O que é a técnica do agrupamento?

A

é a técnica que nos possibilita trabalhar com grupos de dados similares, que por sua vez, são diferentes de outros grupos de dados. Revelando padrões não necessariamente intuítivos a partir de:
1. Usar muitas variáveis disponíveis.
2. Garantir que as decisões sejam pautadas em dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Regressão

O que é regressão?

A

Regressão é uma técnica que permite regredir o valor de um conjunto de variáveis a média dos valores. Isso permite criar uma estatística descritiva e prescritiva dos dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Classificação

O que um modelo de classificação?

A

Um modelo de classificação permite (como próprio nome já diz) a classificação de objetos de acordo com suas similaridades.

Ex: Spam de e-mail, Recomendação Netflix.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Classificação

O que é a target?

A

Tradução do objetivo em um rótulo ou frase

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Classificação

O que são features?

A

Direcionamento sobre as informações que vão direcionar o atingimento do target.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Séries Temporais

O que é uma série temporal?

A

É um conjunto de observação que rastreia um comportamento de uma amostra ao longo do tempo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Series temporais

Quais são as vantagens de usar técnicas de série temporais?

A
  1. Formular problemas temporalmente
  2. Fazer previsão de valores futuros.
  3. Garantir que as decisões sejam pautadas nos dados.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Testes AB

O que são teste AB?

A

São testes que segmentam amostras de testes para avaliar a obtenção desses resultados em toda a população. Obviamente, ambas amostras devem ser representativa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Avaliação de Modelos

Quais são os passos para avaliar um modelo corretamente?

A
  1. Separa os dados em amostra de treino e de teste
  2. Retro alimentar o modelo para que ele seja fidedigno a realidade.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Avaliação de Modelos

Quais são as principais métricas de avaliação de modelos utilizadas para Classificação

A
  1. Precision
  2. Recall
  3. F1 Score
  4. Acurácia
  5. AUC
  6. Gini
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Avaliação de Modelos

Quais são as principais métricas de avaliação de modelos utilizadas para Regressão

A
  1. MAE
  2. RMSE
  3. MAPE
  4. R2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Avaliação de Modelos

O que fazer quando não temos um target real para comparar o target predito?

A

Não é possível avaliar o modelo. Para modelos que se baseiam em agrupamento nessa situação ainda cabe:
1. A análise qualitativa de cada Cluster
2. Estrutura dos clusters (avaliando as diferenças dos clusters)