Módulo 4 - Ciência de Dados Flashcards
CRISP-DM Gestão de Projetos de Ciência de Dados
O que é o CRISP-DM
É uma metodologia de conduçãod de projetos que envolvam dados e geração de conhecimento.
CRISP-DM Gestão de Projetos de Ciência de Dados
Quais são as etapas do CRISP-DM?
- Entendimento
- Preparação
- Desenvolvimento
- Implantação
Modelos de Ciência de Dados
O que é um modelo?
É uma simplificação da realidade que considera apenas os aspectos mais importantes do objeto de interesse de forma permitir que algo seja analisado entendido ou generalizado.
Modelos de Ciência de Dados
Em ciencia de dados, quais são os 2 ingredientes que combinados, são a base de um modelo?
- Dados
- Instruções (Receita ou algoritmo)
Agrupamento
O que é a técnica do agrupamento?
é a técnica que nos possibilita trabalhar com grupos de dados similares, que por sua vez, são diferentes de outros grupos de dados. Revelando padrões não necessariamente intuítivos a partir de:
1. Usar muitas variáveis disponíveis.
2. Garantir que as decisões sejam pautadas em dados.
Regressão
O que é regressão?
Regressão é uma técnica que permite regredir o valor de um conjunto de variáveis a média dos valores. Isso permite criar uma estatística descritiva e prescritiva dos dados.
Classificação
O que um modelo de classificação?
Um modelo de classificação permite (como próprio nome já diz) a classificação de objetos de acordo com suas similaridades.
Ex: Spam de e-mail, Recomendação Netflix.
Classificação
O que é a target?
Tradução do objetivo em um rótulo ou frase
Classificação
O que são features?
Direcionamento sobre as informações que vão direcionar o atingimento do target.
Séries Temporais
O que é uma série temporal?
É um conjunto de observação que rastreia um comportamento de uma amostra ao longo do tempo.
Series temporais
Quais são as vantagens de usar técnicas de série temporais?
- Formular problemas temporalmente
- Fazer previsão de valores futuros.
- Garantir que as decisões sejam pautadas nos dados.
Testes AB
O que são teste AB?
São testes que segmentam amostras de testes para avaliar a obtenção desses resultados em toda a população. Obviamente, ambas amostras devem ser representativa.
Avaliação de Modelos
Quais são os passos para avaliar um modelo corretamente?
- Separa os dados em amostra de treino e de teste
- Retro alimentar o modelo para que ele seja fidedigno a realidade.
Avaliação de Modelos
Quais são as principais métricas de avaliação de modelos utilizadas para Classificação
- Precision
- Recall
- F1 Score
- Acurácia
- AUC
- Gini
Avaliação de Modelos
Quais são as principais métricas de avaliação de modelos utilizadas para Regressão
- MAE
- RMSE
- MAPE
- R2