Clase 6 - Evaluación de modelos predictivos Flashcards
Clasificador por defecto
Predice siempre la moda (clase mayoritaria) o la media en los ejemplos de entrenamiento.
Clasificador aleatorio
Predice aleatoriamente siguiendo una distribución de probabilidad definida por la variable de salida.
Conjunto de datos no balanceados (clasificador por defecto es una buena comparación en este tipo de situaciones)
Cuando una clase predomina mucho respecto a otra.
División de los datos en conjunto de entrenamiento y conjunto de prueba. (división en split).
Entrenamiento: se usa para generar el modelo.
Prueba: para evaluar la calidad del modelo.
Conjunto de aplicación (no se conoce el valor de las instancias).
Matriz de confusión.
- Precisión: aciertos totales (TP+TN)/(P+N)
- Precisión de clase:
TP/(TP+TN) - Sensibilidad: TP/P
- Especificidad: TN/N
- 1-Specifity: FP/N
Curva ROC (ajuste de clasificadores binarios)
Devuelven confianza de pertenecer a una clase.
Overfitting
- Describe bien las instancias de entrenamiento, pero no el conjunto de prueba.
Técnicas de valoración cruzada.
Validación cruzada k-veces.
División del conjunto de datos en k partes iguales.