Arboles Flashcards
Que son los arboles de decision?
Permiten clasificar, realizar predicciones y en algunos casos estimaciones.
En base a un set de entrenamiento el modelo clasifica los dato sen una de varias clases definidas
En arboles de decision. Que es el set de entrenamiento y el set de reglas?
El set de entrenamiento es un conjunto de registros que se encuentran pre-clasificados y a partir de entrenar el modelo con estos registros se construye el arbol.
Set de reglas: cada camino desde la raíz hasta un nodo es único y constituye una regla.
Cuales son algunos de los algoritmos que implementan los arboles?
CART: Clasification And Regressio tree. Provee un conjunto de reglas que se pueden aplicar a un nuevo conjunto de datos sin clasificar para predecir cuales registros daran cierto resultado. Requiere menos preparacion de los datos que CHAID.
CHAID: Crea multiples dimensiones y requiere mas preparacion de los datos.
C4.5: Produce arboles con n variable de rama por noto.
ID3
Que tipo de medidas tienen los arboles de decision?
Que es el prunning?
Medidas por nodo: numero de registros entrantes
Medidas por hojas: porcentaje de error
Peso: probabilidad de que un nuevo dato termine en ese nodo.
Medidas del arbol: procentaje de error, sumatoria del error de cada hoja multiplicado por su peso.
Prunning: es una técnica para eliminar ramas del árbol con bajo poder predictivo (que no hace decrecer el procentaje de error del arbol).
Cuales son las ventajas y desventajas de los arboles de decision?
Ventajas:
* Generan reglas entendibles
* Clasifican con consumos bajos de recursos
* Manejan datos continuos y categoricos
Desventajas:
* Inapropiado para estimar valores continuos
* Problematico para series temporales
* Generan muchos errores si se utilizan pocos datos de entrenamiento.