APRENDIZAJE SUPERVISADO Flashcards
Aprendizaje supervisado ?
conocido como CLASIFICACIÓN o aprendizaje INDUCTIVO
Atributo de clase
es la etiqueta
OBjetivos
- produccir una función de predicción/clasificacion
- predecir etiquetas futuras
- f(x) es llamada modelo de clasificación
- Es supervisado, porque las etiquetas son dadas.
cuando es supervisado o no ?
Si se tienen la etiquetas es SUPERSIVADO si no se tienen la etiquetas es NO SUPERVISADOS
HIPOTESIS de Aprendizaje automátizado
Es que los datos de entrenamiento tienen una distribución similar a los datos de prueba, incluyendo los datos futuros.
¿Cual es el flujo completo del aprendizaje?
- Entrenamiento
- Aprendizaje
- Modelo
- Prueba
- Precisión
¿Qué es un DECISION TREE ?
Es una de las técnicas más usadas para la clasificación.
¿Cuántos tipos de nodos poseen ? Detalle cada uno
- Nodos Decisión: Son internos y especifican una pregunta con respecto a un atributo.
- Nodos Hoja: Indican una clase
¿Cómo esta construido un DECISION TREE ? (inducción) Explique
Esta construido mediante la partición de los datos, de tal forma que los subconjuntos de datos sean lo más puros posible. La pureza de un conjunto es cuando solo se posee una sola etiqueta.
¿Cómo se puede transformar un DECISION TREE en sentencias IF-THEN?
- Cada ruta de la RAIZ hasta la hoja es una regla.
- Todos los nodos de decisión a lo largo del camino forman las condiciones de la regla. El nodo hoja forma la clase.
- Para cada regla, se asocia un valor de confianza y el número de ejemplos de soporte.
Minería de reglas de Asociación
Es el intento de buscar todas las reglas que están en cierto intervalo de confiabilidad.
¿Cuál es la propiedad más importante de los DECISION TREE ?
Es que el conjunto de reglas resultantes es MUTUAMENTE EXCLUSIVO y EXHAUSTIVO. Cada caso esta cubierto por solo una regla, es decir, satisface las condiciones de la regla.
TB: es una representación mas compacto de los datos.
¿Por qué los DECISSION TREE se consideran algortimos GREEDY sin BACKTRACKING?
Una vez que sea creado un nodo de alguna partición pureza, esta no sera vuelta a revisar.
Dos funciones de Impureza
- Information Gain
- Information Gain Ratio
Relación ENTROPIA / PUREZA
Cuando la entropia toma valores pequeños, el conjunto de datos es más puro.