Aprendizaje Estadístico Flashcards
Qué es el algoritmo de aprendizaje?
son las reglas que le
permiten a la máquina de aprendizaje llevar a cabo sus tareas
qué son las variables de entrada?
Caracteríasticas o predictores
qué son las variables de salida y cómo se denominan?
se denominan etiquetas y son asignadas a los ejemplos (observaciones) como valores numéricos (regresión) o categorías (clasificación)
Para que se usa la muestra de validación?
se usa para ajustar los parámetros del algoritmo de aprendizaje
para que se usa la muestra de prueba?
se usa para evaluar el desempeño del algoritmo de aprendizaje
para que se usa la función de pérdida?
para determinar la diferencia o pérdida
qué es un hiperparámetro?
es un parámetro que se usa para controlar el proceso de aprendizaje
Para qué se usa la muestra de entrenamiento?
para estimar parámetros
tipos de muestras:
validación, prueba, entrenamiento
sabemos que La máquina de aprendizaje, 𝑓, relaciona la respuesta 𝑌 con los
predictores 𝑋 = 𝑋1⋯ 𝑋𝑛 Donde 𝜖 es un término de error con media cero e independiente de
𝑋, en este contexto 𝑓 representa la parte sistemática. Por qué se le denomina BLACKBOX a esta máquina?
porque en general no interesa su
forma funcional solo las estimaciones que de ella salen
de qué depende la precisión de la predicción?
del error reducible (variables no obsevadas o medibles) e irreducible (función inadecuada)
a qué es igual el error esperado de la estimación?
E[ f(x) - f^(x)]^2 + var(e)
cuál es el objetivo de el machine learning?
Se busca aplicar un método de aprendizaje estadístico a la muestra
de entrenamiento para estimar la máquina de aprendizaje 𝑓.
tipod de métodos de aprendizaje estadístico
paramétricos y no paramétricos
Métodos paramétricos
asume una forma funcional para la máquina de aprendizaje. Una vez se haya decidido el modelo se busca un
procedimiento para ajustar o entrenar el modelo, esto se traduce en estimar
los parámetros del modelo
Método no paramétrico
no asumen una forma funcional para la
máquina de aprendizaje, en su lugar la estiman para que se acerque a los
datos.
cuáles son las modalidades de aprendizaje?
supervisado (los datos de la muestra están etiquetados), no supervisado, semisupervisado (algunos estan etiquetados), reforzado, activo
Diferencia entre aprendizaje reforzado y activo?
En el apredizaje reforzado la fase de entrenamiento y prueba se mezclan, el aprendiz interactúa con el medio y recibe una
recompensa inmediata por esta acción, el objetivo es maximizar la
recompensa en el curso de las interacciones
Por otro lado, el aprendizaje activo el aprendiz recoge muestras de
entrenamiento adaptativamente preguntándole a un oráculo para
obtener las etiquetas de nuevos puntos.
tipos de problemas
de regresion o de clasificación
Qué medida se evalua a la hora de encontrar el mejor modelo?
el error cuadrático medio
para evaluar el modelo se busca el mse calculado sobre cuales datos?? de prueba o de entrenamiento?
de prueba
A medida que el nivel de flexibilidad del modelo aumenta
disminuye el error pero aumenta la varianza
El nivel de flexibilidad se mide por
los grados de libertad del modelo
Cuál es el mínimo MSE de prueba?
var(e)