Aprendizaje Estadístico Flashcards

1
Q

Qué es el algoritmo de aprendizaje?

A

son las reglas que le
permiten a la máquina de aprendizaje llevar a cabo sus tareas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

qué son las variables de entrada?

A

Caracteríasticas o predictores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

qué son las variables de salida y cómo se denominan?

A

se denominan etiquetas y son asignadas a los ejemplos (observaciones) como valores numéricos (regresión) o categorías (clasificación)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Para que se usa la muestra de validación?

A

se usa para ajustar los parámetros del algoritmo de aprendizaje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

para que se usa la muestra de prueba?

A

se usa para evaluar el desempeño del algoritmo de aprendizaje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

para que se usa la función de pérdida?

A

para determinar la diferencia o pérdida

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

qué es un hiperparámetro?

A

es un parámetro que se usa para controlar el proceso de aprendizaje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Para qué se usa la muestra de entrenamiento?

A

para estimar parámetros

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

tipos de muestras:

A

validación, prueba, entrenamiento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

sabemos que La máquina de aprendizaje, 𝑓, relaciona la respuesta 𝑌 con los
predictores 𝑋 = 𝑋1⋯ 𝑋𝑛 Donde 𝜖 es un término de error con media cero e independiente de
𝑋, en este contexto 𝑓 representa la parte sistemática. Por qué se le denomina BLACKBOX a esta máquina?

A

porque en general no interesa su
forma funcional solo las estimaciones que de ella salen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

de qué depende la precisión de la predicción?

A

del error reducible (variables no obsevadas o medibles) e irreducible (función inadecuada)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

a qué es igual el error esperado de la estimación?

A

E[ f(x) - f^(x)]^2 + var(e)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

cuál es el objetivo de el machine learning?

A

Se busca aplicar un método de aprendizaje estadístico a la muestra
de entrenamiento para estimar la máquina de aprendizaje 𝑓.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

tipod de métodos de aprendizaje estadístico

A

paramétricos y no paramétricos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Métodos paramétricos

A

asume una forma funcional para la máquina de aprendizaje. Una vez se haya decidido el modelo se busca un
procedimiento para ajustar o entrenar el modelo, esto se traduce en estimar
los parámetros del modelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Método no paramétrico

A

no asumen una forma funcional para la
máquina de aprendizaje, en su lugar la estiman para que se acerque a los
datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

cuáles son las modalidades de aprendizaje?

A

supervisado (los datos de la muestra están etiquetados), no supervisado, semisupervisado (algunos estan etiquetados), reforzado, activo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Diferencia entre aprendizaje reforzado y activo?

A

En el apredizaje reforzado la fase de entrenamiento y prueba se mezclan, el aprendiz interactúa con el medio y recibe una
recompensa inmediata por esta acción, el objetivo es maximizar la
recompensa en el curso de las interacciones

Por otro lado, el aprendizaje activo el aprendiz recoge muestras de
entrenamiento adaptativamente preguntándole a un oráculo para
obtener las etiquetas de nuevos puntos.

19
Q

tipos de problemas

A

de regresion o de clasificación

20
Q

Qué medida se evalua a la hora de encontrar el mejor modelo?

A

el error cuadrático medio

21
Q

para evaluar el modelo se busca el mse calculado sobre cuales datos?? de prueba o de entrenamiento?

A

de prueba

22
Q

A medida que el nivel de flexibilidad del modelo aumenta

A

disminuye el error pero aumenta la varianza

23
Q

El nivel de flexibilidad se mide por

A

los grados de libertad del modelo

24
Q

Cuál es el mínimo MSE de prueba?

A

var(e)

25
Q

Cuando el MSE de entrenamiento es bajo y el de prueba es alto se
dice que los datos se

A

sobre-ajustaron, overfitting

26
Q

cuales modelos causan overfitting?

A

los flexibles

27
Q

qué es cross validation?

A

El MSE de prueba se puede estimar a partir del MSE de entrenamiento

27
Q

El MSE de prueba esperado se puede descomponer en la suma de
tres cantidades

A

la varianza de f estimado, el sesgo al cuadradi de f estimado, y la varianza de e

27
Q

Cómo se puede minimizar el MSE?

A

escoger un método de
aprendizaje estadístico de baja varianza y bajo sesgo

28
Q

Cómo se calcula el MSE de prueba esperado?

A

hay dos formas, o estimando f varias veces con los datos de entrenamiento y aplicandolo en un valor x en el conjunto de prueba, o sacando el promedio del error cuadrático sobre todos los valores de x en el conjunto de prueba

29
Q

Qué curvas van a generarte más varianza?

A

flexibles

30
Q

Qué curvas van a generar mayor sesgo?

A

las inflexibles

31
Q

Cómo se conoce la relación entre sesgo, varianza y MSE del conjunto de prueba?

A

compromiso, trade-off, sesgo varianza

32
Q

Si las etiquetas son cualitativas que se usa para medir la precisión del f estimado?

A

la tasa de error de entrenamiento

33
Q

qué es la tasa de error de entrenamiento?

A

es una proporción de errores cometidos al aplicar f estimado a las observaciones de entrenamiento

34
Q

en las etiquetas cualitativas, que es I?

A

es la función indicador, que es igual a 1 si 𝑦𝑖 ≠ ො
𝑦𝑖 y 0 si son
iguales, es decir que la observación se clasificó correctamente.

35
Q

En qué consiste cross validation?

A

en partir aleatoriamente los datos de una
muestra entre 𝑛 submuestras de igual tamaño. Para cada 𝑖 ∈
1,

, 𝑛 el algoritmo se entrena con todas las muestras menos las
del subgrupo 𝑖 −ésimo.

36
Q

Un caso especial de cross validation es : leave one out
cross-validation LOOCV.

A

es cuando el número de grupos
es igual al número de datos

37
Q

Para qué es útil usar cross validation?

A

para determinar el desempeño esperado de una metodología de aprendizaje
estadístico en datos independientes y asimismo determinar el minimizador de la curva del MSE de prueba estimado, para
identificar el mejor método de aprendizaje estadístico o la mejor flexibilidad.

38
Q

qué es bootstraping?

A

permite la obtención de nuevos conjuntos de
muestras a partir de la muestra original. (se realiza con reemplazo)

39
Q

cual presenta menos sesgo, loocv o cross validation?

A

Loocv

40
Q

cuál da valores mas precisos para el MSE, LOOCV o cross validation ?

A

cross validation

41
Q

cual presenta menos varianza, loocv o cross validation?

A

cross validation