Regresion Flashcards

1
Q

¿ Qué es la regularización ?, en que contexto se usa?

A

La regularización es una tecnica utilizada para prevenir el sobreajuste de los modelos entrenados con datos de entrenamiento. Esto se logra añadiendo un termino de penalización al costo o funcion de perdida durante el entrenamiento del modelo.
1. Lasso
2. Ridgeo

Se us aen el contexto de:
1. Sobreajuste
2. Colinealidad
3. Selección de características
4.Mejora de la interpretación del modelo
5.Generalización a nuevos datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿ Que regularización es usada para conocer las importancias de las features ?

A

Lasso, llevando los coeficieintes a cero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué es la regresión lineal?

A

La regresión lineal es un método estadístico que se utiliza para modelar la relación entre una variable dependiente (Y) y una o más variables independientes (X). El objetivo es encontrar la línea que mejor ajuste los datos, minimizando la suma de los errores cuadrados de las predicciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué supuestos debes verificar antes de aplicar una regresión lineal?

A

Verificar:
1. Linealidad
2. Indencia de los errores = residuos independientes entre si
3. Homoscedasticidad = Varianza debe ser igual
4. Normalidad de los errores = los residuos deben tener una distribucion normal
5. No multicolinealidad: Las variables independientes no deben estar altamente correlacionadas entre sí.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Cómo manejas la multicolinealidad en una regresión lineal?

A

La multicolinealidad puede manejarse de varias maneras, como eliminando una de las variables correlacionadas, utilizando la regresión de Ridge o Lasso, o aplicando la descomposición en componentes principales (PCA) para reducir la dimensionalidad del conjunto de datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué es el R-cuadrado y qué nos dice sobre el modelo?

A

Medida estadistica que nos dice que tan bien se ajusta el modelo a los datos. Muestra la proporcion de la vartiavilidad de la variable dependiente que es explicada por la variable independiente del modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Cómo interpretarías los coeficientes en un modelo de regresión lineal múltiple?

A

Los coeficientes representan el cambio en la variable dependiente por cada unidad de cambio en la variable independiente correspondiente, manteniendo las otras variables constantes. Es importante considerar la magnitud y el signo del coeficiente, así como su significancia estadística.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qué son los residuos ?

A

Los residuos son la diferencia entre los valores reales y los valores predichos por un modelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En terminos de Bias y variance como es en el caso de UNDERFITING?

A

Alto bias y alta variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que es la Función de Costo ?

A

Es la suma de las diferencias al cuadrado entre las predicciones y los valores reales. Estas diferencias al cuadrado son los errores cuadrados de cada predicción comparada con su valor real correspondiente. Luego, esta suma se divide por el número de muestras para obtener el promedio de estos errores cuadrados, lo que ayuda a normalizar la función de costo sobre el tamaño del conjunto de datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que es el learning rate ?

A

El learning rate en machine learning es un parámetro que determina el tamaño de los pasos que toma un algoritmo de optimización mientras ajusta los parámetros del modelo durante el entrenamiento. Esencialmente, controla cuánto cambian los parámetros del modelo en respuesta al error estimado cada vez que el modelo se actualiza. Un learning rate demasiado alto puede hacer que el modelo sobrepase el mínimo óptimo de la función de pérdida, llevando a un entrenamiento inestable o divergente. Por otro lado, un learning rate muy bajo puede resultar en un proceso de entrenamiento muy lento y posiblemente quedarse atascado antes de alcanzar el óptimo. Por lo tanto, ajustar correctamente el learning rate es crucial para lograr un entrenamiento eficaz y eficiente del modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly