Tema3 Flashcards

Question 1

Q

¿Cuál es la función principal del algoritmo de regresión lineal OLS?

Answer

A

Encontrar una combinación lineal de atributos que minimice el error cuadrático medio (MSE).

Question 2

Q

¿Cómo se interpreta el coeficiente w_1 en un modelo de regresión lineal simple?

Answer

A

Representa la pendiente de la recta, indicando el cambio en y por cada unidad de cambio en x.

Question 3

Q

¿Qué representa el coeficiente de determinación R^2 en regresión lineal?

Answer

A

Indica qué porcentaje de la variabilidad de la variable dependiente es explicado por el modelo.

Question 4

Q

¿Por qué es importante la tasa de aprendizaje en el descenso de gradiente?

Answer

A

Controla la magnitud de los cambios en los coeficientes para minimizar la función de costo.

Question 5

Q

¿Qué problemas pueden surgir si los atributos en regresión lineal no son independientes?

Answer

A

Puede producirse multicolinealidad, afectando la interpretabilidad y estabilidad del modelo.

Question 6

Q

¿Cómo afecta la normalización de los datos a KNN?

Answer

A

Mejora la precisión evitando que atributos con escalas mayores dominen el cálculo de distancias.

Question 7

Q

¿Cómo se seleccionan los vecinos más cercanos en KNN?

Answer

A

Se eligen en función de la menor distancia según una métrica definida, como Minkowski o Euclídea.

Question 8

Q

¿Por qué la selección de atributos es crucial en KNN?

Answer

A

Reduce la dimensionalidad del problema y mejora la eficiencia y precisión del modelo.

Question 9

Q

¿El algoritmo OLS minimiza la suma de errores absolutos? (Sí/No)

Answer

A

No, minimiza la suma de los errores al cuadrado.

Question 10

Q

¿El valor de R^2 puede ser negativo? (Sí/No)

Answer

A

Sí, indica que el modelo es peor que la predicción por media.

Question 11

Q

¿El descenso de gradiente garantiza encontrar el óptimo global en todos los casos? (Sí/No)

Answer

A

No, en problemas no convexos puede quedar atrapado en mínimos locales.

Question 12

Q

¿El modelo KNN requiere un proceso de entrenamiento complejo? (Sí/No)

Answer

A

No, solo almacena los datos de entrenamiento.

Question 13

Q

¿Un mayor valor de k en KNN siempre mejora la precisión? (Sí/No)

Answer

A

No, puede suavizar demasiado la predicción y perder precisión.

Question 14

Q

¿Qué función de distancia se usa más comúnmente en KNN?

Answer

A

La distancia Euclídea.

Question 15

Q

¿El modelo de regresión lineal es adecuado para datos con relaciones no lineales? (Sí/No)

Answer

A

No, suposiciones de linealidad limitan su eficacia en esos casos.

Question 16

Q

¿El algoritmo KNN puede utilizar pesos en la distancia para mejorar la precisión? (Sí/No)

Answer

A

Sí, los pesos pueden ajustar la influencia de cada vecino.

Question 17

Q

La función objetivo en OLS es minimizar el ____ de los errores.

Answer

A

cuadrado.

Question 18

Q

La tasa de aprendizaje en descenso de gradiente controla el ____ de los pasos en cada iteración.

Question 19

Q

En regresión lineal, el término w_0 representa la ____ de la recta.

Answer

A

intersección.

Question 20

Q

Si R^2=1, significa que el modelo tiene una ____ perfecta.

Answer

A

predicción.

Question 21

Q

KNN determina la clase o valor de una instancia basándose en sus ____ más cercanos.

Question 22

Q

La distancia de Minkowski se convierte en distancia Euclídea cuando p es ____.

Question 23

Q

La selección de atributos en regresión lineal evita el problema de la ____.

Answer

A

multicolinealidad.

Question 24

Q

En KNN, la normalización de los datos es crucial para evitar ____ de ciertos atributos.

Answer

A

dominancia.

Question 25

Q

¿Qué métrica de evaluación NO es usada en regresión lineal?
A) MSE
B) MAE
C) Precisión

Answer

A

C) Precisión

Question 26

Q

¿Cuál de las siguientes es una desventaja de KNN?
A) No requiere entrenamiento
B) Puede ser lento en predicción
C) No utiliza funciones de distancia

Answer

A

B) Puede ser lento en predicción

Question 27

Q

¿Cuál es la principal suposición de la regresión lineal?
A) No hay correlación entre atributos
B) La distribución de datos es binaria
C) No existen valores atípicos

Answer

A

A) No hay correlación entre atributos

Question 28

Q

¿Qué técnica se usa para reducir el sobreajuste en regresión lineal?
A) Aumento del conjunto de datos
B) Regularización (Ridge/Lasso)
C) Incrementar la tasa de aprendizaje

Answer

A

B) Regularización (Ridge/Lasso)

Question 29

Q

¿Qué significa que un modelo tenga un R^2 negativo?
A) El modelo predice perfectamente
B) Es peor que predecir usando la media
C) No puede ser interpretado

Answer

A

B) Es peor que predecir usando la media

Question 30

Q

¿Qué factor afecta más la eficacia de KNN?
A) La normalización de los datos
B) El número de instancias
C) El número de atributos

Answer

A

A) La normalización de los datos

Question 31

Q

¿Qué problema surge al usar atributos con diferentes escalas en KNN?
A) Cálculo erróneo de la distancia
B) Mayor velocidad de predicción
C) Eliminación de atributos

Answer

A

A) Cálculo erróneo de la distancia

Question 32

Q

¿Qué método usa KNN para determinar la predicción en regresión?
A) Media de los vecinos
B) Moda de los vecinos
C) Mediana de los vecinos

Answer

A

A) Media de los vecinos

Question 33

Q

Describe el proceso de entrenamiento en regresión lineal OLS.

Answer

A

Se busca minimizar el error cuadrático medio (MSE) ajustando los coeficientes mediante descenso de gradiente o solución analítica.

Question 34

Q

¿Cómo afecta la multicolinealidad a la regresión lineal?

Answer

A

Provoca inestabilidad en los coeficientes y dificulta la interpretación del modelo.

Question 35

Q

¿Qué representa la tasa de aprendizaje en descenso de gradiente?

Answer

A

Controla el tamaño de los pasos que da el algoritmo al ajustar los coeficientes para minimizar la función de costo.

Question 36

Q

Explica la diferencia entre regresión lineal simple y múltiple.

Answer

A

La regresión simple usa un solo atributo como predictor, mientras que la múltiple utiliza varios atributos para predecir la variable dependiente.

Question 37

Q

¿Qué representa la línea de referencia en la gráfica de evaluación de regresión?

Answer

A

La línea x=y indica el punto ideal donde la predicción es igual al valor real.

Question 38

Q

¿Cuál es el propósito de la normalización en KNN?

Answer

A

Igualar la escala de los atributos para evitar que unos influyan más que otros en el cálculo de distancias.

Question 39

Q

¿Cómo se determina el número óptimo de vecinos k en KNN?

Answer

A

Se selecciona probando distintos valores y evaluando la métrica de error en validación cruzada.

Question 40

Q

¿Por qué la distancia Euclídea es la más utilizada en KNN?

Answer

A

Porque es intuitiva y mide la similitud entre puntos en un espacio multidimensional.

Question 41

Q

Explica por qué el descenso de gradiente es útil en regresión lineal.

Answer

A

Permite encontrar los coeficientes óptimos ajustando iterativamente los pesos para minimizar el error.

Question 42

Q

¿Cómo se interpreta un R^2 cercano a 1 y a 0 en regresión?

Answer

A

Un R^2 cercano a 1 indica que el modelo explica bien la variabilidad, mientras que un R^2 cercano a 0 indica baja capacidad predictiva.

Question 43

Q

¿Por qué KNN no tiene un proceso de entrenamiento tradicional?

Answer

A

Porque simplemente almacena los datos y calcula distancias en la fase de predicción.

Question 44

Q

Explica cómo la selección de atributos mejora KNN.

Answer

A

Reduce la dimensionalidad, eliminando atributos irrelevantes que pueden agregar ruido y disminuir la precisión.

Question 45

Q

¿Cómo afecta el número de vecinos k al sesgo y la varianza en KNN?

Answer

A

Un k pequeño genera alta varianza y bajo sesgo, mientras que un k grande genera bajo sesgo y alta varianza.

Question 46

Q

¿Cómo influye la homocedasticidad en la regresión lineal?

Answer

A

Permite que los errores del modelo sean constantes y no dependan de los valores de los atributos.

Question 47

Q

Explica la diferencia entre sobreajuste y subajuste en KNN.

Answer

A

Un k muy bajo causa sobreajuste, adaptándose demasiado a los datos de entrenamiento, mientras que un k muy alto causa subajuste, generando predicciones imprecisas.

Question 48

Q

¿Cómo mejora el uso de ponderaciones en los vecinos más cercanos?

Answer

A

Asigna mayor influencia a vecinos más cercanos, mejorando la precisión en problemas donde la distancia es un factor crítico.