Tema2 Flashcards

1
Q

¿Qué es el sobreajuste en el aprendizaje supervisado?

A

El sobreajuste ocurre cuando un modelo se ajusta demasiado a los datos de entrenamiento, logrando errores de entrenamiento bajos pero errores de generalización altos.

Esto significa que el modelo no generaliza bien a nuevos datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿En qué consiste la validación cruzada?

A

La validación cruzada divide el conjunto de datos en K subconjuntos y realiza K iteraciones en las que usa diferentes subconjuntos para entrenamiento y prueba.

Esto ayuda a evaluar el rendimiento del modelo de manera más robusta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cuál es la diferencia entre exactitud y precisión en clasificación?

A

La exactitud mide la proporción total de predicciones correctas, mientras que la precisión mide la proporción de verdaderos positivos sobre todas las predicciones positivas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es la validación hold-out?

A

Es una estrategia de validación donde se divide el conjunto de datos en entrenamiento y prueba, usando porcentajes fijos como 70%-30%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué representa la métrica MAE en regresión?

A

El MAE (Mean Absolute Error) es el promedio de los valores absolutos de las diferencias entre los valores reales y predichos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cómo se detecta el subajuste en un modelo?

A

Se detecta cuando los errores de entrenamiento y generalización son altos y similares, lo que indica que el modelo no está capturando bien la información de los datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Por qué es importante separar los datos de entrenamiento y prueba?

A

Para evaluar correctamente la capacidad de generalización del modelo y evitar el sobreajuste.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué es la validación anidada?

A

Es un procedimiento que combina validación cruzada y ajuste de parámetros para seleccionar el mejor modelo sin sesgar los resultados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En la validación cruzada, se usa siempre el mismo conjunto de datos para entrenamiento y prueba. (V/F)

A

Falso. Se crean K subconjuntos diferentes en cada iteración.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Un modelo con sobreajuste generaliza bien en datos nuevos. (V/F)

A

Falso. El modelo se ajusta demasiado a los datos de entrenamiento y falla con datos nuevos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La validación hold-out siempre usa un 80%-20% en la división de datos. (V/F)

A

Falso. Se pueden usar otras proporciones como 70%-30% o 66%-34%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

El MAE y el RMSE son métricas utilizadas en problemas de regresión. (V/F)

A

Verdadero. Ambas métricas miden la diferencia entre los valores reales y los predichos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

La precisión en clasificación es la proporción de verdaderos positivos sobre el total de positivos predichos. (V/F)

A

Verdadero. Mide qué tan confiables son las predicciones positivas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Un modelo con alta sensibilidad detecta correctamente la mayoría de los casos positivos. (V/F)

A

Verdadero. La sensibilidad mide la capacidad del modelo para identificar correctamente los casos positivos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En una validación cruzada con K=5, cada bolsa se usa solo una vez como conjunto de test. (V/F)

A

Verdadero. Cada bolsa es usada una vez como test y el resto como entrenamiento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La validación anidada ayuda a evitar el sobreajuste en la selección de hiperparámetros. (V/F)

A

Verdadero. Utiliza una validación interna para encontrar los mejores parámetros antes de probar en el conjunto de test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

El sobreajuste ocurre cuando el modelo se ajusta demasiado a los datos de ___________.

A

entrenamiento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

La validación ___________ divide los datos en K subconjuntos y los usa en diferentes iteraciones.

A

cruzada.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

La ___________ mide la proporción de aciertos sobre el total de predicciones en clasificación.

A

exactitud.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

En regresión, el ___________ mide la media de los errores absolutos entre valores reales y predichos.

21
Q

La validación ___________ se basa en dividir los datos en conjuntos de entrenamiento y prueba.

22
Q

En problemas de clasificación, una matriz de ___________ organiza los aciertos y errores del modelo.

A

confusión.

23
Q

La ___________ mide la proporción de verdaderos positivos sobre el total de casos positivos reales.

A

sensibilidad.

24
Q

La validación ___________ usa validación interna para el ajuste de parámetros antes de evaluar el modelo final.

25
Q

¿Qué es el sobreajuste en un modelo de aprendizaje automático?

A

B) Cuando el modelo se ajusta demasiado a los datos de entrenamiento.

26
Q

¿Qué métrica se usa para medir la diferencia absoluta entre valores reales y predichos en regresión?

27
Q

¿Qué técnica de validación divide el conjunto de datos en K subconjuntos y los rota en entrenamiento y prueba?

A

B) Validación cruzada.

28
Q

¿Cuál de estas métricas NO se usa en clasificación?

29
Q

¿Qué sucede si un modelo tiene una sensibilidad del 100% pero una precisión baja?

A

A) Detecta todos los casos positivos pero tiene muchos falsos positivos.

30
Q

¿Cuál es una ventaja de la validación cruzada sobre la validación hold-out?

A

B) Usa múltiples subconjuntos para evaluación, reduciendo sesgos.

31
Q

¿Qué estrategia de validación es más adecuada cuando se busca optimizar hiperparámetros?

A

C) Validación anidada.

32
Q

¿Qué es la validación leave-one-out?

A

A) Una validación donde cada muestra es usada una vez como test y el resto como entrenamiento.

33
Q

Define el concepto de validación hold-out.

A

Es una técnica de validación en la que se divide el conjunto de datos en entrenamiento y prueba, comúnmente en proporciones como 70%-30% o 66%-34%.

34
Q

¿Qué es la validación cruzada?

A

Es una técnica en la que el conjunto de datos se divide en K partes y se realizan K iteraciones de entrenamiento y prueba con diferentes subconjuntos.

35
Q

Explica la métrica de exactitud en clasificación.

A

La exactitud mide el porcentaje de predicciones correctas sobre el total de predicciones realizadas.

36
Q

¿Qué es el MAE en regresión?

A

El MAE (Mean Absolute Error) es la media de los valores absolutos de las diferencias entre los valores reales y los valores predichos por un modelo.

37
Q

¿Qué representa la matriz de confusión en clasificación?

A

Es una matriz que muestra el número de predicciones correctas e incorrectas para cada clase en un problema de clasificación.

38
Q

¿Cómo se define la métrica de sensibilidad en clasificación?

A

La sensibilidad mide la proporción de casos positivos correctamente identificados sobre el total de casos positivos reales.

39
Q

¿Cuál es la principal diferencia entre sobreajuste y subajuste?

A

El sobreajuste ocurre cuando un modelo aprende demasiado los datos de entrenamiento y no generaliza bien, mientras que el subajuste se da cuando el modelo no captura suficiente información de los datos.

40
Q

¿Qué es la validación anidada?

A

Es una técnica de validación que combina validación cruzada con ajuste de parámetros, permitiendo evaluar modelos sin sesgar los resultados.

41
Q

¿Por qué es importante dividir los datos en entrenamiento y prueba?

A

Para evaluar correctamente el rendimiento de un modelo y evitar que se ajuste solo a los datos de entrenamiento sin generalizar a datos nuevos.

42
Q

Explica por qué la validación cruzada es preferible a la validación hold-out en algunos casos.

A

La validación cruzada proporciona una evaluación más fiable del rendimiento del modelo, ya que usa múltiples subconjuntos de prueba en diferentes iteraciones, reduciendo la dependencia de una única partición de datos.

43
Q

¿Cómo se puede detectar si un modelo está sobreajustado?

A

Se detecta comparando los errores de entrenamiento y generalización; si los errores de entrenamiento son bajos pero los de prueba son altos, el modelo está sobreajustado.

44
Q

¿Por qué la precisión y la sensibilidad pueden estar en conflicto en clasificación?

A

Porque al aumentar la precisión (reduciendo falsos positivos), se puede reducir la sensibilidad (no detectando algunos verdaderos positivos), y viceversa.

45
Q

Explica el concepto de validación estratificada y su utilidad.

A

Es una técnica que mantiene la misma distribución de clases en los conjuntos de entrenamiento y prueba, lo que evita problemas de desbalanceo y mejora la evaluación del modelo.

46
Q

¿Cómo afecta el número de K en la validación cruzada?

A

Un número bajo de K puede generar evaluaciones inexactas, mientras que un número alto (como K=n en leave-one-out) puede ser computacionalmente costoso, por lo que un valor intermedio como K=10 es comúnmente usado.

47
Q

¿Por qué la validación anidada ayuda a seleccionar modelos sin sesgo?

A

Porque separa el proceso de ajuste de hiperparámetros del proceso de evaluación, asegurando que el modelo final no esté optimizado directamente sobre el conjunto de prueba.

48
Q

¿Cómo se pueden mejorar los modelos con subajuste?

A

Aumentando la complejidad del modelo, agregando más características o ajustando hiperparámetros para que capture mejor los patrones en los datos.