Especificación del MRL y Sesgo de Especificación del Modelo Flashcards

1
Q

Qué se entiende por un modelo “correctamente” especificado en el contexto del (MRL)?

A

es aquel que cumple con todos los supuestos del MCRL, incluyendo la linealidad en los parámetros, la exogeneidad de las variables explicativas, la homoscedasticidad y la no autocorrelación de los términos de error, entre otros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué implica un error o sesgo en la especificación del modelo?

A

que el modelo no está correctamente especificado. Esto puede deberse a varios factores, como la omisión de variables relevantes, la inclusión de variables irrelevantes, la especificación incorrecta de la forma funcional del modelo, entre otros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cuáles son los criterios para seleccionar un modelo a partir del análisis empírico?

A

el modelo debe ser:
1. adecuado para los datos, 2. consistente con la teoría, 3. tener regresoras exógenas débiles,
4. mostrar constancia en los parámetros,
5. exhibir coherencia en los datos, y ser inclusivo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Cómo se asegura que un modelo es adecuado para los datos y consistente con la teoría?

A

si las predicciones basadas en el modelo son lógicamente posibles.
y consistente con la teoría si tiene un sentido económico pertinente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué significa que las regresoras exógenas deben ser débiles?

A

que las variables explicativas, o regresoras, no deben estar correlacionadas con el término de error. En algunas situaciones, las regresoras exógenas tal vez sean estrictamente exógenas, es decir, una variable estrictamente exógena es independiente de los valores actuales, futuros y pasados del término de error.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Por qué es importante que los parámetros del modelo sean constantes?

A

porque si no lo son, el pronóstico se dificultará. Como explica Friedman: “La única prueba relevante de la validez de un[a] [modelo] hipótesis es la comparación de sus predicciones con la experiencia”. Ante la ausencia de la constancia en los parámetros, tales predicciones no serán confiables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué implica que los residuos estimados a partir del modelo deben ser puramente aleatorios (ruido blanco)?

A

implica que si el modelo de regresión es adecuado, los residuos obtenidos de este modelo deben ser de ruido blanco. Si no es el caso, existe un error de especificación en el modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Por qué es importante que el modelo sea inclusivo y pueda explicar los resultados de todos los modelos contendientes?

A

en resumen, otros modelos no pueden ser mejores que el elegido.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Cuáles son los tipos de errores de especificación de modelos más comunes en la práctica?

A

1 la omisión de variables relevantes,
2 la inclusión de variables irrelevantes,
3 la especificación incorrecta de la forma funcional del modelo,
4 la especificación estocástica inadecuada del término de error.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Cómo se define un modelo mal especificado?

A

es aquel que no cumple con los supuestos del MCRL o que no captura adecuadamente la relación entre las variables de interés. Un ejemplo de esto sería un modelo en el que se omite una variable relevante o se incluye una variable irrelevante. Otro ejemplo sería un modelo en el que la forma funcional de la relación entre las variables está mal especificada, por ejemplo, si la relación es en realidad no lineal pero se especifica como lineal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué se entiende por sesgo de error por medición?

A

e refiere a la situación en la que las variables en el modelo están sujetas a errores de medición. Esto puede introducir sesgo en las estimaciones de los parámetros del modelo y puede llevar a conclusiones incorrectas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Cuáles son las consecuencias de los errores de especificación?

A

pueden ser graves e incluyen
1.estimaciones sesgadas e inconsistentes de los parámetros del modelo,
2. pruebas de hipótesis inválidas,
3. pronósticos poco fiables. 4. los errores de especificación pueden llevar a conclusiones incorrectas sobre la relación entre las variables de interés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Cómo afecta la omisión de una variable relevante (subajuste de un modelo) al modelo?

A

La omisión de una variable relevante puede llevar a un sesgo en las estimaciones de los parámetros del modelo. Si la variable omitida está correlacionada con las variables incluidas en el modelo, esto puede llevar a un sesgo de omisión de variables. Además, la omisión de una variable relevante puede llevar a una subestimación de la varianza del error y a pruebas de hipótesis inválidas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Cómo afecta la inclusión de una variable irrelevante (sobreajuste de un modelo) al modelo?

A

estimaciones ineficientes de los parámetros del modelo. Aunque las estimaciones de los parámetros seguirán siendo insesgadas y consistentes, sus varianzas serán mayores que si la variable irrelevante no se hubiera incluido en el modelo. Esto puede llevar a intervalos de confianza más amplios y a una menor potencia para las pruebas de hipótesis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Cómo se detectan los errores de especificación y qué herramientas de diagnóstico están disponibles?

A

mediante varias herramientas de diagnóstico:
1. las pruebas de hipótesis, 2. el análisis de los residuos, 3. las pruebas de especificación, como la prueba RESET de Ramsey.
4. se pueden utilizar criterios de información como el criterio de información de Akaike (AIC) y el criterio de información bayesiano (BIC

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Por qué es importante detectar variables innecesarias en un modelo de regresión?

A

porque su presencia puede llevar a un sobreajuste del modelo, lo que puede resultar en estimaciones ineficientes de los parámetros del modelo. Aunque las estimaciones de los parámetros seguirán siendo insesgadas y consistentes, sus varianzas serán mayores que si la variable irrelevante no se hubiera incluido en el modelo. Esto puede llevar a intervalos de confianza más amplios y a una menor potencia para las pruebas de hipótesis.

17
Q

¿Cómo se puede detectar la presencia de variables innecesarias en un modelo de regresión?

A
  1. el uso de pruebas de hipótesis para la significancia de los coeficientes de las variables en cuestión,
  2. el análisis de los residuos del modelo,
  3. el uso de criterios de información como el criterio de información de Akaike (AIC) y el criterio de información bayesiano (BIC).
18
Q

¿Cuál es la diferencia entre el nivel de significancia nominal y el verdadero en el contexto de la minería de datos?

A

el nivel de significancia nominal es el nivel de significancia que se establece a priori para las pruebas de hipótesis, como 1%, 5% o 10%. Sin embargo, si se seleccionan múltiples variables candidatas para el modelo a través de la minería de datos, el verdadero nivel de significancia puede ser mayor que el nivel nominal. Según Lovell, si hay c candidatas regresoras de las cuales k son finalmente seleccionadas (k ≤ c) con base en la minería de datos, el verdadero nivel de significancia (α) se relaciona con el nivel de significancia nominal (α) de la siguiente manera: α = 1 - (1 - α)^(c/k).

19
Q

¿Por qué es importante realizar pruebas para detectar variables omitidas en un modelo de regresión?

A

porque la omisión de variables relevantes puede llevar a un sesgo en las estimaciones de los parámetros del modelo. Si la variable omitida está correlacionada con las variables incluidas en el modelo, esto puede llevar a un sesgo de omisión de variables. Además, la omisión de una variable relevante puede llevar a una subestimación de la varianza del error y a pruebas de hipótesis inválidas.

20
Q

¿Cómo se pueden detectar variables omitidas en un modelo de regresión?

A
  1. el análisis de los residuos del modelo,
  2. las pruebas de hipótesis para la significancia de los coeficientes de las variables en cuestión,
  3. el uso de pruebas de especificación, como la prueba RESET de Ramsey. (utilizar el comando ovtest).
21
Q

¿Qué se entiende por valores atípicos, puntos de apalancamiento y puntos de influencia en el contexto de la regresión?

A

es una observación con un residuo grande, es decir, una diferencia significativa entre el valor real de la variable dependiente y su valor estimado a partir del modelo de regresión. Un punto de apalancamiento es una observación que está desproporcionadamente distante de la mayoría de los valores de una o más variables explicativas. Un punto de influencia es un punto de apalancamiento que tiene un efecto significativo en los coeficientes de regresión.

22
Q

¿Cómo se pueden detectar valores atípicos, puntos de apalancamiento y puntos de influencia en un modelo de regresión?

A
  1. el análisis de los residuos del modelo,
  2. las pruebas de hipótesis para la significancia de los coeficientes de las variables en cuestión,
  3. el uso de pruebas específicas como el Test de Grubbs y el Criterio de Chauvenet.
    En el software estadístico Stata, por ejemplo, se puede utilizar el comando twoway(scatter price mpg) (lfitci price mpg) para graficar una banda o intervalo en el que posiblemente se muevan las observaciones, lo que puede ayudar a identificar valores atípicos.