Comente-Econometría Flashcards
El estimador por MCO de un modelo de regresión lineal se encuentra minimizando la suma de los residuos.
Falso. El estimador por MCO minimiza los residuos al cuadrado. De esta forma se toman en cuenta tanto errores negativos como positivos, y se penaliza más los residuos más grandes.
Los parámetros de un modelo de regresión lineal son variables aleatorias.
Falso. Los parámetros de un modelo son números reales, que no conocemos. Los estimadores sí son varia- bles aleatorias. Su aleatoriedad viene del hecho de que dependen de la muestra que se utilice en la estimación.
El término de error en un modelo de regresión lineal incluye todas las demás variables no incluidas en el modelo.
Falso. El término de error en un modelo de regresión lineal incluye todas las variables no incluidas en el modelo que además son relevantes para la variable dependiente.
Supongamos que hay dos modelos distintos que intentan medir el efecto de una variable sobre la misma variable dependiente, y que uno tiene un R2 mayor que otro. Entonces, podemos afirmar que el modelo que tiene un mayor R2 es mejor para intentar estimar el efecto causal.
Falso. El R2 de un modelo es una medida del poder predictivo de mi modelo, pero no dice nada sobre si
está capturando una relación de causalidad.
El modelo con el mayor R2 puede estar capturando una correlación fuerte.
¿Qué se tiene que cumplir para que los estimadores sean insesgados? De una explicación intuitiva de por qué esto permite que las estimaciones de los parámetros sean insesgadas.
Se tiene que cumplir el supuesto 1, que en su versión mas fuerte requiere que la esperanza del error condicional en los regresores sea 0.
Se puede relajar de dos maneras. Primero, requiriendo que la esperanza condicional sea constante, lo que asegura que las estimaciones de todos los parámetros menos de la constante son insesgadas. Segundo, que sea una combinación lineal de las variables de control del modelo. En este caso, sólo la variable de interés esta estimada de forma insesgada.
Intuitivamente, lo que queremos hacer es medir el efecto de una variable manteniendo todo lo demás constante, y solo podemos hacer esto si al mover la variable de interés no estamos moviendo también otras variables no incluidas en el modelo.
Supongamos que queremos medir el efecto de las consultas médicas sobre la salud de las personas. Explique cuál es el problema de hacer una regresión simple para encontrar el efecto causal, proponga una solución, y explique por qué lo que propone ayudaría a solucionar el problema.
El principal problema es que son justamente las personas más enfermas las que más van a consultas médicas, por lo que es probable que al hacer una regresión con salud como variable dependiente y consultas médicas como variable independiente tengamos que el efecto sea negativo.
Una forma (no realista) de resolver esto es aleatorizar las consultas médicas. Si el tratamiento es asignado de forma aleatoria, las personas con más y menos consultas van a ser similares en todas las demás variables, por lo que la única diferencia van a ser las consultas. Entonces, si hay una diferencia en su salud esta es atribuible a las consultas.
Cuando estamos realizando inferencia estadística con una hipótesis simple, el estadistico t se distribuye como una normal estandar sin importar si tenemos o no el verdadero valor del error estandar.
Falso. El estadístico t para una hipótesis simple, se distribuye como una …
normal est ́andar s ́olo si conocemos el valor verdadero de que depende de si conocemos …
Digamos que estamos testeando si βˆ1 = 0. Con un test de dos colas y un nivel de significancia del 5%, si el valor del estad ́ıstico es -2,5 no se rechaza la hipo ́tesis nula, ya que es menor a 1,96.
Falso. Como es un test de dos colas, rechazamos la hipo ́tesis nula con un nivel de sig- nificancia del 5% si el valor del estad ́ıstico es menor a -1,96 o mayor a 1,96. Entonces, se rechaza la hip ́otesis nula si el valor del estad ́ıstico es mayor a 1,96 en valor absoluto, lo que s ́ı ocurre en el ejemplo.
Un p-value de 0.99 significa que el test s ́olo se va a rechazar si el nivel de significan- cia es mayor que 1%.
Falso. Un p-value se puede interpretar como el menor nivel de significancia para el cual rechazaríamos la hipótesis nula. Entonces, un p-value de 0.99 significa que sólo rechazaríamos la hipótesis nula para un nivel de significancia mayor o igual a 99%. Recordar que el p-value también nos dice cuál es la probabilidad de observar lo que observamos suponiendo que se cumple la hipótesis nula, entonces un p-value alto implica que debería ser más difícil rechazarla.
El intervalo de confianza es más informativo que un test de hipótesis cuya hipótesis nula es H0 :β=0
Verdadero. Lo único que nos dice un test de hipótesis para H0 : β = 0 es si se rechaza la hipótesis nula a cierto nivel de significancia, mientras que un intervalo de confianza nos da un rango de valores que no podr ́ıan ser rechazados por la H0 a un nivel de significancia dado. Por lo tanto, es posible evaluar un rango de valores en lugar de evaluar solo un valor dado. Un intervalo de confianza tambi ́en nos permite analizar la precisi ́on de nuestras estimaciones. Por ejemplo, un intervalo de confianza muy ancho indicar ́ıa que la precisio ́n de nuestra estimaci ́on probablemente no es tan alta. Al presentar s ́olo el test de hipo ́tesis, se pierde la posibilidad de examinar esto. Es decir, un intervalo de confianza nos permite hacer un an ́alisis ma ́s profundo de la precisio ́n de nuestra estimacio ́n que un test de hipo ́tesis.