Datos de Panel Flashcards

1
Q

¿Qué son los datos de panel?

A

Son datos para los que tenemos observaciones de individuos distintos y observaciones del mismo individuo en distintos momentos del tiempo. A esto se le llama tener variabilidad within (temporal -series de tiempo-) y between (entre individuos -cross section-).
Los datos de panel pueden dar lugar al uso de dos modelos distintos: el de efectos aleatorios y el de efectos fijos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Modelo de Efectos Aleatorios. ¿Qué intenta hacer y cuáles son los supuestos?

A

El modelo de efectos aleatorios plantea un modelo de datos de panel donde la variable aleatoria individual de la ecuación (alfa_i) está en el término de error.
Esto genera una serie de supuestos, que si se cumplen garantizan un estimador de efectos aleatorios consistente y eficiente.

Los supuestos son: homocedasticidad del término de error, no correlación serial entre los términos de error ni en el tiempo ni entre individuos ni entre ese término y el alfa, que mi modelo era exógeno y, el MÁS importante:
→ Que mi regresor no se relaciona con el “nuevo” término de error, que es lo mismo que decir que no tiene relación con alfa_i.

Bajo todos estos supuestos, yo conozco la matriz de varianzas y covarianzas del término de error, entonces puedo dividir a todas la variables por esa matriz y obtener un FGLS consistente y eficiente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cuál es la ventaja de Random Effects contra FGLS?

A

Lo primero a tener en cuenta es que RE es un modelo FLGS pero con una ventaja.
FLGS nosotros lo descartábamos automáticamente porque teníamos que estimar una matriz de varianzas y covarianzas desconocidas para nosotros. Eso luego lo usábamos para dividir a todas las variables pero corriendo el riesgo de que esté muy mal, lo que nos producía problemas de consistencia.
RE no hace eso porque la matriz de varianzas y covarianzas es conocida. Tenés que estimarla, pero no es lo mismo estimar algo desconocido que estimar algo que conocés cómo está compuesto. Por eso RE es más viable que FGLS.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Por qué, al final del día, no usamos RE nunca en aplicada?

A

Nosotros no estamos dispuestos a aceptar el supuesto más importante de RE, el que básicamente construye el RE, que es que no hay relación entre el término individual y el regresor (lo que te garantiza exogeneidad de la nueva ecuación).
Es inaceptable absolutamente porque es imposible argumentar que el efecto individual de un individuo no está correlacionado con el tratamiento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Modelo de Efectos Fijos. ¿Qué intenta lograr?

A

Justamente lo opuesto al modelo RE: que el término individual (efectos fijos) no vaya al término de error. Se intenta purgar al error de cualquier efecto fijo propio de cada individuo. En esencia, lo que hacemos es descartar el supuesto más importante de RE.
Hay varias estrategias que se pueden utilizar para construir un modelo por efectos fijos, es decir, evitar que el término individual caiga dentro del error.

OBS: no es lo mismo el término individual que la constante del modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Least Square Dummy Variables (LSDV). Explicar.

A

Lo que hace es dejar al término fijo dentro de la ecuación y luego estimarlo. Ese término es, por dentro, una matriz de dummies, tantas como individuos haya. Entonces, cada dummy va tomando valor 1 o 0 si el individuo que corresponda con esa dummy es el que se está evaluando.
Mirar el coeficiente del término no tiene importancia, solo importa que captura parte de los efectos para ayudar a la estimación del beta.

OBS: si incluís una dummy por individuo, tenés que sacar la constante del modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Within Estimator. Explicar.

A

Este método excluye al término individual de la ecuación al restarle la media individual a cada individuo en cada variable. Es decir, si yo tengo Xit le resto Xi_raya, y así con todas las variables. Como alfa_i es una variable que trasciende el tiempo, si le resto el promedio individual, la estoy eliminando del modelo.
En tema de supuestos, estrictamente estás pidiendo un poco más de exogeneidad porque Xi_raya incluye los Xi de distintos momentos del tiempo (de todos, de hecho), y todas esas tienen que ser independientes de εit. Es un supuesto aceptable.

Al restarle la media individual, ahora ya no importa el nivel de la variable, lo que importa es cómo es la variabilidad a lo largo del tiempo para cada individuo (la diferencia con su media). Estoy eliminando por completo la variabilidad between porque probablemente tenga mucha endogeneidad, y me estoy quedando exclusivamente con la variabilidad within (que probablemente sea un poco menos endógena). Ahora, la fuente de endogeneidad vendría por una variable que cambie en cada momento del tiempo en una magnitud considerable y correlacionada con los cambios del regresor y que al mismo tiempo, cuando esa variable cambia, también causa un cambio en la dependiente.
En conclusión, es más difícil derribar el supuesto de exogeneidad.

OBS: también se pueden aplicar efectos fijos por tiempo, eliminando toda la variabilidad within y quedándome con la between (es un concepto parecido pero inverso).

OBS: hacer LSDV y Within es exactamente lo mismo. En LSDV estás estimando la media individual y metiéndolo en la regresión, mientras que within la incluye de otra manera. La diferencia está en la cantidad de parámetros utilizados pero conceptualmente es lo mismo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

First Differences. Explicar.

A

Le resta a cada variable en it su i(t-1). Es decir, le resta a cada observación, la que corresponde al mismo individuo del período anterior.
De esta manera también estás eliminando el término individual porque ese no tiene tiempo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Between Estimator. Explicar.

A

Lo que hace es utilizar el promedio de la variable en lugar de la variable. Como alfa_i no cambia en el tiempo, será ella misma y eso iría al término de error.
Este método no se usa nunca porque está totalmente dominado por Random Effect y necesita los mismos supuestos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Conclusión sobre modelos Random Effect y Efectos Fijos. ¿Por qué siempre preferimos el de EF?

A

Los modelos de efectos fijos son menos eficientes que los random effect pero el tema es que los de efectos fijos son consistentes siempre y el de random effect solo si se cumple el supuesto (5) (entonces ponés en riesgo la consistencia por un supuesto poco creíble, lo que no NUNCA hacemos).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Conclusión sobre datos de panel con respecto a cross-section y time series.

A

Panel data es mucho mejor que cross-section y un poco mejor que time series porque es más complicado que el problema que vos tenés en time series para un individuo lo tengas para todos los individuos al mismo tiempo, que es tenerlo en panel data. Ex.: si tenés un shock económico en una time series, eso te arruina la investigación pero en panel data necesitás que ese shock suceda para todos los individuos por igual.

Cuando tenés cross-section, la única variabilidad que podés explotar del regresor es la variabilidad between (variabilidad entre individuos, que es difícil suponer que es exógena). Cuando tenés series de tiempo, la única variabilidad que tenés es within (porque tenés un solo individuo). En cambio, cuando tenés datos de panel, no hay una sola variabilidad, tenés variabilidad between y within, y además, la variabilidad within la tenés para muchos individuos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly