REPASO SEMINARIO ECONOMETRÍA Flashcards
pasar el parcial
Qué es un modelo?
es un esquema que conecta eventos con factores determinantes
Qué tipos de variables discretas pueden haber?
-ordenamiento
-respuesta cualitativa
-categórica
-conteo
En un modelo de selección binaria de qué partimos?
yi, que es una variable dependiente discreta aleatoria observable del i-ésimo individuo sobre un evento E, que toma el valor en este caso de 0 o 1
la discusión del modelo binario en qué se centra?
en la probabilidad del evento E
cuál es la función de densidad de probabilidad de una distribución bernoulli?
f(yi)= pi^yi * (1-pi)^(1-yi)
E(yi) = ?
pi = xi’B
Cuál es el objetivo econométrico?
estimar los parámetros de la relación funcional
problemas de estimar un modelo binario con OLS?
- acotamiento
-discretitud
-heterocedasticidad
Acotamiento de dónde?
pi= (0, 1) y por el contrario xi’B e R
Heterocedasticidad de dónde?
sacas la varcov(ei) que es la sumatoria de i=0 hasta 1de dos veces el ei de cada caso por su probabilidad, lo que resulta en pi(1-pi) lo cual depende de i lo que hace que halla heterocedasticidad
se puede arreglar la heterocedasticidad? y si sí cómo?
sí, se puede multiplicar por la cholesqui y estimarse el modelo modificado por OLS dando así una estimación por FGLS
cuales son los problemas de estimar por GLS en un modelo binario suponiendo un neta de 1, qué significa un neta de 1?
un neta de 1 hace referencia a que cada variable xi es única para cada individuo. Y los problemas radican en que xi’B puede no estar acotado y porque la choleski puede tomar valores negativos que no son compatibles con su raiz. Esto se puede arreglar editando la muestra o aproximando los resultados de xi’B a 0,0001 o 0,9999 que cumple con las propiedades asintóticas de FGLS pero no es ideal.
qué significa que neta sea mayor o igual a 2? y siendo así, qué es yi?
que para cada vector de variables xi existen varias observaciones para yi. Entonces yi viene siendo el número de ocurrencias del evento E en ni experimentos que comparten un vector de variables explicativas xi
entonces para cada xi van a ver cuantos individuos cuando neta es mayos a 2 ?
ni
cuando neta es mayor a 2, cómo cambia la fórmula de yi?
ahora yi es una proporción 1/ni sum de j = 1 hasta ni de los yij
siguiendo con el análisis para neta mayor a 2, por el modelo naive pi moño= pi +ei, cuales son las propiedades del término de perturbación y porqué se podría generar heterocedasticidad? cómo se arregla.
el esperado es. 0 y la varianza da pi(1-pi)/ ni lo cual esta en la diagonal de la varcov(ei) mxm. Para quitar heterocedasticidad se multiplica por la p= 1/raiz (ni bk) y se aplica FGLS el cual puede caer fuera del intervalo (0,1)
qué es m? qué es n, qué es j y qué es i?
m es el número de grupos en x, n es el número de individuos en cada x, j es el sub indice de la sumatoria que va de 1 hasta ni, e i son los individuos en general CREO .
Cuál es la prioridad en los modelos binarios y el supuesto de linealidad cuando no aplica?
Acotamiento, el supuesto no aplica a datos extremos
Comó necesitamos una variable acotada entr 0 y 1 nace un g(xi), qué representa esa función?
función no lineal de las variables explicativas
Cuáles dos funciones no lineales se pueden utilizar ?
función de densidad acumulada de la normal estandar o de la logistica
Diferencia entre la cdf de la normal estandar y la logistica
las colas
Para entender estos modelos binarios que se plantea?
nace una variable indicadora latente lineal en B, I la cual va a definir la probabilidad de que ocurra el evento E dependiendo de mi nivel de utilidad
Qué relación existe entre I y xi’B
monotónica
cómo se selecciona mi g(x)?
va a depender de un Ii que depende de cada individuo; Ii > I* para que E ocurra
siguiendo con la lógica de mi variable indicadora qué es Pi (4 respuestas)
Pi = prob(E/Ii) = prob(I*<Ii) = F(Ii) = F(xi’B)
la utilidad viene dada por la utilidad promedio mas un termino de perturbación, pero esa utilidad promedio se puede expresar como:
sumatoria de Zi1’ * Rho + Wi’ * gamma1 lo que hace referencia a unas caracteristicas alternativas y a unas caracteristicas socioeconómias por sus respectivos parametros
como es la función que sale de la utilidad de yi*?
yi*= rho( Zi1-Zi0)’ + Wi’( gamma1 - gamma0) + (ei1-ei0)
yi= [ ( Zi1-Zi0)’ Wi’ ] [ rho ] + ei
[ gamma1 - gamma0]
yi= xi’B + ei
sabiendo qué es yi* ahora cómo se puede reescribir pi? (3 respuestas)
pi = prob ( yi = 1) = prob (yi* > 0)
= prob (ei*> -xi’B)
llegue a la función inversa de pi partiendo de
pi= prob( ei*> -xi’B)
pi= prob( ei> -xi’B)
pi= 1- prob( ei< -xi’B)
pi= 1- F( -xi’B)
pi= F( xi’B)
F^-1pi= F^-1 o F( xi’B)
F^-1pi= xi’B
se puede llegar a pi desde Ii o se puede comenzar desde pi para llegar a Ii por la función inversa
Como queremos estimar los parámetros y hallar la varcov de esta variable binaria se utilizan los modelos no lineales probit o logit y se estiman mediante…
Máxima verosimilitud
cómo se plantea la función de máxima verosimilitud y de donde sale pi?
L = multiplicatoria de i=1 hasta T de
pi^yi * (1-pi)^(1-yi) y pi sale de la cdf
cómo queda la función de verosimilitud cuando se le aplica logaritmo natural
Ln(L) = sumatoria i=1 hasta T de
(yi *ln( F(xi’B))+ [(1-yi) ln( 1- F(xi’B))]
por qué no se deriva la función de máxima verosimilitud en un problema de selección binaria?
porque las condiciones de primer orden no van a dar un máximo lineal por lo tanto no se puede resolver igualando a 0. Toca hacer uno de un algoritmo de óptimización. En este caso el de Newton y Raphson
Cómo es la fórmula del estimador de Newton y Raphson
Bmoño (k+1) = Bmoño(k) - [ matriz hessiana ] [ vector score]
matriz hessiana = segunda derivada del ln(L) con respecto a B u B’ evaluado en B=Bmoño(k)
vector Score= primera derivada del ln(L) con respecto a B evaluado en B=Bmoño(k)
Cómo funciona el algoritmo de Newton y Raphson?
un método iterativo que se utiliza para encontrar aproximaciones a las raíces de una función real donde se parte de un x_0 y se si itera hasta que la diferencia entre el valor real y el estimado sea lo suficientemente pequeña.
Por qué se utiliza la expanción de Taylor en el algoritmo de optimización?
La expansión de Taylor de primer grado permite aproximar una función no lineal mediante una función lineal (recta tangente).