4. IV Flashcards
Enligt youtube-video
om vi har Y = b0 + b1X1 + e
förklara grundkonceptet med IV
Förmodligen håller inte E(e|X1) = 0. Det betyder att det finns varians mellan e och X1.
Istället för att bara köra en OLS vill vi bara använda den variationen i X som INTE är korrelerad med e.
Med IV försöker vi hitta någonting (ett instrument) som naturligt slumpar X till våra observationer. Något som ger oss EXOGEN variation.
Ett instrument är en variabel som bestämmer den endogena regressen (X) men som bara påverkar den beroende variabeln genom denna och inte i sig själv.
Det betyder att Z påverkar Y genom X (ska vara stark korrelation mellan Z och Z) men inte i sig själv eller genom e.
Z är oberoende av e.
Enligt youtube-video
Vilka delar består kan vi tänka att den endogena variabeln (X) består av i IV världen?
3 delar:
- Den delen av X som är korrelerad med e (den problematiska delen)
- Den delen av X som är korrelerad med Z och oberoende av e.
- Den delen som varken är korrelerad med feltermen eller instrumentet.
(IV gör att vi bara använder del 2. i får beta).
Enligt youtube-video
VIlken behandlingseffekt ger iv?
Det ger INTE den genomsnittliga behandlingseffekten utan LATE (Local average treatment), den genomsnittliga behandlingseffekten på gruppen som påverkades av behandlingen. Alltså de som gick på en skola om de fanns i närheten.
Om denna gruppen skulle skilja sig från gruppen som skulle gå i skolan även om de inte bor nära, så är LATE skiljd från ATE.
Enligt youtube-video
Kan man testa om ett instrument har en direkt effekt på den beroende variablen?
Om det är så har man inte ett validt instrument.
Det är väldigt svårt att testa detta.
I videon säger han att om man har mer än ett instrument kan man använda båda. De ska då ge ungefär samma resultat.
= Sargan test eller Wu-Hausman test.
Om vi har Y=β0 + β1X1 + π1W1 +… + u
men vi kan inte observera W1. Vad gör IV?
The IV solution is to isolate variation in X1 which is unrelated to W’s (och implicit e?). The variable which does the “isolating” is the instrumental variable.
Vilka tre conditions do the instrument Z need to satisfy?
- Z is as good as randomly assigned.
- Har ingen direkt effekt på Y. Dvs, Z satisfies the EXCLUSION RESTRICTION, = it does not appear as a separate regressor in the long regression we like to run.
Y=β0 + β1X1 + δZ + π1W1 + … + u
where δ=0 (the instrument cannot have an direct effect on the outcome Y but it must go only via X: path diagram). - Z affects the endogenous regressor X1.
Vad menar han med Z har en exclusion restriction?
Beträffande IV
it does not appear as a separate regressor in the long regression we like to run.
Y=β0 + β1X1 + δZ + π1W1 + … + u
where δ=0 (the instrument cannot have an direct effect on the outcome Y but it must go only via X: path diagram).
Den är alltså exkluderad från ekvationen.
(think of demand and supply, you need a variable that affects supply (weather) but not demand to identify the demand curve)
Det är vanligt att man överträder exclusion restriction.
Vilka av alla IV conditions kan testas?
Kallas de testen?
Bara “Z affects the endogenous regressor X1.”
Detta är First stage regression.
Att Z är så gott som random assigned och Z inte har någon direkt effekt på Y kan vi bara argumentera för.
Hur gör man en first stage regression?
Man stoppar in sitt instrument och alla kontrollvariabler man vill inkludera sedan testar man om instrumentet har någon effekt på den endogena variablen. Dvs om Z påverkar X.
Det ska finnas en sån effekt och den ska vara stark, annars hr vi ett svagt instrument.
Hur kan man på ett snyggare sätt formulera att “Att Z är så gott som random assigned och Z inte har någon direkt effekt på Y”?
E(u|Z)=0
Z is as good as random assigned
eller
E(u|Z,W) = E(u|W) Alltså, conditional mean independence.
Vilket betyder att Z är as good as random assigned conditioned on other factors (W).
Alltså antingen direkt orelaterad eller om man kontrollerar för saker.
Vilka tre kausala effekter pratar man om i en IV setting?
Vad kallas förhållandena?
Den kausala effekten av Z på X (first stage)
Den kausala effekten av Z på Y (reduced form)
Den kausala effekten av X på Y (structural relationship)
Den är då den tredje som vi är intresserade av och vi använder IV för att få fram den. För denna behöver vi att exclusion restriction håller.
Garanterar en exprementiell variation att exclusion restriction håller?
Nej
om man tar reduced form fx/first stage fx får man
Vad kallas det mer?
The structural parameter.
IV estimatet är alltså ratiot mellan dessa.
Fungerar bara om vi har en endogen variabel och minst ett instrument. (just identified). Over identified fungerar också.
Detta kallas indirect least square.
Vad menas med overidentified model?
An overidentified model is a model for which there is more than enough information in the data to estimate the model parameters. …
If there are multiple instruments for a single endogenous regressor the model is overidentified. For example, if you have two instruments then you can get two (different) IV
estimates.
A model must be just-identified or overidentified in order to estimate parameters
Vad är ett under identifieerad modell?
Två endogena variabler och ett instrument. Då kan man inte estimera modellen.
Vad är 2SLS?
With more than one instrument, 2SLS is a weighted average of the one-at-time (justidentified) estimates (In a linear homoscedastic constant-effects model, this is efficient
GMM).
Vilka olika IV estimat finns?
Indirect least square, IV, 2SLS och GMM (vid GMM finns det många instrument)…
Hur många instrument och endogena variabler ska man ha enligt PER?
Ett starkt instrument och en endogen variabel. är det överidentifierat är det svårt att veta vad exclusion restriction egentligen är.