Lecture 7 (böckerna) Flashcards
Vad är endogena och exogena variabler i termer av regressioner?
Variabler som är korrelerade med feltermen kallas ”endogena variabler”.
Variabler som inte är korrelerade med feltermen kallas ”exogena variabler”.
Endogena variabler bestämts inifrån modellen medan exogena variabler bestäms utanför modellen.
Vad gäller för att ha ett giltigt instrument (IV)?
För att ha ett validit instrument gäller:
- Instrumentrelevans -> korrelation mellan Z och X
- Instrumentexogenitet -> ingen korrelation mellan Z och u.
(Om ett instrument är relevant kommer variationen i instrumentet vara relaterat till variationen i X, om instrumentet också är exogent så kommer så kommer del delen av variationen i X som fångas av instrumentet att vara exogent. Den exogena variationen kommer då kunna användas för att estimera β1.)
Hur går 2SLS till?
Denna räknas ut i två steg.
Steg ett: X delas upp i två komponenter, en problematisk komponent som kan vara korrelerad med regressionsfelet och en problemfri komponent som är okorrelerat med felet. Vi det andra steget så tar man den problemfria komponenten för att estimera β1.
First state:
X = π0 + π1Z + v (också kallad reducerad form)
π0 + π1Z = oproblematisk komponent
v = problematisk komponent
Av den oproblematiska delar får man X^hatt
Man anväönder då dessa X^hatt får att predicera Y^hatt.
Hur många IV’s behöver man?
Man behöver ha åtminstånde lika många instrumentvariabler som det finns endogena variabler i en regression. Man pratar om identifiering.
Exakt identifiering m = K
Överidentifiering m > K
Underidentifiering m < K.
Man vill alltså ha åtminstånde exakt identifiering (lika många Z som endogena variabler)
Det spelar dock ingen roll hur många kontrollvariabler man har tolkar jag det om.
Desto mer relevant instrumentet är desto…….
Desto mer relevant ett instrument är desto mer av variationen i X kommer förklaras av instrumentet.
Desto mer relevant instrumentet är desto mer information finns där med tillgängligt att använda i IV regressionen.
Hur kan man kolla om man har ett svagt instrument eller ej?
Vad betyder det om instrumentet är svagt? Vilken effekt har det på resultatet dvs…
Man kan köra F-test vid första steget och testa hypotesen att koefficienten för Z på X = 0. Om F-Statistiken är < 10, så är det ett svagt instrument.
Ett svagt instrument (ett instrument som knappt är korrelerat med den inkluderade endogena variabeln) gör 2SLS estimatet biased och konfidensintervall och hypotestesten opålitliga.
Hur vet man om instrumentet är exogent eller ej?
Alltså om cov(u, Z) inte = 0.
Det finns inga formella tester, man får använda intuition. Läsa ekonomisk litteratur t.ex, eller försöka hitta slumomässig exogen variation i X.
Varför används IV regressioner?
Instrument variabelregression är ett sätt att estimera regresioneskoeffesienter när en eller fler regressorer är korrelerade med feltermen.
Vilka är de TRE assumptions för IV som AP boken visar?
Tre stycken krav för en instrumentvariabl.
1. IV har en kausal effekt på den variabeln vars effekt man försöker fånga (regn -> BNP-tillväxt)
- IV är random assigned eller så gott som random assigned på så sätt att den är orelaterad till omitted variable. = Indipendence aspumption.
- Exklusion restriktion, en kanal som IV använder för att påverka Y utan att i sig själv påverka Y.
Vad är first stage vid 2SLS?
Visa som regression och som E(……..)
First state: Effekten av IV på X (Z -> X)
E[Di|Zi=1] − E[Di|Zi=0] = φ
X = γ + φZ + ε
Vad är reduced form vid 2SLS?
Visa som regression och som E(……..)
Reducerad form: Den direkta effekten på utkomsten (Z -> Y)
E[Yi|Zi=1] − E[Yi|Zi=0] = ρ
Y = α + ρZi + e
Vad är local average treatment effect?
LATE λ
LATE (λ) är den genomsnittliga kausala effekten för alla personerna som har deltagit i lotteriet och deltagit i korrekt grupp efter resultat (complier). Alltså den genomsnittliga kausala effekten för compliers.
Ration av den reducerade formen och first state.
λ = ρ/φ
Hur kan man matematiskt formulera LATE?
λ =…
E(….
λ = ρ/φ
E(Y1 - Y0|Complier = 1)
Vad är compliers, nerver takers och always takers i termer av Z och D?
D och Z är binära dummyvariabler.
Complier: Z = 0 -> D = 0 och D = 1 -> Z = 1
Dessa tar bara behandlingen om de får den, annars inte. Deras behandlingsstatus beror alltså på Z
Nerver taker: Z = 0 -> D = 0 och Z = 1 -> D = 0
Dessa tar aldrig behandlingen, oavsätt Z.
Always taker = Z = 0 -> D = 1 och Z = 1 -> D = 1
Dessa kommer alltid ta behandlingen oavsätt vad Z är.
Visar IV effekten för nerver takers och always takers?
IV visar alltså inte effekten för nerver takers och always takers då deras status inte beror på IV.
Vilket egentligen inte spelar någon roll eftersom att det är gruppen compliers vi vill veta något om.