Lecture 7 Flashcards
Vilka är de två förhållandena som en instrumentvariabler måste uppfylla?
- Den ska vara relaterad till X
Cov (Xi, Zi ) inte lika med 0 - Den ska vara okorrelerad med allt annat som påverkar Y.
Cov(ui, Zi) = 0
Hur ser förhållandena ut för instrumentvariabln (Z), X Y och u ?
OM det går riktigt till DVS
Vi har X som påverkar Y.
Men vi har också error (u) som påverkar Y. Detta är inget problem. Problematiskt är dock om u påverkar X och sedan genom X påverkar Y.
Vi plockar då in instrumentvariablen Z som inte påverkar Y direkt men som har en effekt X.
Z är heller inte relaterat till u.
Vi håller då u fixerad och ger en effekt från Z till X. Det blir då en ”exogen varianterna när X varierar pga Z.
Vad är endogena och exogena variationer i X?
En endogen variation i X är då variationen i X kommer från u.
En exogen variation är då variationen kommer från en instrumentvariabler Z.
Förklara 2SLS. Vilka ekvationer bygger den på
Den bygger tre ekvationer:
First stage:
Xi = γ0 + γ1Zi + ui
Det här är effekten av Z på X. VI räknar predicerade X.
Reducerad form:
Yi = δ0 + δ1Zi + vi,
Det här är effekten av Z på Y, den indirekta effekten.
Second stage:
Yi = β0 + β1X^i + ei
Här regressernas vi Y på de predicerade vårderna av X. Vi använder alltså det första steget för att beräkna predicerade X som vi använder här. Vi använder alltså de ”fitted” värdena av X. Här kommer då β1 vara den sanna kausala effekten av X på Y.
Vilket är det andra sättet att räkna ut effekten av instrumentvariablen? Utöver 2SLS regression.
β^IV
Vi delar effekten av Z på Y med effekten av Z på X.
Alltså δ/γ
Cov(Y,Z)/Var(Z) / Cov(X, Z)/Var(Z)
Var(Z) tar ut sig,. Blir noll..
Reducerad form / First stage
Det är samma sak som att skriva Cov(Y, Z)/Cov(X,Z)
Vad är β1IV i termer av kovarians…?
Cov(Y, Z)/Cov(X,Z)
Vad är Wald estimatorn?
Det är ett specialfall av instrumentvariabler.
Det handlar om när man hr en regression med en kontinuerlig Y variabeln men där behandlingsvariabeln är en dummy D.
Vi vill mäta effekten av behandlingen, men behandlingen är inte slumpmässigt assignad.
Vi har dock ett instrument Z som är korrelerad med D.
Z är också en dummy variabel.
Hur får vi den sanna effekten av behandlingen på utfallet enligt Wald estimatorn?
Treatment är dummy = D
Instrument är dummy = Z
β1 = (E [Yi|Zi = 1] - E[Yi|Zi = 0]) / (E[Ti|Zi = 1] - E[Ti|Zi = 0])
Vi tar alltså skillnaderna i snitt mellan grupperna där Z = 1 och Z = 0 på Y och delar det med skillnaderna för Z på T där z=1 och Z= 0
Det här blir då samma som δ1/γ1
Det här också samma sak som den ”genomsnittliga behandlingseffekten på compliers”.
Vad är ett annat sätt att skriva Wald estimatorn som när det kommer till average treatment om compliers?
(E[Yi|Zi = 1] - E[Yi|Zi = 0]) / (Pr(Compliers))
Vilket problem har vi om vi har en svag korrelation mellan X och Z samt eller litet sample?
Weak IV
Denna uppstår PGA små sampels och svag korrelation mellan Z och X
Vad består β1^IV av? Varför antar vi att β1^IV mäter den sanna effekten?
β1 + cov(ui, Zi)/cov(Xi, Zi)
Eftersom att vi antar att u och Z inte är relaterat antar vi alltså att vi inte har något bias. Hela den termen blir ju noll då.
Förklara vad Weak IV är och vad det ger upphov till?
Korrelation mellan u och Z samt en svag relation mellan X och Z
Om vi inte har ett oändligt stort sample kommer vi förmodligen att ha lite variation och potentiellt kovariation mellan u och Z vilket ger oss ett nummer större än noll i täljaren.
β1 + cov(ui, Zi)/cov(Xi, Zi)
Har vi då bara en väldigt svag korrelation mellan X och Z i nämnare kommer vi att få ett uppblåst bias! Pga att vi delat ett tal med ett väldigt litet tal.
En liten slumpmässig korrelation mellan u och Z kan alltså drivas upp av en svag korrelation i X och Z och explodera till ett stort bias.
Vi vill därför ha stora sampels! När man har svå sampels kan man av misstag få korrelationer i u och Z (law of small numbers).
Hur kollar vi om antagandena för IV håller?
Beträffande Cov (Xi, Zi ) inte= 0
Vi kan kolla om vi har signifikanta korrelationer, men framförallt F-test. F-tester ska vara större än 10. Är det större än 10 så har vi inte ett Weak IV.
F-testet visar både styrkan i förhållande mellan Z och X samt storleken på Samplet.
Liten korrelation men stort sample är ändå bra. Därför kolla man inte bara på korrelationen, utan F-testet.
För det andra antagandet:
Cov(u, Z) finns inga formella statistiska tester. Man får använda intuition.
Även om det inte finns några formella tester för cov(u, Z). Vad är bra att göra i sin studie?
Man kan göra ett balansschema och visa att Z är okorrelerat med alla kovariaten i studien.
Man kan köra 2SLS utan kontroller, sedan lägger man till fler kontroller.
Att lägga till kontroller ska inte förändra estimatet, bara öka precisionen.
Skulle IV estimatet förändras med fler kontroller visar det att Z och u kanske visst är korrelerat.
Hur kan man testa sina IV (om man har fler) ?
Man gör överidentifieringstest.
Har man fler IV så kan man använda dem tillsammans eller separat och se om de olika IV har samma kausala effekt eller inte, har man bra instrument ska de visa samma resultat (vilket man kan testa, om effekterna mellan dem är skiljde från varandra eller ej). Ger de inte samma resultat så är något av dem eller båda inte bra.