4. IV Flashcards

1
Q

Enligt youtube-video

om vi har Y = b0 + b1X1 + e

förklara grundkonceptet med IV

A

Förmodligen håller inte E(e|X1) = 0. Det betyder att det finns varians mellan e och X1.

Istället för att bara köra en OLS vill vi bara använda den variationen i X som INTE är korrelerad med e.

Med IV försöker vi hitta någonting (ett instrument) som naturligt slumpar X till våra observationer. Något som ger oss EXOGEN variation.

Ett instrument är en variabel som bestämmer den endogena regressen (X) men som bara påverkar den beroende variabeln genom denna och inte i sig själv.

Det betyder att Z påverkar Y genom X (ska vara stark korrelation mellan Z och Z) men inte i sig själv eller genom e.
Z är oberoende av e.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Enligt youtube-video

Vilka delar består kan vi tänka att den endogena variabeln (X) består av i IV världen?

A

3 delar:

  1. Den delen av X som är korrelerad med e (den problematiska delen)
  2. Den delen av X som är korrelerad med Z och oberoende av e.
  3. Den delen som varken är korrelerad med feltermen eller instrumentet.

(IV gör att vi bara använder del 2. i får beta).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Enligt youtube-video

VIlken behandlingseffekt ger iv?

A

Det ger INTE den genomsnittliga behandlingseffekten utan LATE (Local average treatment), den genomsnittliga behandlingseffekten på gruppen som påverkades av behandlingen. Alltså de som gick på en skola om de fanns i närheten.
Om denna gruppen skulle skilja sig från gruppen som skulle gå i skolan även om de inte bor nära, så är LATE skiljd från ATE.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Enligt youtube-video

Kan man testa om ett instrument har en direkt effekt på den beroende variablen?

A

Om det är så har man inte ett validt instrument.

Det är väldigt svårt att testa detta.

I videon säger han att om man har mer än ett instrument kan man använda båda. De ska då ge ungefär samma resultat.
= Sargan test eller Wu-Hausman test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Om vi har Y=β0 + β1X1 + π1W1 +… + u

men vi kan inte observera W1. Vad gör IV?

A

The IV solution is to isolate variation in X1 which is unrelated to W’s (och implicit e?). The variable which does the “isolating” is the instrumental variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vilka tre conditions do the instrument Z need to satisfy?

A
  1. Z is as good as randomly assigned.
  2. Har ingen direkt effekt på Y. Dvs, Z satisfies the EXCLUSION RESTRICTION, = it does not appear as a separate regressor in the long regression we like to run.
    Y=β0 + β1X1 + δZ + π1W1 + … + u
    where δ=0 (the instrument cannot have an direct effect on the outcome Y but it must go only via X: path diagram).
  3. Z affects the endogenous regressor X1.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad menar han med Z har en exclusion restriction?

Beträffande IV

A

it does not appear as a separate regressor in the long regression we like to run.
Y=β0 + β1X1 + δZ + π1W1 + … + u
where δ=0 (the instrument cannot have an direct effect on the outcome Y but it must go only via X: path diagram).

Den är alltså exkluderad från ekvationen.

(think of demand and supply, you need a variable that affects supply (weather) but not demand to identify the demand curve)

Det är vanligt att man överträder exclusion restriction.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka av alla IV conditions kan testas?

Kallas de testen?

A

Bara “Z affects the endogenous regressor X1.”
Detta är First stage regression.

Att Z är så gott som random assigned och Z inte har någon direkt effekt på Y kan vi bara argumentera för.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur gör man en first stage regression?

A

Man stoppar in sitt instrument och alla kontrollvariabler man vill inkludera sedan testar man om instrumentet har någon effekt på den endogena variablen. Dvs om Z påverkar X.
Det ska finnas en sån effekt och den ska vara stark, annars hr vi ett svagt instrument.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hur kan man på ett snyggare sätt formulera att “Att Z är så gott som random assigned och Z inte har någon direkt effekt på Y”?

A

E(u|Z)=0
Z is as good as random assigned

eller

E(u|Z,W) = E(u|W) Alltså, conditional mean independence.
Vilket betyder att Z är as good as random assigned conditioned on other factors (W).

Alltså antingen direkt orelaterad eller om man kontrollerar för saker.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vilka tre kausala effekter pratar man om i en IV setting?

Vad kallas förhållandena?

A

Den kausala effekten av Z på X (first stage)

Den kausala effekten av Z på Y (reduced form)

Den kausala effekten av X på Y (structural relationship)

Den är då den tredje som vi är intresserade av och vi använder IV för att få fram den. För denna behöver vi att exclusion restriction håller.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Garanterar en exprementiell variation att exclusion restriction håller?

A

Nej

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

om man tar reduced form fx/first stage fx får man

Vad kallas det mer?

A

The structural parameter.

IV estimatet är alltså ratiot mellan dessa.

Fungerar bara om vi har en endogen variabel och minst ett instrument. (just identified). Over identified fungerar också.

Detta kallas indirect least square.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad menas med overidentified model?

A

An overidentified model is a model for which there is more than enough information in the data to estimate the model parameters. …

If there are multiple instruments for a single endogenous regressor the model is overidentified. For example, if you have two instruments then you can get two (different) IV
estimates.

A model must be just-identified or overidentified in order to estimate parameters

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är ett under identifieerad modell?

A

Två endogena variabler och ett instrument. Då kan man inte estimera modellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är 2SLS?

A

With more than one instrument, 2SLS is a weighted average of the one-at-time (justidentified) estimates (In a linear homoscedastic constant-effects model, this is efficient
GMM).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vilka olika IV estimat finns?

A

Indirect least square, IV, 2SLS och GMM (vid GMM finns det många instrument)…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Hur många instrument och endogena variabler ska man ha enligt PER?

A

Ett starkt instrument och en endogen variabel. är det överidentifierat är det svårt att veta vad exclusion restriction egentligen är.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Förklara vad Wald estimator är?

A

Den enklaste formen av IV estimator där instrumentet är antingen på eller av. Dvs en Z = 1 eller Z = 0.

In case of a binary instrument (Z is either 1 or 0) and no additional control variables one can write the IV estimator as:

Biv = [E(Y|Z=1) - E(Y|Z=0)] / [E(X|Z=1) - E(X|Z=0)] = reduced_form/first_stage
Alltså
(Y_1 - Y_0)/(X_1 - X_0)

Fyra medelvärden.

Group data estimator, likt diff n diff.

20
Q

Hur fungerar det med att aggregera data och IV?

A

Thus if x is continuous, and we have a discrete instrument, Z, which takes on J different values, the IV estimation of the micro data model with J -1 dummy instruments is the same as:

ybar_j a + bxbar_j+v_j weighted by the cell size

Det blir alltså det samma som vanligt. En OLS blir IV.

When DD: The regressor defines the groups. The grouped data regression is OLS because all the variation in X is only at the group level. By aggregating Y we are not changing anything about X.

Continuous regressor, discrete instrument: now the instrument defines the groups. The grouped data regression is IV because we are changing the variation in X by aggregating.

ALLTSÅ som jag förstår det. Har vi ett instrument som är diskret, kommer vi göra den defeniera behandlingen. …typ.

21
Q

Säg att vi har [E(Y|Z=1) - E(Y|Z=0)] / [E(X|Z=1) - E(X|Z=0)] = reduced_form/first_stage

Hur vi tolka det? termer av hur lyckad behandlingen är….

Vad händer om bara 0.5 tar upp behandlingen i behandlingsgruppen?

A

Numerator represents the difference in the value of Y of those in the treatment group and in the control group.

The denominator represents the difference in the fraction of each group that takes up the treatment.

If only halve take upp the treatment, then the denominator i 0,5.

Hade alla tagit upp behandlingen har vi 1 i nämnaren och det är som en RCT… ?

22
Q

Varför delar man med first stage?

A

Man behöver skala. Har man en RCT med full complience behöver man inte skala det man har estimerat, nämnaren = 1.

Om folk kan opta in eller ut måste man skala med first stage.
Om t.ex bara 10% av deltagarna tog behandlingen, då måste man skala estimatet med 0.1 (alltså dela med 0.1) Man inflerar det alltså. “Om man hade haft full complience hade effekten varit: det man hittar skalar med 0.1 = full effekt.

23
Q

Vilken effekt visar reduced form?

[E(Y|Z=1) - E(Y|Z=0)] / [E(X|Z=1) - E(X|Z=0)]

A

Intention to treat. En downward biased effekt. Den visar alltså bara effekten av att vara assigned till behandlingen.

För att få själva treatment effekten måste man skala med first stage.

24
Q

Från artikel:

Vad är falsification test vid IV?

A

Although falsification tests in general can take many forms, there are two particularly useful strategies for testing the exclusion restriction in IV CER studies:

(1) investigating an alternative outcome that ought not to be affected by the treatment under study but would be affected by potential confounders that might be correlated with the proposed IV;

and (2) investigating an alternative population that again ought not to be affected by the treatment but would be affected by potential confounders.

25
Q

Hur kan man alltså tolka Waldestimatorn i termer av compliance osv?

A

The Wald estimator can be interpreted as representing the change in Y for the subset of observations who changed their value of the treatment X as a result of the differing Z.

26
Q

Om man hittar en effekt som är 0 i first stage, vad ska man då se i reduced form?

A

Denna ska vara noll också.

27
Q

Vad är falsification exercise?

A

Hittar man en sample där first stage effekten = 0 så ska man hitta en noll effekt i reduced_form också. Gör man det håller exclusion restriction.

28
Q

Fortsätt med Issues med IV och 2SLS.

A

weak instrument problem….

29
Q

Vad betyder det att korrelationen mellan vårt instrument och den endogena variabeln, x, är svag?

Vilken ekvation är svag som man kollar?

A

Vi har ett svagt instrument.

First stage.

30
Q

Om man har lika många instrument som endogena variabler kallas det att modellen är………?

Vilken effekt har svaga instrument i en sån här modell?

A

just identified.

Inget problem med svaga instrument om de inte är riktigt svaga.

31
Q

Vad är ett annat sätta att kolla om man har svaga instrument vid en just identified model?

A

Kolla så p-värdet reduced form är samma som p-värdet i second stage (där man regressar fitted-X på Y). De ska vara lika för att det ska vara bra! De ska dessutom också vara signifikanta.

32
Q

Vilken effekt har Week instrument i overidentified model?

A

The 2SLS estimator with weak instruments is biased in small samples genom att:

2SLS is biased towards OLS with weak instruments

Estimated standard errors of 2SLS and IV estimators may be too small.

33
Q

Vad ska man kolla på när man studerar resultaten vid en IV studie?

Eller när man själv publicierar recultat…

A

Report the first stage and think about whether it makes sense. Are the magnitude and sign as you would expect?

Report the F-statistic (first stage) on the excluded instruments. The bigger this is, the better. Fs above 10 to 20 are considered relatively safe, lower Fs put you in the danger zone.
T^2 = F

Pick your best single instrument and report just-identified estimates using this one only. Just-identified IV is approximately median-unbiased.

Look at the coefficients, t-statistics, and F-statistics for excluded instruments in the
reduced-form regression of dependent variables on instruments. The reduced-form
estimates are just OLS, so they are unbiased. If the relationship you expect is not the reduced form, it ain’t there!

34
Q

Hur stor ska t-statistican vara i vilken ekvation för att man ska ha ett bra instrument?

A

t statisiken i vår FIRST STAGE ska större än roten hur 10. Ca 3,3.

35
Q

Vad händer om vårt exclusion restriction överträds?

Hur påverkar svaga instrument?

A

Biv = B + corr(u,z)/corr(z,x)

Om den övre termen är noll håller exclusion restriction (det är definitionen av den). Om man överträder det kommer man få “inconsistency”.

ju svagare instrument vi har, desto mer förstoras denna inkoncistency upp eftersom ju närmre nämnaren är 0, desto större blir talet.

36
Q

Om man har en RCT med full complience estimerar man en vanlig OLS och studerar skillnaderna i Y mellan de olika grupperna. Intention to treat är då den sanna effekten. Men, om man inte har full complience, hur gör man då?

A

Man estimerar en IV där vi väger med first state.

37
Q

Vad händer om om vi kör en regression och har en heterogeneous causal effect (B varierar i populationen) ?

A

???

38
Q

Vad är
Intention to treat

Average treatment effect

Treated on treated

Local average treatment effect

?

Vad ska vara uppfyllt för att man ska kunna få de effekterna?

A

Intention to treat = effekten av att vara assignat till behandlingsgruppen (kräver inget exclusion restriction, bara random sample)

Average treatment effect = den genomsnittliga effekten på en person i populationen (kräver random sample och exclusion restriction)

Treated on the treated = one sided compliance: de i kontrollgruppen kan ta behandlingen eller inte, men de kontrollgruppen kan inte ta behandlingen. (exclusion restriction och random sample måste gälla.
Man får denna effekt vid ett experiment där X är orellaterad till feltermen.

Local average treatment effect (LATE) = fångar bara de som verkligen påverkas av behandlingen, det är bara en speciell effekt för en speciell grupp. (förutom random sample och exclusion restriction kräver det också något som heter monotonicity.)

39
Q

Vilken effekt får man om man har heterogenitet i hos individer gällande behandlingen?

Vad betyder heterogenitet i det här fallet?

A

Vi får ett viktigt medelvärde av den kausala effekten.

the causal effect can vary from one unit i to another based on the unit’s circumstances, background, and other characteristics. For example, the effect of a medical procedure could depend on eating, smoking and drinking habits of the patient. In the case of population heterogeneity, we can think of i as a random variable, which, just like ui reflects unobserved variation across units.

What causal effect does OLS and IV estimate if there is population heterogeneity? Answer: In general, weighted averages of causal effects.

Man måste förstå hur man tror effekten ser ut i populationen för att förstå vilken typ av effekt man har hittat. Om det är en ATE eller LATE.

Har man heterogenitet kan det är det LATE man estimerar och då kan man inte generalisera effekten till populationen.

40
Q

Om man har en IV modell där effekten varier i populationen, vilken effekt får man, hur ställer man upp den givet att vi har

Xi = a0 + aiZi + vi

A

B^=E(Biai)(Eai)

Det är den viktade genomsnittliga effekten.

This ratio can be interpreted as a weighted average of the individual causal effects βi. The weights are πi which measure the degree to which the instrument influences whether the unit receives treatment. Thus, the 2SLS estimator is a consistent estimator of a weighted
average of the individual causal effects, where the units who receive the most weight are those for whom the instrument is most influential

41
Q

Hur hittar man instrument?

A
  1. Ekonomisk teori. Genom teorin vet man att Corr(x,y) är stark osv men att E(u|Z) = 0.
  2. Man försöker hitta en kvasiexprimentiell design som ger oss instrumentet.
42
Q

OM MAN HITTAR ATT OLIKA INSTRUMENT GER OLIKA RESULTAT SÅ BETYDER DET DET ATT?

A

Får IV fungerar inte (Överträdelse av exclusion restriction). Men det gäller bara i en värld med konstanta effekter. Har vi heterogena effekter kan olika instrument fungera för olika delar av populationen.

Over Identified test vilar alltså på att man tror att vi har en homogen värld.

43
Q

Vad är 2SLS?

A

Denna är en modell då man estimerar effekten i 2 steg.

estimerar man X med Z, sedan tar man estimaten man får av X och estimerar Y.

Man isolerar då den exogena variationen i X.

Relevanta kontrollvaribler ska inkluderas i båda ekvationerna.

44
Q

Varför använder man skatt som instrument för att studera efterfrågeelasticiteten på cigaretter?

A

Skatt påverkar priset som påverkar efterfråga, men skatten påverkar i sig själv inte efterfrågan. Den uppfyller alltså kriterierna att corr(z,x)≠0 och corr(z,u) = 0.

Men, det kan dock fortfarande finnas omitted variabler man kan behöva lägga in.

45
Q

Vad kan man säga om 2SLS och standarderrors?

A

SE i andra steget med OLS är fel eftersom den inte förstår att det är andra steget av två. Kör man en 2SLS reg i programmet direkt, får man rätt direkt.

Man ska alltid ha robusta SE även här!

46
Q

Vad kallas IV estimatet när man delar effekten i reduced form med effekten i first stage?

A

Indirect least square.

47
Q

Får man samma estimat med Waldestimator och 2sls?

A

Nope, men de ska inte vara så olika. 2SLS går mot OLS.