Instrumentvariable Flashcards
Endogene vs eksogene variable
Endogene variable: Variable, der er korreleret med fejlledet → dvs. noget inde i vores model
Eksogene variable: Variable, der ikke er korreleret med fejlledet (dem der er gode instrumenter)
Hvad er intuitionen i IV-estimation?
IV-estimation gør brug af ekstra variable (instrumenterne) til at isolere den “gode” variation i X (som ikke er korreleret med fejlledet) og gør os dermed i stand til at lave mere konsistente estimater i vores regressioner.
Hvornår kan vi bruge IV til at estimere kausale sammenhænge?
Når vi har et instrument, der er både:
- Relevant
- Eksogent
Hvornår er et instrument relevant?
Relevant → kan forklare noget variation i Y.
Instrumentet Z skal kunne forklare noget af variationen i X - helst så meget som muligt!
Hvornår er et instrument eksogent?
Når instrumentet er ukorreleret med fejlleddet → det må kun påvirke vores Y gennem vores X. Så instrumentet må ikke have en selvstændig påvirkning på Y.
Hvad betyder det at lave en two stage least squares (TSLS)?
En måde at estimere regressionskoefficienter på, der foregår i 2 stadier:
Stadie 1: Sammenhængen mellem Z og X: Isolerer den “gode” variation i X ved hjælp af instrumentet
Stadie 2: Sammenhængen mellem “det gode X” og Y: Brug den “gode” variation i X til at estimere din regressionskoefficient
Dvs. det ender med en normal regression, hvor vi bare kun bruger den gode del af X (der ikke er korreleret med fejlledet) og dermed får mere præcise og konsistente estimater af vores regression
Hvad er et svagt instrument?
Et, der ikke er relevant → altså et hvor der er lav sammenhæng mellem X og Z.
Hvordan vurderer man, om ens instrument er svagt?
Tommelfingerregel til at tjekke for svage instrumenter:
En F-test score på lavere end 10 indikerer et svagt instrument
Hvad er problemet med et svagt instrument
Hvis instrumentet er svagt, så gør det vores TSLS-estimator ustabil.
Det er noget med ligningen for esitmatoren: her står sammenhængen mellem X og Z i nævneren (nederst). Dvs. når den sammenhæng bliver mindre, så dividerer vi med mindre, og kommer derfor til at overestimere vores effekt.
Hvordan kan man teste om ens instrument er godt?
Kør placebo-test: hvis dit instrument fx er regn i år, så prøv at køre din regression med regn næste år (som helst ikke skulle skabe effekter)
Balancetest på forudgående variable: vis at dem, der scorer lavt/højt på instrumentet ligner hinanden
Kvalitativt data
Hvilke to tidspunkter bruger man typisk IV-estimation?
1: Supplement til OLS: Hvis du har et observationsstudie, hvor du gerne vil lave supplerende analyser, der gør dine resultater mere plausible
- Fx Hariri-studiet
- Han har en almindelig OLS-sammenhæng, som han ikke tror er helt unbiased, og derfor supplerer han med en IV-estimation
- Eksperimenter: Til at undersøge den “rene” treatment effekt for dem der complier med treatment-status
- Dvs. lave et CACE/LATE-estimat
Hvad er CACE/LATE-effekter?
CACE: Complier average treatment effekt
LATE: Local average treatment effekt
Problemer med generaliserbarhed i IV-estimationer
CACE/LATE-estimater har nogle konsekvenser ift. generaliserbarhed:
Vores effekter er kun estimeret på baggrund af de enheder, hvor X er påvirket af Y.
- Fx i regn-eksemplet: Vi undersøger kun effekten i de lande, hvor regn faktisk påvirker BNP. Så effekten er faktisk kun generaliserbar til disse studier.
Eksperimenter:
- De enheder, der complier med indbydelsen: dvs. de enheder, der skulle have fået treatment (Z) og deltager i treatment (X).