Matching Flashcards
Hvad er intuitionen i matching?
Matching er en metode, der forsøger at skabe balance på observerbare kovariate mellem en treatment og kontrolgruppe i ikke-eksperimentel data → forsøger at tilstræbe sig antagelsen om ens potentielle outcomes.
Hvilke variable skal man matche på?
Samme tankegang som kontrol
- De variable, der skaber selektionsbias.
- Altså variable, der påvirker både X og Y.
Hvilke metoder kan man bruge til at matche?
Exact matching: Man finder et præcist match til hver enkelt enhed. Selvfølgelig ideelt, men svært i praksis.
Mange enheder vil ikke kunne finde et match.
Propensity score
Lineær propensity scores
Hvad er propensity score matching?
Propensity score: den mest anvendte metode. Summerer alle kovariaterne sammen til én skala: sandsynligheden for at blive treated givet værdierne kovariaterne.
Vi sammenligner så folk med ens propensity scores (sandsynligheden for at blive treatet) –> svarer i en hvis grad til et mini-eksperiment (i hvert fald ift. de observerbare kovariater).
Antagelsen om common support
Distributionen på kovariater for både treatment og kontrolgruppe skal gerne være ens –> ellers ender du med at basere dine resultater på ekstrapoleret data.
Jo bedre common-support/overlap jo mindre modelafhængighed har du → hvilket er godt.
Hvordan kan man forstå matching som en pre-processing teknik?
En måde at “trimme” sin data på: Man kan bruge matching til at fjerne observationer, hvor der ikke er common support.
Dette gør vores efterfølgende estimationer mindre modelafhængige.
Hvilke fordele har matching som metode?
Matchings fordele ift. andre metoder (fx regression med kontrol, instrumentvariable)
- Matching kan være et brugbart værktøj at kombinere dine regressioner med kontrol.
- Matching kan highlighte områder/værdier på kovariate, hvor der ikke er tilstrækkeligt overlap mellem treatment og kontrolgruppe, og hvor estimater derfor baserer sig på ekstrapolering.
Er matching bedre end vanilla kontrol?
Nej - ikke ift. at estimere kausale effekter.
Det er stadig de samme antagelser, der skal være opretholdt: fuldstændigt fravær af selektionsbias på uobserverbare variable, når vi har kontrolleret for observerbare. Dvs. at vores treatment er så godt som tilfældigt tildelt –> urealistisk!
MEN: matching har fordele ift. at vise os, hvor vores data er ekstrapoleret.