F3 - designs til effektevalueringer Flashcards

1
Q

Hvad er forskelle og ligheder mellem RDD og et felteksperiment?

A

Forskel: I felteksperimentet har forskeren kontrol over tildeling af treatment. I RDD udnytter man den empiriske situation ift. tildeling af treatment (kræver dybdegående kendskab til casen)

Lighed: Naturlige omgivelser. As-if random ift. kontrol- og treatmentgruppe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er propensity score matching?

A

”Socioøkonomiske tvillinger”. Der dannes en kontrolgruppe, der ligner treatmentgruppen (flugter med potentiel outcomes tankegang).

Individer/observationer matches, hvis de har lignende sandsynlighed for at få treatment (propensity). PSM udregnes på baggrund af flere baggrundsvariable, som tilsammen udgør en sandsynlighed for at få treatment.

Én score, frem for flere kontrolvariable.
Ikke post-hoc identifikation af variable.
Husk at undersøg, om matching er lykkedes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er udfordringerne ved matching?

A

Vi kan ikke matche på uobserverbare variable (fortsat selektionsbias).

Det kræver store datamængder, da ikke alle individer inkluderes i den videre analyse.

Kræver common support. Altså overlap mellem kontrol og treatmentgruppen ift. deres PSM.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er et RDD-design?

A

Et kvasi-eksperiment, hvor der ikke er kontrol over tildelingen af treatment, men hvor en tærskelvariabel og en tærskelværdi afgør hvem, som tilhører kontrol- og treatmentgruppen.

Deterministisk: Præcis viden om tærskelværdi
Fuzzy: Usikkerhed omkring hvem, som tilhører kontrol og treatment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er styrker og svagheder ved RDD?

A

Styrke: Høj intern validitet. Hvis der ikke er selektion omkring tærskelværdien, er treatment ‘as-if random’.

Svaghed: Lille generaliseringspotentiale (kun omkring tærskelværdien). Kræver desuden store datamængder, pga. afgrænsning af kontrol- og treatmentgruppe. Kræver stort empirisk kendskab til casen.

Udfordring: Hvor skal tærskelvariablen moduleres? Hvordan stort skal ‘vinduet’ for deltagelse være på tærskelvariablen?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvor store kan kontrol- og treatmentgruppen være ved et RDD?

A

Det er et trade-off mellem statistisk power og overholdelse af antagelse ‘as-if random’.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvilke antagelser er der ved et RDD?

A

Overordnet set: Placering af observationer omkring tærskelværdien skal være ‘as-if random’.

Fravær af selvselektion og intentioner om at sortere enheder bestemt fra tærskelværdiens side.

Tegn på sorting-mekanisme: Hvis observationerne klumper sig lige før eller efter tærskelværdien.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er et DiD-design?

A

Ved et DiD-design udnytter man data med en tidsdimension. Man bruger kontrolgruppens udvikling som et kontrafaktisk bud på treatmentgruppens udvikling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad er styrker og svagheder ved DiD?

A

Styrker: Høj intern validitet. Alt tidsinvariant holdes konstant pr. design. Sandsynligvis holdes alt tidsvariant ligeledes konstant.

Svaghed: Man kan kun sandsynliggøre parallelle trends - ikke endeligt be- eller afkræfte. Kræver data over flere tidsperiode (også gerne pre-treatment). Kræver fravær af eksogene chock, som påvirker grupperne forskelligt og fravær af forurening.

Udfordringer: Findes der en valid kontrolgruppe? Generaliseringspotentialet. Eksogene chock.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvilken antagelse ligger bag DiD og hvordan kan det undersøges?

A

Antagelsen om parallelle trends. Treatmentgruppen antages at have udviklet sig som kontrolgruppen ved fravær af treatment.

Ikke ens potentielle outcomes, men samme udvikling i potentielle outcomes.

Undersøges med pre-treatmentdata. Derudover kan man inkludere gode kontrolvariable - resultaterne skal ikke ændre sig på baggrund heraf.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvilke forskellige metoder er der til matching?

A

Overordnet set afstandsmatching eller propensity-score-matching.

Derudover vægtning eller udvælges af kontrolmatches (k-afstands-matching, en-til-en elller radius).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvilke antagelser er der bag matching?

A
  1. Efter matching er tildeling af treatment uafhængigt af potentielle outcomes
  2. Der er common support - altså et passende antal matches.
  3. Balance efter matching på alle momenter.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er styrker og svagheder ved PSM-matching?

A

Styrker: En samlet score, som konstrueres på forhånd frem for ad-hoc bagefter.

Svagheder: Kræver mange observationer ift. common support. Baggrundsvariable skal være godt målt. Det er ikke muligt at matche på uobserverbare variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er styrker og svagheder ved før/efter-design?

A

Styrke: Kontrol for alt tidsinvariant. Godt, hvis outcome-variabel er stabil.

Svagheder: Sensitivt for tidseffekter, naturlig udvikling, eksogene chock - generelt fravær af ‘alt andet lige’ i perioden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er styrker og svagheder ved tværsnitsdata?

A

Styrker: Få, men dog mulighed for kontrolvariable. Husk Rubin ift. hvordan observationelt data kan komme i nærheden af kausale effekter.

Svagheder: Ingen kontrol over tildeling = selektion ind i treatment. Ingen kontrol for uobserverbare variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Kan matching genskabe eksperimentelle resultater?

A

Peikes et al. (2008) sammenligner et felteksperiment med matching. De finder ikke samme estimater. Dog randomiseringsbias ved eksperiment.