L11 DiD Flashcards

1
Q

Hvad er interaktionsleddet i DiD udtryk for?

A

Den estimerede kausaleffekt. Forskellen mellem to grupper. Y stiger med B3 (interaktionsleddet) mere i treatmentgruppen end kontrol fra periode 1 til 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er en klyngerobust standardfejl?

A

Inden for bestemte klynger, vil der være afhængighed (Rander 2010 og Randers 2020). Det tages der højde for i estimation af standardfejlen (den bliver lidt større).

Vi har færre uafhængige observationer end det ser ud til.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvor mange observationer skal du have for at bruge klyngerobuste SE?

A

n>50

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Kan man bruge klyngerobuste standardfejl i andre sammenhænge end DiD?

A

Ja, hvis du har mistanke om at folk fra KBH er lidt afhængig af KBH kommune vs. Esbjerg eks.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvordan kan Difference-in-Differences bruges til kausal inferens?

A

Sammenligning af to grupper med antagelsesvis parallelleforløb, hvor den ene oplever en form for treatment. Treatmenteffekten kan nu sammenlignes mellem de to grupper ved den kontrafaktiske udvikling, som hvis de ikke havde fået treatment og derfor ageret som kontrolgruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvilke data kræves ifbm. Difference-in-Differences?

A

Paneldata (flere enheder over tid)

Variation i både tid og rum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er et naturligt eksperiment?

A

Et naturligt eksperiment er når treatment er fuldstændigt tilfældigt tildelt (lotteri), men uden dette er manipuleret fra forskerens side.

Eks. hvilke amerikanske soldater, som skulle til Vietnam.

Kvasieksperimentet er fortsat naturlig tildeling af treatment, men ikke 100% rent tilfældighed.

Eks. 9/11 og PTSD.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Er DiD en design- eller kontrolorienteret løsning?

A

En designorienteret løsning! Pr. design er der i DiD kontrolleret for alt tidsinvariant (de “normale” kontrolvariable).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad er et før-efter-design og hvilke problemer følger med?

A

Undersøgelse af den samme enhed over tid ved brug af paneldata (sammenligner altså samme enhed før treatment og efter treatment)

Det er en fordel at tidsinvariante faktorer holdes konstante pr. design, men problem ift. at tid nu er en kilde til selektion –> måske har andet en treatment ændret sig over tid.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvilke to muligheder er der for at løse det fundamentale problem med kasual inferens?

A

Løsning pr. design: DiD og eksperiment

Løsning med kontrol: MLR (tværsnit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Sammenlign tværsnit og Dif-Dif

A

Tværsnit: variation i treatmentstatus og rum

Dif-dif: vairation i treatmentstatus, rum OG tid

Ergo: de to forskellige designs kan give os forskellige konklusionen om en effekt af treatment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er paneldata?

A

Ved paneldata har du data fra de samme enheder for flere tidsperioder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvilke problemer løser Dif-Dif, som hhv. er problematiske ved tværsnit og før-efter-design?

A

Tværsnit: problem ift. enhedernes potentielle outcomes ift. hinanden

Før-efter-design: problem ift. forskelle i potentielle outcomes over tid (muligvis har andet end treatment ændret sig).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er forskellen på tidsvariante og tidsinvariante forhold? Hvilken rolle spiller de i DiD?

A

Tidsvariante: ting som ændrer sig over tid (fra t=0 til t=1).

Tidsinvariante: forhold som er givet uagtet af tid (personlighed, intelligens, alder mv.). Typiske demografiske forhold.

DiD har pr. design kontrolleret for alt tidsinvariant (juhu), mens den ved overholdelsen af antagelsen om parallele trends også har kontrolleret for tidsvariante forhold (juhux2!). Grupperne påvirkes dermed ensartet af tidsvariante faktorer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad sulen er repeated cross-section data?

A

Tværsnitsdata på flere tidspunkter. Fra samme population men forskellige stikprøver: valgundersøgelsen eksempelvis!

Kan behandles som DiD data, hvis man tager på kommuneniveau (altså forskellige enheder i kommunen, men samme kommune).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er intuitionen bag DiD?

A

Vi antager at kontrol- og treatmentgruppen følger samme udvikling (parallelle trends). Derfor kan vi bruge kontrolgruppen som et ‘benchmark’ for treatmentgruppens udvikling

I den kontrafaktisk situation, at treatmentgruppen ikke havde fået treatment, hvad havde deres udvikling så været? Den estimerede kausaleffekt delta er udtryk for treatmentgruppens udvikling korrigeret for kontrolgruppens udvikling

17
Q

Hvorfor er DiD nice?

A

(hvis antagelser holder)
Unbiased
Fejlledet er ukorreleret med x
Vi kan estimere om effekten er signifikant

Find selv på flere –> we <3 DiD

18
Q

Hvilke antagelser gælder der for DiD?

A

Relativt få antagelser:

  • Variation i data (tid og rum ift. treatment)
  • Klyngerobuste SE (ift. heteroskedasticitet og afhængige observation)
  • Fravær af sampling bias (pas på små stikprøver)
  • Parallelle trends

Ift. kontrolvariable gælder alle antagelser som normalt (linearitet mv…)

19
Q

Hvad gør man helt matematisk, når man udregner effektestimatet?

A

Treatmentgruppens udvikling MINUS kontrolgruppens udvikling

Vi ender altså med treatmentgruppens udvikling korrigeret for kontrolgruppens udvikling (i det omfang vi accepterer at kontrolgruppen er et bud på, hvad der ville være sket treatmentgruppen, hvis ikke den var blevet udsat for treatment)

20
Q

Hvad er interaktionskoefficienten udtryk for i DiD output?

A

Den estimerede kausaleffekt af treatment (givet antagelsen om parallelle trends).

21
Q

Hvad er stata-kommandoen, hvis du vil lave en dif-dif-reg?

A

reg y TG##tid, cluster(id)

22
Q

Hvad er klyngerobuste standardfejl og hvornår er de relevante?

A

Løser problemer med heteroskedasticitet og afhængige observationer.

Den autokorrelation, som givet vis vil være mellem mig nu og mig før i tiden, tages der højde for, ved at kigge inden for samme ‘klynge’.

De er gode ved DiD-design.

23
Q

Hvordan vil du tolke regressionsoutputtet (B1, B2, B3 og konstant)?

A

B1: Forskellen mellem treatment- og kontrolgruppen til tid=0 (forskellen i udgangspunktet)

B2: Effekten af tid, når treatment=0 (altså effekten af tid for kontrolgruppen)

B3: Effektestimatet. Hvad er effekten af treatment

Konstant: y, for referencekategorien for både tid og TG (altså kontrolgruppen til tid=0)

Rækkefølge til eksamen (konstant –> beta2 –> beta 1 –> beta3)

24
Q

Hvordan kan du udvide dit DiD-design?

A

Ved enten at kigge på langtidseffekter at treatment eller kigge på pre-treatment perioder + kontrolvariable (maksimering af intern validitet).

Martin vil altid gerne have pre-treatment perioder ift. antagelsen om parallelle trends!

25
Q

Hvad er samplingbias, og hvornår skal vi være opmærksomme på det ift. DiD?

A

Den bias, der opstår, hvis man trækker en ‘skæv’ stikprøve ift. populationen.

Man skal særligt være opmærksom på samplingbias ift. repeated cross-section-data på højere end individniveau (eks. kommunalt niveau). Fordi vi godt kan bruge undersøge forskellige individer over tid fordi de eks. bor i samme kommune og vi ønsker at sammenligne kommuner, så må vi sikre at stikprøverne gennemsnitligt er ens (fravær af samplingbias)

26
Q

Hvad siger antagelsen om parallelle trends? Hvordan undersøges den?

A

Treatment gruppen havde fulgt kontrolgruppens udvikling, havde de ikke modtaget treatment. Holder parallelle trends kan vi tale om en kausal effekt.

Teoretisk argument

  • er treatment ‘as if’ random
  • er tildeling af treatment ukorreleret med potentielt outcome?
  • naturligt eksperiment?

Empirisk argument

  • pre-treatment data (fulgte de før i tid?)
  • kontrolvariable (tidsinvariante) og koefficienternes sensitivitet
27
Q

Hvordan transformerer man sit data, så man kan bruge det til DiD-analyse?

A
  • append- : lægger to datasæt sammen, hvis man har data fra to tidsperioder
  • reshape long- : reskalerer data fra wide til long, ofte ift. id og tid. Enhedens værdier vises flere gange (én gang pr. tidsperiode)
28
Q

Hvordan laver man en figur i stata til dif-dif?

A

toway-scatter (punkter til de forskellige tidsperioder) “scatteri” for at lave en linje til hhv. kontrol, treatment og kontrafaktisk

29
Q

Hvad er konsekvensen af brud på antagelsen om uafhængige observationer?

A

Da vil vi undervurderer p-værdien. P-værdien skulle dermed have været højere, og vi burde måske have forkastet vores H0.

30
Q

Hvad sker der, hvis antagelsen om uafhængige observationer er brudt?

A

VAR(X) bliver mindre –> Større standardfejl –> mindre t-værdi –> større p-værdi

Hvilket betyder, at vi laver flere type-II-fejl (accepterer nulhypoteser, vi ellers ville have forkastet

VAR(X) bliver mindre, fordi obs nu er afhængige og derfor vil svare det samme og observationerne vil derfor ikke sprede sig så meget som ellers forventet