Lecture 8 (böckerna) Flashcards
Hur kan man studera effekten sommarskola om det är födelsedatumet som bestämmer om man ska gå sommarskola eller ej?
Om t.ex huruvida det beror på om man är född före juni eller inte bestämmer om man ska gå på sommarskola eller ej kan man använda RD för att studera effekterna av detta. Man borde få en diskontinuelighet i regressionen vid tröskelvärdet.
Man kan då jämföra vårderna för studenter som ligger precis ovanför med studenter som ligger precis nedanför.
Vad är fuzzy och sharp RDD?
• Sharp RDD = här är det en tydlig switch för behandling elle inte behandling när running variabel passerar en tröskel eller ej. D bestäms alltså helt av a.
Vid en sharp design kommer behandlingen helt bestämmas av tröskelvärdet. Då t.ex INGA ovanför tröskeln får behandlingen medan ALLA nedanför för osv. Hoppet i Y vid tröskeln är alltså lika med den genomsnittliga behandlingseffekten för subpopulationen.
————————————————————————————————————
• Fuzzy RDD = här ökar eller minskar sannolikheten för behandling ju närmre eller längre ifrån tröskeln man kommer.
Vid en fuzzy design kommer inte tröskeln vara helt avgörande om man får behandlingen eller ej. Vissa ovan för kommer ändå att få det och vissa under kommer inte att få det.
Man kan här använda instrumentvariabler för att lösa eventuella problem.
Skillnaden mellan sharp och fuzzy design är alltså¨att vid fuzzy så kommer personer som korsar tröskeln exponeras mer för behandlingen medan vid sharp design så utgör tröskeln en tydlig cut of där endast de som passerar tröskeln behandlas, lika mycket.
Vad är iden bakom RDD?
RDD baseras på idéen att rigida regler skapar naturliga experiment.
Man ar en dummyvariabel som indikerar behandling eller ej Da. Den antar värdet 1 om a >tröskel och 0 om a < tröskel. T.,ex.
Vilka två viktiga features finns hos RDD gällande behandlingsstatus?
Behandling indikeras av dummyn = ”Da” där D = 1 a > tröskel och 0 om a < tröskel.
- Behandlingsstatus är en deterministisk funktion av a. Vet vi a så vet vi Da.
- Behandlingsstatus är en diskontinuerlig funktion av a, detta då det inte spelar någon roll hur nära a är tröskeln, Da förblir oförändrad till tröskelvärdet är uppnått.
Vad är ”running variabel”?
bestämmer om det är behandlingen eller inte (a) kallas för running variable.
Givet Y = α + ρDa + e och att det är en bra RDD.
Hur ska man tolka ρ?
Man ska tolka ρ som den kausala effekten av behandlingen
Ska man använda linjär eller icke-linjär modell vid RDD?
Det vet man inte, det bästa är att titta på datan och fatta ett beslut där efter. Visual RD.
Vad menas med parametrisk RD?
Här sätter man ett fönster för hur långt ifrån tröskeln man ska observera värden. Man jämför då medelvärden precis vid tröskeln.
Vad är för- och nackdelar med att sätta en liten eller stor bandbredd vid RDD?
Ju mindre fönster man sätter, desto mindre precision får man dock, pga litet sample. Det är här en trade off. Man kan tänka att ju större sample man har desto snävare fönster kan man sätta. Man sätter en ”bandbredd”.
a0 - b <= a <= a0 + b
Alltså, optimalt är att tänka att bandbredden är en funktion av samplestorleken, där större sample -> mindre fönster.