Kausal inferens Flashcards
Hvad er kausal inferens?
Det er studiet af kontrafaktiske udfald: vi vil gerne sige noget om de udfald, der VILLE være sket, hvis tingene var gået anderledes.
En kausal-effekt er forskellen mellem en enheds potentielle outcome, hvis vedkommende er treatet, og det potentielle outcome, hvis vedkommende er untreated.
- Dem kan vi dog aldrig observere begge to.
Hvad er god kausal inferens?
Man laver god kausal inferens ved at lave studier, hvor det er plausibelt at antagelsen om ingen selektionsbias holder
Potentielle outcomes
Hver enhed har to potentielle udfald afhængig af, om man er blevet treated eller ej
Vi kan kun observere ét af disse to potentielle udfald: vi kan observere enheder når de enten er treated eller ikke treated
Hvad er det fundamentale problem med kausal inferens?
Vi kan ikke se de kontrafaktiske scenarier: vi kan kun se det ene scenarie for hver enkelt enhed, og altså ikke begge potentielle outcomes.
Average treatment effect (ATE)
Den gennemsnitlige kausale effekt på tværs af alle vores enheder.
Gennemsnittet i treatmentgruppen minus gennemsnittet i kontrolgruppen.
Selektionsbias
Forskelle i gennemsnittet på Y mellem treatment- og kontrolgruppen selv HVIS ingen var blevet treatet.
Det måler om der er nogle bestemte typer af enheder, der selekterer ind i treatment: er der fx nogle lande, der er mere tilbøjelige til at blive demokratier end andre grundet nogle tredjevariable?
DAGS
En stringent måde at tegne kausal-figurer. Man vil vise effekten mellem en masse forskellige variable.
En pil der peger i en retning illustrerer en direkte kausaleffekt (i en bestemt retning) A –> B = A har en kausaleffekt på B.
DAGS bruges til at simplificere vores tanker omkring kontrolvariable og inddragelsen af disse.
Colliding variabel
Collider: Når en tredjevariabel (Z) er påvirket af begge vores variable (både den uafhængige og den afhængige).
Skal vi IKKE kontrollere for → det vil introducere post-treatment-bias
Confounding variabel
Confounder: En tredjevariabel (Z) påvirker begge dine variable (både den uafhængige og den afhængige)
Skal vi kontrollere for for at mindske selektionsbias og spuriøse sammenhænge.
Identifikations-strategi
Under hvilke betingelser reflekterer en sammenhæng en kausaleffekt?
Hvilke antagelser skal man gøre sig, for at man kan antage, at den sammenhæng man har fundet er udtryk for en kausal effekt?
Trade-off mellem intern og ekstern validitet
Tidligere har folk påstået, at der er et trade-off mellem intern og ekstern validitet ift. eksperimenter (god intern, dårlig ekstern) og “almindelig” multipel regression (dårlig intern, god ekstern).
MEN: dette stemmer ikke. Multipel regression er ofte ikke bedre end eksperimenter ift. ekstern validitet: når man først får isoleret den del af en population hvor positiviteten er opretholdt, så minder den ofte meget om den specifikke subpopulation hvor man fx har udført et eksperiment.
Pseudo-facts problemet ved “vanilla regression”
At man får konkluderet ting, der ikke er sikre facts. De ting der kommer ud af regressionen er ikke nødvendigvis sandheden. Der mangler engagement ift. at sikre sig, at det er rigtigt
Fx fordi man inddrager forkerte kontrolvariable eller mangler at inddrage flere kontrolvariable
Pseudo-generaliserings problemet ved “vanilla regression”
Flere enheder er ikke nødvendigvis større generaliseringspotentiale: den effektive stikprøve er oftest langt mindre
Alle de enheder man har vejer ikke lige meget/informerer ikke lige meget om estimatet
- Variation i den uafhængige variabel: Nogle bestemte cases driver variationen
- Kontrolvariable: Når du kontrollerer så tager du al variation i den uafhængige variabel, der hænger sammen med kontrolvariablen, og så forsvinder den variation - så den variation er ikke med, når du estimerer din kausaleffekt