1.Causality Flashcards
Förklara vad som menas med en ”model-based” approach beträffande causality.
Denna approach kallar Per för Lef-hand side econometrics eftersom den fokuserar på vad som bestämmer Y (kapital, teknologi arbete osv).
Kausalitet existerar endast teoretiskt där x påverkar y.
Man startar med en ekonomisk modell som t.ex
Hi = si^α
Där hi = är individens arbetsinkomst och
Si är individens år i skolan.
Dessa består i sin tur av variabler och parametrar… man maximerar och får fram en regressions modell av typen
Yi = B0 + B1Xi + ui
(Litte luddigt)
Den modelbaserade approachen kräver mycket antaganden för att adressera kausalitet. Men parametrarna i regressionen är å andra sidan precis definierade i termer av ekonomisk teori. T.ex Beta osv, de representerar en riktig ekonomisk effekt som går att generalisera (över tid och rum) osv. Det ger den här approchen hög extern validitet.
Man kallar det för en ”deep parameter”. Man kan därför säga Beta är en funktion av exempelvis elasticiteten i humankapitals funktionen osv.
Här måste man som tidigare nämnt göra massor av antaganden, man använde OLS så det gäller att man inte har missat att exkludera någoin variabel, då man kommer få Omitted variabel bias.
Vilket är det matematiska huvudantagandet beträffande unbiasness och konsistens för OLS estimatorn?
Vilken typ av pålitlighet ger detta?
Conditional mean zero
E[u|X] = 0 alltså att medelvärdet av u givet X är lika med noll.
Detta ger att Cov(ui, Xi) = 0 -> X är exogen, dvs att u och X är orellaterade.
Ger:
Internal validity.
Om E[ui|X] inte är 0, vad säger det om X?
Att X är endogen.
Vad betyder det att E[ui|Xi] = 0?
Vilken tolkning kan man ge en regression om detta håller?
- Det finns inga andra omitted explanetory variables.
- Det är korrekt funktionell form.
- Inget sample selection bias.
- Ingen omvänd kausalitet
- Inga mätfel i X
OM allt detta håller har man alltså conditional mean zero. Det betyder att X har en kausal effekt på Y. Man kan alltså tolka Beta kausalt.
Hur ser conditional mean zero ut om man har många variabler?
E[u|X1, X2,…,Xn]
Allt som stoppas in i regressionen måste vara orellaterat till feltermen för att man ska kunna tolka det kausalt.
Vad är omittidvariable formulan och vad betyder den?`
Νär har vi ingen sådan, givet formulan.
Den beskriver förhållandet mellan regressionsestimatet… ?
Cov(Y,X)/Var(X)
Vi tänker oss att vi har den sanna regressionen
Y = B0 + BX + υW + v
Skulle vi dock estimera regressionen utan W skullle vi ha
Cov(Y,X)/Var(X)
Vilket är lika med B^ = β + υπ
Enligt tidigare kurs:
Β^ = B + υ(cov(X1,W1)/var(x1)
Där π är effekten av W på X
Vi har ingen omitted variabel bias om υ = 0 (dvs, W påverkar inte Y.) eller cov(X,W), dvs, det finns inget samband mellan X och W.
Detta är dock bara sant vid ett randomiserat experiment.
Vad är essensen av designbased approach?
Man har en manupulation. Vi tänker oss två världer, en där personnen fick behandlingen och en där personen inte fick behandliongem. Så jämför vi utfallet i Y i de båda världarna. Skillnaden är då effekten av X.
Hela grejen här är att vi skapar en manipulation för att kunna utttala oss om hur X påverkar Y.
Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.
Vad säger då Y0i och Y1i?
Individnivå.
Y1i är Det potentiella utfallet vid behandling,
Y0i är det potentiella utfallet utan behandling.
Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.
Hur skriver vi en ekvation som visar det observerade utfallet i Y?
Hur ser det ut när X = 0, respektive X = 1?
Individnivå = unitlevel
Yi = XiY1i + (1-Xi)Y0i
Yi = XiY1i + Y0i - XiY01 ?
Om X1 = 0 försvinner första och sista termen och
Yi = Y0i, dvs Yi = det potentiellas utfallet utan behandlingh.
Om X = 1
Kommer vi ha kvar det potentiella utfallet utan behandling plus skillnaden mellan det potentiella utfallet med och utan behandlingen. Skillnaderna mellan dessa är den kausala effekten.
Dock är det omöjligt att se den kausala effekten på individnivå då vi inte kan observera någon kontrafaktisk utvecking på riktigt.
Vad är det fundamentala problemet av kausal inference?
Det omöjligt att se den kausala effekten på individnivå då vi inte kan observera någon kontrafaktisk utvecking på riktigt.
Man kan inte estimera kausala effekter på individnivå.
Om vi tittar på populationsnivå och Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.
Hur skriver vi en ekvation för ”average causal effekt”?
E[Y1i - Y01] = E(Y1i) - E(Y0i)
Om några personer (units = i) expomneras för behandlingen kan de andvändas för att få information om E(Y1i)
Precis som de som inte får behandlingen ger oss information om E(Y0i)
Den kausala effkten som är omöjlig att observera på individnivå kan man istället studera på aggregerad nivå i populationen, vi ser då ”average causal effx).
Vilket antagande måste vi göra för att kunna esatimera average causal effex?
Hur för man detta?
VI måste se till att X är orellaterade till andra faktorer.
Man konstriuerar randomiserade kontrollerade experiment.
Detta är ett sätt att få indipendence assumption att hålla.
Vi skapar en manipulation där X orsakar Y, detta är den design-baserade approachen.
Say that we would like to compare whether a student in a small class perform better than students in a large class. Suppose we have data on students test scores.
Låt Xi = 1 om det är en liten klass
Xi = 0 om stor klass.
Ställ upp ekvationen i ”potential outcom framework”. Alltså. E[Yi|Xi=……. osv som visar de observerade skillnaderna i ”testscoore”
Tolka de olika delarna av den
E[Yi|Xi=1]- E[Yi|Xi=0]
Detta är den observerade skillnaden i test score. Denna ekvation är då ekvivalent med:
E[Y1i|Xi=1]-E[Y0i|Xi=1] + {E[Y0i|Xi=1]-E[Y0i|Xi=0]}
Den första termen är den genomsnittliga kaussala effekten av att vara i en liten klass givet att personen har blivit vald att vara i en liten klass. Kan också skrivas E[Y1i-Y0i|Xi=1]
Den andra termen är biaset, eller selection effekten.
Det vi observerar är alltså den genomsnittliga kausala effekten + biaset.
Om E[Y0i|Xi=0] = E[Y0i|Xi=1] försvinner biaset och kvar har vi den kausala effekten.
Detta är målet med alla randomiserade kontrolerade experiment.
Vad betyder det att
E[Y0i|Xi=0] = E[Y0i|Xi=1]
Den förväntade effekten av att inte få behandlingen är lika för de som fick behandlingen och de som inte fick behandlingen.
Det betyder att frånvaron av behandling ger samma utfall i båda grupperna, viket betyder att grupperna är identiska och vi inte har någon bias/selecon. Dvs vi kommer bara ha den ganomsnittliga kausala effekten kvar.
Visa med potential outcome framework hur man skriver, TOT-effect, ATE-effect och TOUT-effect.
- Treatment-on-the-treated effect: E[Y1i-Y0i|Xi=1]
- Average treatment effects: E[Y1i-Y0i]
- Treatment on the untreated effect: E[Y1i-Y0i|Xi=0]
- Local average treatment effect (LATE)