Lecture 6 Flashcards
Vad är en proxyvariabel?
Det är en variabel som används för att mäta något som inte är direkt observerbart.
T.ex är IQ test eller skolresultat proxy för att mäta intelligens. Man ”approximerar” intelligens med de variablerna.
Det är alltså en annan variabel som har ett starkt samband med den variabeln man vill mäta.
Vilka tre metoder föreslår Ference man kan använda då vi inte har ett experiment där vi kan randomisera grupper..
1 Kan vi inte skapa riktiga experiment så kan vi genom proxivariabler kontrollera fram randomisering.
2 Vi kan använda/hitta naturliga experiment. Detta genom instrument variabel eller RDD (Regression discontinue design)
3 Vi kan också se på tidsskillnader (hur samma individer varierar över tid. Genom DIF in DIF eller panel data
Vilka två sätt kan man använda för att få unconfoundness vid en studie?
- Regressioner med kontroller
- Matchning. Man hittar någon i kontrollgruppen som är lika någon i behandlingsgruppen. Sedan jämför vi bara de paren som liknar varandra. Sedan tittar på den genomsnittliga skillnaden mellan dem.
Vad är uncondoundness assumption?
(Y0i , Y1i ) ⊥ Di |(X1i , …, Xki )
Även om vi inte har ett riktigt experiment med äkta randomisering, så kan vi ”anta” att vi har så gott som random assignment när vi kontrollerar för alla variabler/covariat vi behöver kontrollera för.
Man kan säga att all form av matchning vilar på att det här antagandet stämmer. Givet det så fungerar matchning. Problemet är att det förmodligen alltid finns kovariat man inte har kontrollerat för, vilket för at unconfoundness assumption inte håller.
Men om det håller har vi kausalitet!
Ge exempel hur man får unconfoundness om man studerar folk som väljer att delta i arbetsträningsprogram?
De personerna som är smartare kommer vara de som väljer att delta i själva träningsprogrammet. Utfallen är därför inte oberoende av D. Men om vi kontrollerar för ”smarthet” så kommer det att vara det.
Vad betyder det om
fˆ(X1i, …, Xki ) = f (X1i, …, Xki )
?
Att den funktionella formen man använder för att estimera Y är den sanna formen.
Vi representerar den funktionella formen rätt i vår regression.
Alltså, man använder rätt typ av funktion.
T.ex har man Experience + Experience^2 i sin löneekvation osv.
Vad menas med
0 < Pr(Di = 1|X1i , …, Xki ) < 1
?
Överlappnings förhållande
För alla värden av X är sannolikheten att observera folk som får behandlingen är större än 0 men mindre än 1.
För alla värden av X1 variablerna kommer vi alltså att observera både folk som har fått behandlingen och folk som inte har fått behandlingen.
Om inte det här skulle hålla, skulle vi inte hitta liknande individer som har fått och inte fått behandlingen. Det skulle vara helt olika människor (har helt olika värden av X, utan överlappning) som ingår i de olika betingelserna.
Vad betyder mean indipendence?
Medelvärdet av utfallen utan behandling givet både behandlingsvariabeln och x variablerna. Är det samma som det genomsnittliga utfallet utan behandlingen givet endast X variablerna.
När man har betingat X så ger inte behandlingsvariabeln någon annan informtion som inte ges av Xen.
Om jag vet utbildningen av en person så kan jag göra en bra gissning av dennes lön. Om denna säger att den också ha fått behandlingen så kommer jag inte kunna göra en bättre gissning på utfallet utan behandling på givet den informationen.
D ger oss ingen extra information.
E [Y0i|Di, X1i, …, Xki ] = E [Y0i|X1i, …, Xki]
Om vi kontrollerar för ALLA X vad har vi då i termer av kontroll och behandlingsgruppen..
E [ui|Di, X1i, …, Xki ] = 0
Behandlade och obehandlade personers feltermer är helt okorrelerade inom grupperna. Vi har alltså exogenitet.
Om vi kontrollerar för X har vi lika grupper. Får man skillnader, så har det med random saker att göra.
Man vill studera effekterna av en jobbträningsutbildning. Om det är frivilligt att delta i en arbetsmarknadsutbildning men det kräver att man i alla fall har fullständiga gymnasiebetyg för att delta. Vad kan vara ett problem?
Det kommer att saknas överlappning! Om man studerar både personer som har och inte har fullständiga gymnasiebetyg.
Folk med fullständiga gymnasiebetyg kommer vara överrepresenterade i behandlingsgruppen. Vi har alltså inte ekvivalenta grupper!
Det är just överlappningen vi vill studera för att kunna kontrollera för ekvivalenta grupper.
I den bästa av världar kommer det finns både folk utan så mycket utbildning som delar i utbildning samt att personer med en hel del utbildning som inte vill delta i utbildningen. Vi kan då studera överlappat.
Annars kan vi alltså inte säga hur behandlingen har för effekter på utbildade och inte så utbildade människor om det var personer med helt olika utbildningsnivåer som deltog och inte deltog. Det finns då alltså inte personer i behandlingsgruppen som liknar personer i kontrollgruppen.
Vad är matchning och vilka metoder använder man får att få till det?
Vid matchning försöker man hitta likande par mellamn kontroll och behandlingsgruppen och man jämför skillnaden mellan dem.
Man kan göra en exakt matchning
Eller använda en propensity score card matchning.
Vad gör man vid exakt matchning?
Man bestämmer vilka covariats man ska matcha för och vilka nivåer. T.ex för utbildningsnivå.
X1 = 1 är grundskola
X1 = 2 är gymnasiet
X3 = 3 är universitet
Man jämför då de genomsnittliga utfallen vid behandlings och kontrollbetingelsen mellan X = 1 och samma för X = 2 och X = 3.
På så sätt har man exakt matchat. Man jämför bara effekterna för de som har lika mycket utbildning. Vi kan genom det räkna ut en sann genomsnittlig behandlingseffekt.
Vi vi kollar effekten av någon behandling och genom exakt matchning vill kontrollera för kön (X1 = 1, X1 = 2) och utbildning (X2 = 0, X2 = 1).
Vi har en behandling och en kontrollgrupp.
Hur går vi till väga när vi räknar ut den genomsnittliga behandlingseffekten?
Vi har två matriser, en för kontroll och en för behandling.
Vi tar skillnaden mellan X1 = 1 och X2 = 0 hos behandlings och kontroll gruppen (behandling MINUS kontroll), sedan X 1 = 1 och X2 = 1 mellan grupperna osv tills vi bara har EN matris som bara innehåller skillnaderna.
Vi adderar sedan skillnaderna och delar med antalet Celler i den matrisen för att få ATE.
Se sida 12 -> Föreläsning 6
Vilka är för och nackdelarna med exakt matchning?
Det är helt icke-parametriskt. Alltså man behöver inget antagande om vilken funktionell form som kontrollvariablerna har.
Det tar implicit hand om överlappningen. Hade vi ingen överlappning så skulle vi inte ha något värde i cellen. Vi jämför alltså ALLTID överlapp.
Problem är dock:
Har vi många X kommer vi har många dimensioner!
När dimensionerna ökar kommer komplexiteten snabbt att öka och man kommer ha svårt att hitta exakt liknande kombinationer av X.
Det blir även svårt om det finns fler element i X. T.ex om man har kontinuerliga värden på X.
När och varför använder man propensity score matching?
Det här är generellt den typen av matchning som används och man gör det pga att denna reducerar dimensionerna i matchningen till en enda dimension, nämligen propensity poängen.
Man matchar då personer med samma propensity score.