1.Causality Flashcards

1
Q

Förklara vad som menas med en ”model-based” approach beträffande causality.

A

Denna approach kallar Per för Lef-hand side econometrics eftersom den fokuserar på vad som bestämmer Y (kapital, teknologi arbete osv).

Kausalitet existerar endast teoretiskt där x påverkar y.

Man startar med en ekonomisk modell som t.ex

Hi = si^α

Där hi = är individens arbetsinkomst och
Si är individens år i skolan.

Dessa består i sin tur av variabler och parametrar… man maximerar och får fram en regressions modell av typen

Yi = B0 + B1Xi + ui
(Litte luddigt)

Den modelbaserade approachen kräver mycket antaganden för att adressera kausalitet. Men parametrarna i regressionen är å andra sidan precis definierade i termer av ekonomisk teori. T.ex Beta osv, de representerar en riktig ekonomisk effekt som går att generalisera (över tid och rum) osv. Det ger den här approchen hög extern validitet.

Man kallar det för en ”deep parameter”. Man kan därför säga Beta är en funktion av exempelvis elasticiteten i humankapitals funktionen osv.

Här måste man som tidigare nämnt göra massor av antaganden, man använde OLS så det gäller att man inte har missat att exkludera någoin variabel, då man kommer få Omitted variabel bias.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilket är det matematiska huvudantagandet beträffande unbiasness och konsistens för OLS estimatorn?

Vilken typ av pålitlighet ger detta?

A

Conditional mean zero

E[u|X] = 0 alltså att medelvärdet av u givet X är lika med noll.
Detta ger att Cov(ui, Xi) = 0 -> X är exogen, dvs att u och X är orellaterade.

Ger:
Internal validity.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Om E[ui|X] inte är 0, vad säger det om X?

A

Att X är endogen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad betyder det att E[ui|Xi] = 0?

Vilken tolkning kan man ge en regression om detta håller?

A
  1. Det finns inga andra omitted explanetory variables.
  2. Det är korrekt funktionell form.
  3. Inget sample selection bias.
  4. Ingen omvänd kausalitet
  5. Inga mätfel i X

OM allt detta håller har man alltså conditional mean zero. Det betyder att X har en kausal effekt på Y. Man kan alltså tolka Beta kausalt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur ser conditional mean zero ut om man har många variabler?

A

E[u|X1, X2,…,Xn]

Allt som stoppas in i regressionen måste vara orellaterat till feltermen för att man ska kunna tolka det kausalt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är omittidvariable formulan och vad betyder den?`

Νär har vi ingen sådan, givet formulan.

A

Den beskriver förhållandet mellan regressionsestimatet… ?

Cov(Y,X)/Var(X)

Vi tänker oss att vi har den sanna regressionen

Y = B0 + BX + υW + v

Skulle vi dock estimera regressionen utan W skullle vi ha

Cov(Y,X)/Var(X)

Vilket är lika med B^ = β + υπ

Enligt tidigare kurs:
Β^ = B + υ(cov(X1,W1)/var(x1)

Där π är effekten av W på X

Vi har ingen omitted variabel bias om υ = 0 (dvs, W påverkar inte Y.) eller cov(X,W), dvs, det finns inget samband mellan X och W.

Detta är dock bara sant vid ett randomiserat experiment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är essensen av designbased approach?

A

Man har en manupulation. Vi tänker oss två världer, en där personnen fick behandlingen och en där personen inte fick behandliongem. Så jämför vi utfallet i Y i de båda världarna. Skillnaden är då effekten av X.

Hela grejen här är att vi skapar en manipulation för att kunna utttala oss om hur X påverkar Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.

Vad säger då Y0i och Y1i?

Individnivå.

A

Y1i är Det potentiella utfallet vid behandling,

Y0i är det potentiella utfallet utan behandling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.

Hur skriver vi en ekvation som visar det observerade utfallet i Y?

Hur ser det ut när X = 0, respektive X = 1?

Individnivå = unitlevel

A

Yi = XiY1i + (1-Xi)Y0i

Yi = XiY1i + Y0i - XiY01 ?

Om X1 = 0 försvinner första och sista termen och

Yi = Y0i, dvs Yi = det potentiellas utfallet utan behandlingh.

Om X = 1

Kommer vi ha kvar det potentiella utfallet utan behandling plus skillnaden mellan det potentiella utfallet med och utan behandlingen. Skillnaderna mellan dessa är den kausala effekten.

Dock är det omöjligt att se den kausala effekten på individnivå då vi inte kan observera någon kontrafaktisk utvecking på riktigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är det fundamentala problemet av kausal inference?

A

Det omöjligt att se den kausala effekten på individnivå då vi inte kan observera någon kontrafaktisk utvecking på riktigt.

Man kan inte estimera kausala effekter på individnivå.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Om vi tittar på populationsnivå och Om vi har en behandlingsdummy Xi = 1 om behandling, Xi = 0 om ej behandling. Y är utfalls variabeln.

Hur skriver vi en ekvation för ”average causal effekt”?

A

E[Y1i - Y01] = E(Y1i) - E(Y0i)

Om några personer (units = i) expomneras för behandlingen kan de andvändas för att få information om E(Y1i)
Precis som de som inte får behandlingen ger oss information om E(Y0i)

Den kausala effkten som är omöjlig att observera på individnivå kan man istället studera på aggregerad nivå i populationen, vi ser då ”average causal effx).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilket antagande måste vi göra för att kunna esatimera average causal effex?

Hur för man detta?

A

VI måste se till att X är orellaterade till andra faktorer.

Man konstriuerar randomiserade kontrollerade experiment.

Detta är ett sätt att få indipendence assumption att hålla.

Vi skapar en manipulation där X orsakar Y, detta är den design-baserade approachen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Say that we would like to compare whether a student in a small class perform better than students in a large class. Suppose we have data on students test scores.

Låt Xi = 1 om det är en liten klass
Xi = 0 om stor klass.

Ställ upp ekvationen i ”potential outcom framework”. Alltså. E[Yi|Xi=……. osv som visar de observerade skillnaderna i ”testscoore”

Tolka de olika delarna av den

A

E[Yi|Xi=1]- E[Yi|Xi=0]

Detta är den observerade skillnaden i test score. Denna ekvation är då ekvivalent med:

E[Y1i|Xi=1]-E[Y0i|Xi=1] + {E[Y0i|Xi=1]-E[Y0i|Xi=0]}

Den första termen är den genomsnittliga kaussala effekten av att vara i en liten klass givet att personen har blivit vald att vara i en liten klass. Kan också skrivas E[Y1i-Y0i|Xi=1]

Den andra termen är biaset, eller selection effekten.

Det vi observerar är alltså den genomsnittliga kausala effekten + biaset.

Om E[Y0i|Xi=0] = E[Y0i|Xi=1] försvinner biaset och kvar har vi den kausala effekten.
Detta är målet med alla randomiserade kontrolerade experiment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad betyder det att

E[Y0i|Xi=0] = E[Y0i|Xi=1]

A

Den förväntade effekten av att inte få behandlingen är lika för de som fick behandlingen och de som inte fick behandlingen.

Det betyder att frånvaron av behandling ger samma utfall i båda grupperna, viket betyder att grupperna är identiska och vi inte har någon bias/selecon. Dvs vi kommer bara ha den ganomsnittliga kausala effekten kvar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Visa med potential outcome framework hur man skriver, TOT-effect, ATE-effect och TOUT-effect.

A
  • Treatment-on-the-treated effect: E[Y1i-Y0i|Xi=1]
  • Average treatment effects: E[Y1i-Y0i]
  • Treatment on the untreated effect: E[Y1i-Y0i|Xi=0]
  • Local average treatment effect (LATE)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Om vi har Yi = Y0i + (Y1i-Y0i)Xi

Där (Y1i-Y0i) är den kausala effekten av Xi = 1.

Och vi har regressionen

Yi = β0 + β1Xi + ui

vad är då β0,β1 och ui i termer av på potential outcome frame work?

A

β0 =E(Y0i)
β1= Y1i - Y0i
Ui = Y0i - E(Y0i)

the potential outcomes model can be expressed as a regression model. Thus, a regression analysis can therefore be used to estimate causal effects and causal relationships.

17
Q

Vad kallar han design based approach för och varför?

Vad är fördelarna med att använda en sån här approach?

A

I call the design-based approach “right-hand side econometrics” since the primary focus is on X. Thus, if we have direct control of the variation in X, we can estimate the causal effect without bias. Specifically, this approach does not
require any functional form assumption of the CEF, E[Y|X], since the regression is just the comparison of means. Moreover, we do not have to control for any other factors that determine Y since randomization ensures that X is unrelated to all other factors. Thus, there is no OVB. To see this, take the conditional expectation of regression equation (1)

18
Q

Vad betyder E[ui|Xi=1]=E[ui|Xi=0?

A

the unobservables in the two groups are balanced) detta tack vare randomisering.

19
Q

The high status of randomized experiments is due to several features:

A
1. Randomization ensures that the control and treatment groups have
identical outcomes (in expectations!) absent the treatment. So, except for chance errors, the treatment effect, the difference in means, is truly attributable to the treatment, not to some inherent difference between the two groups.
  1. Once the experimental design is determined, the researcher’s hands are
    tied. There is no room for weaseling. (The experimental design is a full description of the population, the sample size, the randomization procedure, the treatment, and the data collection process.)
  2. Because of (1) and (2), randomized experiments are easy to understand
    and therefore have a lot of credibility.
20
Q

Vad menas med Conditional Mean indipendence?

A

E[u|X1, X2]= E[u| X2]

which means that once X2 is controlled for then X1 is independent of u. As a result, X2 is allowed to be correlated with u.

the estimate of the effect of X2 on Y will be biased and inconsistent. We therefore say X2 is a control variable (covariate). In other words, in the design- based framework we distinguish between variables that have a causal interpretation, and those who have not. In the design-based framework it also important of not including variables that are affected by the treatment itself since it introduces bias.

21
Q

vad händer om man kontrollerar för variabler som inte behövs? Vad är bra eller dåliga kontroller?

A

Skriv in från ference slides!

22
Q

Om vi har Y1 = b0 + B1X1 + B2X2 + B3X1X2 + u

Den ända kausala variabeln är X1.

Vilka koeffecienter kan vi dåå tolka kausalt?

A

Bara B1!

23
Q

Vilken typ validitet betonar modelbaserad och designbaserad approachen?

A

The model-based approach emphasizes external validity of the results. It is the economic model behind the regression specification that allows for generalizability of the results to other populations and settings.

The design-based approach emphasizes internal validity with a minimal
set of assumptions. Specifically, it is the randomization of X (manipulation of the cause X) that ensures that the results are internally valid, i.e., captures a causal effect for a well-defined subpopulation in a specific setting.

24
Q

Om man har en RCT. Hur ska man presentera estimat med kontrollvariabler?

A

Man börjar med att presentera estimaten rent utan fixed fx och kontroll variabler. Sedan presenterar man med fixed fx och sen med kontrollerna. Då ser man vilka bidrag alla ger.
Kontroll variablerna är bara för att visa……… ???

25
Q

Vkan man säga om skillnaderna mellan design och modell gällande partial och total derivatorna?

A

The model-based approach measures a partial effect (partial derivative) since it requires the all other factors that determine Y are held constant (ceteris paribus).

In contrast, a design-based approach measures a total effect (total
derivative) since it does not require other factors that determine Y to be
held constant. The model-based approach thus assumes that Y is
determined according to following population regression model

26
Q

b^1 = b1 + b2γ1

När har vi ett positivt respektive negativt bias?

A

γ1 är effekten av X2(omitted variablen) på X1

b2 är effekten av X2 på Y

Här är det multiplikationsreglerna som gäller.

  • x - = +

+ x + = +

  • x + = -

+ x - = -

Om korrelationen mellan X2 och Y är noll är b2 noll och hela uttrycket b2γ1 = 0, så vi har inget bias. Samma sak om X2 och X1 är okorrelerade.