Lecture 1 & 2 Flashcards

1
Q

Vad menas med ”konsistent” estimat?

A

När storleken på vår sampel ökar mot oändligheten kommer vår estimator att bli det sanna värdet. Alltså β-hatt -> β

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad menas med ”efficiency” i vårt β estimat?

A

Vår β-hatt har så lite varians som möjligt. Vilket här samplet går mot infinity.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad menas med att man har ett unbiased estimat av β1?

A

Att det estimerade β är normalfördelat run β och inte systematiskt är skjuter fel åt något håll.

Alltså, när vi estimerar β så kommer vi inte få det sanna β utan ett estimat som är lite olika varje gång vi gör ett experiment/undersökning… beroende på sample.
Vi kommer alltså försöka pricka β men vi kommer träffa lite fel. Unbiast syftar till att vi inte på något systematiskt sätt prickar fel utan av våra estimat är normalfördelade runt det sanna β.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är algebraiskt β1^

A

β1 + cov(ui, X1i)/var(X1i)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

När har man ett unbiased estimat algebraiskt?

A

β1 + cov(ui, X1i)/var(X1i)

Om (cov(u, X) = 0 så har man ett unbiased estimat.

När feltermen och X1 är okorrelerat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad beror storleken på bias i β1^ på beträffande OVB.

A

Storleken på korrelationen mellan u och X1 samt storleken på variansen i X1, där ökad varians i X minskar biaset och korrelationen mellan u och X1 ökar bias. Variansen u ökar här biaset(?).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Varför är det bra att ha stor variation i X variabeln?

A

Biaset i estimatet blir mindre.

Även om man har en viss korrelation mellan u och X så kommer korrelationen att minska då ju mer spritt X är!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka problem kan uppstå få kovatiansen mellan feltermen och X1 inte är = 0?

A

Omitted variable bias

Simultantet/omvänd kausalitet

Mätfel

Felspecifikation gällande den funktionella formen

Sample selection

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är det algebraiska uttrycket för omitted variable bias?

A

β2 Cov(X1i, X2i)/Var(X1i)

Eller Cov(ui, X1i)/Var(X1i)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är uttrycket för omvänd kausalitet?

Vad betyder komponenterna och hur påverkat de biaset?

A

(γ1/1-γ1β1) Var(ui)/Var(X1)

Eller

β1 + (γ1/1-γ1β1) Var(ui)/Var(X1)

Storleken på γ(effekten av Y på X) avgör storleken på biaset, där högre γ ökar.

Om variansen i feltermen (u)(det man inte vet) ökar, kommer också biasen att öka likt vid OVB.

Precis som vid OVB kommer också ökad Varians i X1 att minska biasen!

Det är bättre att ha en svag kausal effekt av Y på X, stor varians i X och liten varians i u.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hur löser man problemet med omvänd kausalitet?

A

Det går inte med att varken öka sample size eller genom kontrollvariabler.

Man får använda instrument variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilken effekt har brus (mätfel) i Y?

A

Istället för det sanna Y har vi alltså Y + ε

Givet att det är helt slumpmässiga (inget samband mellan bruset och X) fel så kommer vi ha noll i bias.
Om det kombineras med med OVB eller reverse causality kan det dock driva upp biaset.

Så generellt gäller inget bias i sig själv, men mer oprecis data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilken effekt får vi av mätfel i X?

A

I ställer för det sanna X har vi alltså X + ε

Vi får ett bias som skalar ned vår betakoeffacient då β1 multipliceras med biset

β1 * var(X)/(var(X)+var(ε))

Så ju högre ε desto lägre effekt kommer vi få.
Växer ε negativt kommer vi skala upp effekten.

ε > 0 = Upward
ε < 0 = Downward

”attenuation bias” = Man skalar ned β1 mot noll givet positivt brus.

Det kan alltså se ut som att man inte har någon effekt (pga mätfel) fast man har det egentligen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hur kan man lösa ”attenuation bias”?

A

Man kan lösa detta genom bättre uppmätt data med mindre brus!

Instrumentvariabler hjälper också!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vilken typ av bias får man om man uttrycker en variabel i fel funktionell form?

A

Liknande ett OVB då man på sätt och vis utelämnar en variabel (t.ex X1^2) som egentligen borde vara med.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

SKRV OM SAMPLE SELECTION

A

Skriv om sample selection när han går igen om det.

Han säger att det inte är någon stor del av kursen utan han bara nämner det.

17
Q

Vilka är antagandena för OLS?

A
  1. E(ulX) = 0. Residualen är oberoende av X!
  2. Alla våra sampels i vårt sampel måste komma från en i.i.d. Alltså helt slumpmässigt urval (När man slumpmässigt drar personer så är det verkligen helt slumpmässigt och det är en stor population så orginalpopulationens distribution förändras inte när man tar sampels.)
  3. Det finns inga stora outliers i datan (OLS estimatet blir då konstigt)
  4. Ingen perfekt multicolinearity. X variablerna är linjärt oberoende.

Om de fyra antagandena håller så har man en bra OLS.

18
Q

Vad består feltermen av vid OVB?

A

ui = β2X2i + εi

19
Q

Vad är conditional mean zero?

A

E(uilXi) = 0.

Residualen är oberoende av X!

Alltså, andra faktorer (u) som förklarar variationen av den beroende variabeln Y är orelaterade till den/de oberoende variablerna X.

Håller det här är det i princip samma sak som att säga att X är randomly assigned.
Att det alltså är slumpmässigt vilka individer som har vilka nivåer av X, eller som har fått behandlingen osv..

20
Q

Vad innehåller feltermen (u)

A

Det i Y som inte förklaras av X.

Alltså alla andra faktorer förutom X som påverkar Y.

21
Q

Vad är conditional mean indipendence?

A

E(ui|X1i, X2i) = E(ui|X2i)

Idén är att när man väl har kontrollerat för X2 så kan X1 behandlas som att denna är helt random. ε beror alltså inte på X1. MEN X2 är fortfarande korrelerad med ε och alltså biased!

Man kan alltså då tolka X1 kausalt men inte X2.

22
Q

Vad är det som händer när man lämnar ute en relevant variabel?

A

Givet:
Y = a + b1X1 + ε

Och man utelämnar X2(som är relevant) så kommer den effekten att leta sig fram till Y ändå, men genom γ(effekten av X2 på X1, hur X1 påverkas av X2).

Se pilarna på slide 9/6 föreläsning 2.

Så det bästa är att inkludera X2, då får man X2’s effekt på Y separat och får en ren effekt av X1 på Y.

23
Q

Vad beror OVB på och hur bestämmer man dess riktning?

A

Den beror på:

  1. β2 (effekten av X2 -> Y)
  2. γ1 (effekten av X2 -> X1, eller correllationen dem emellan.)

Här gäller + * + = +, - * - = + och + * - = -

24
Q

När man använder dummy:

Vad händer då avståndet mellan E(u|D = 1) E(u|D = 0) ökar?

A

Biaset ökar!
Är det en skillnad att folk skiljer sig från varandra utöver behandlingen så kommer inte β1^ att fånga β1, utan β1 + pre-behandlingsskillmnader mellan grupperna.

Man pratar inte om en specifik omitted variable, men att det är bias.

OM E(u|D = 1) = E(u|D = 0) då har vi inget bias.

25
Q

Vad är en proxyvariabel? Vad är egenskaperna för en bra sådan?

A

Det är en variabel som i sig själv inte är direkt relevant men som kan användas för att observera en oobserverbar variabel man egentligen vill studera.

En bra proxy ska vara starkt korrelerad (inte nödvändigtvis helt linjärt) med variabeln av intresse.

Om Y = a + b1X1 + b2X2* + ε och X2* inte går att observera så observerar vi i stället variabeln X2.

Hängde inte riktigt med på algebran…

26
Q

Vad händer om ε är korrelerat med X1?

A

Vi har omitted variable bias.

27
Q

Vad säger Y = β0 + β1x1 +β2x2 + ε

A

Effekten av X1 på Y när man håller X2 konstant. Alltså den partiella effekten av X1.

28
Q

Vad är OLS?

A

Estimatet av betakoeffecienterna som minimerar summan av de kvadrerade residualerna (avvikelserna från linjen)

29
Q

Vad är OLS residualen för en observation? Kvalitativt och algebraiskt.

A

SKillnaden mellan Yi och det predicerade OLS värdet.

ε-hatt = Yi - Yi-hatt

30
Q

Vad visar standard error? SER

A

SER är ett mått på hur spridningen i distributionen av Y runt regressionslinjen.
Alltså, den genomsnittliga distansen av observationen från regressionslinjen.

31
Q

Vad betyder i.i.d?

A

oberoende och identiskt distribuerade random variabler. Det är sant om man har ett randomiserat sampel.

32
Q

När håller inte E(u|X) = 0?

A

Om åtminstånde ett av de två förutsättningarna för omitted variable bias är uppfyllda kommer ε vara korrelerad med i alla fall en av regressorerna. Så E(ε|Χ) = 0 håller inte.