Lecture 1 & 2 Flashcards
Vad menas med ”konsistent” estimat?
När storleken på vår sampel ökar mot oändligheten kommer vår estimator att bli det sanna värdet. Alltså β-hatt -> β
Vad menas med ”efficiency” i vårt β estimat?
Vår β-hatt har så lite varians som möjligt. Vilket här samplet går mot infinity.
Vad menas med att man har ett unbiased estimat av β1?
Att det estimerade β är normalfördelat run β och inte systematiskt är skjuter fel åt något håll.
Alltså, när vi estimerar β så kommer vi inte få det sanna β utan ett estimat som är lite olika varje gång vi gör ett experiment/undersökning… beroende på sample.
Vi kommer alltså försöka pricka β men vi kommer träffa lite fel. Unbiast syftar till att vi inte på något systematiskt sätt prickar fel utan av våra estimat är normalfördelade runt det sanna β.
Vad är algebraiskt β1^
β1 + cov(ui, X1i)/var(X1i)
När har man ett unbiased estimat algebraiskt?
β1 + cov(ui, X1i)/var(X1i)
Om (cov(u, X) = 0 så har man ett unbiased estimat.
När feltermen och X1 är okorrelerat.
Vad beror storleken på bias i β1^ på beträffande OVB.
Storleken på korrelationen mellan u och X1 samt storleken på variansen i X1, där ökad varians i X minskar biaset och korrelationen mellan u och X1 ökar bias. Variansen u ökar här biaset(?).
Varför är det bra att ha stor variation i X variabeln?
Biaset i estimatet blir mindre.
Även om man har en viss korrelation mellan u och X så kommer korrelationen att minska då ju mer spritt X är!
Vilka problem kan uppstå få kovatiansen mellan feltermen och X1 inte är = 0?
Omitted variable bias
Simultantet/omvänd kausalitet
Mätfel
Felspecifikation gällande den funktionella formen
Sample selection
Vad är det algebraiska uttrycket för omitted variable bias?
β2 Cov(X1i, X2i)/Var(X1i)
Eller Cov(ui, X1i)/Var(X1i)
Vad är uttrycket för omvänd kausalitet?
Vad betyder komponenterna och hur påverkat de biaset?
(γ1/1-γ1β1) Var(ui)/Var(X1)
Eller
β1 + (γ1/1-γ1β1) Var(ui)/Var(X1)
Storleken på γ(effekten av Y på X) avgör storleken på biaset, där högre γ ökar.
Om variansen i feltermen (u)(det man inte vet) ökar, kommer också biasen att öka likt vid OVB.
Precis som vid OVB kommer också ökad Varians i X1 att minska biasen!
Det är bättre att ha en svag kausal effekt av Y på X, stor varians i X och liten varians i u.
Hur löser man problemet med omvänd kausalitet?
Det går inte med att varken öka sample size eller genom kontrollvariabler.
Man får använda instrument variabler.
Vilken effekt har brus (mätfel) i Y?
Istället för det sanna Y har vi alltså Y + ε
Givet att det är helt slumpmässiga (inget samband mellan bruset och X) fel så kommer vi ha noll i bias.
Om det kombineras med med OVB eller reverse causality kan det dock driva upp biaset.
Så generellt gäller inget bias i sig själv, men mer oprecis data.
Vilken effekt får vi av mätfel i X?
I ställer för det sanna X har vi alltså X + ε
Vi får ett bias som skalar ned vår betakoeffacient då β1 multipliceras med biset
β1 * var(X)/(var(X)+var(ε))
Så ju högre ε desto lägre effekt kommer vi få.
Växer ε negativt kommer vi skala upp effekten.
ε > 0 = Upward
ε < 0 = Downward
”attenuation bias” = Man skalar ned β1 mot noll givet positivt brus.
Det kan alltså se ut som att man inte har någon effekt (pga mätfel) fast man har det egentligen.
Hur kan man lösa ”attenuation bias”?
Man kan lösa detta genom bättre uppmätt data med mindre brus!
Instrumentvariabler hjälper också!
Vilken typ av bias får man om man uttrycker en variabel i fel funktionell form?
Liknande ett OVB då man på sätt och vis utelämnar en variabel (t.ex X1^2) som egentligen borde vara med.