6.SE Flashcards

Question 1

Q

Vad är standard error?

Answer

A

Estimated standard diviation of BetaHATT.

Question 2

Q

Vad är en tumregel när man tittar på tabellen med estimar och SE och ska avgöra om något är signifikant eller inte då vi ej ser T-värden eller signifikansstjärnor?

Answer

A

Om absolut värdet av estimatet är mer än 2x SE är det statistiskt signifikant som en tumregel.

Allrså 2 = 1.96 typ….

Question 3

Q

Om vi har random sample kommer vår data att vara….

Answer

A

indipenden from each other och vi har alltså ingen korrelation mellan individer.

Question 4

Q

Vad är homo- och hetroskedasticity och vilka SE ska man använda?

Answer

A

Homo = equal variance
Hetro = unequal variance

Robusta SE tillåter hereoskedasticitet. Men Per och Angrist menar att man provar med båda och kör den som ger högst SE för att vara på den säkra sidan, om man skulle ha asymptotic bias i sina SE.

Detta är dock egentligen inget problem och så viktigt, så Per menar att man kan nöja sig med att bara köra Robust.

Question 5

Q

Hur ska man tänka med SE om datan inte är oberoende i tidsrymden, dvs vid tidsseriedata.

Påverkas våra point estimates?

Hur löser man detta?

Answer

A

Observationerna kommer vara korrelerade över tid så SE kommer vara biast, men vi får korrekta point estimat.

Dock antar man att korrelationen minskar ju längre det är mellan observationerna.

Man kan använda en Hac- estimator för att lösa det. Mn det gäller att man har mycket tidsperioder.

Question 6

Q

Hur ska man tänka med SE om datan inte är oberoende gällande grupper?

Påverkas våra point estimates?

Hur löser man det och vad krävs?

Answer

A

Observationerna inom grupperna kommer vara korrelerade och vi har inte random sample, så SE kommer vara biast, men vi får korrekta point estimate.
Biaset i SE bestäms av hur många kluster man har.

Man använder klustrade robusta standard errors som tillåter korrelation inom klustren men inte mellan.

Man måste dock ha många kluster (se artikel, Miller) för att det ska fungera. SE DEN HÄR ARTIKELN: den beskriver mer i detalj om alla antaganden.

Question 7

Q

Vad kallas och betyder det om man har korellation mellan kluser?

Answer

A

Spatial korrelation. Detta är alltså spill over korrelation mellan kluster. T.ex att kommuner som ligger nära varandra kommer ha viss korrelation.

Man antar, precis som vid tidskorrelation, att det är mindre korrelation ju längre ifrån varandra klustrerna är.

Question 8

Q

Hur ska man tänka på kombinationen av tids- spatial korrelation och kluster?

Answer

A

Har man alla de problemen kan man inte göra något åt det.

In practice data can have cluster, spatial and time series aspects, leading to hybrids of cluster-robust, spatial-HAC and time-series HAC estimators.To date empirical practice has not commonly modeled these combined types of error correlations

Question 9

Q

Om vi har equationen:
Y_ics = B0 + B1T_cs + u_ics

Där C är klass, i är individ och s är skola och T är behandlingsvariabeln. Hur ska vi tänka med SE?

Vilka fixerade effekter ska man lägga in?

Answer

A

Eftersom vi har behandlingen på skol och klassnivå men inte individ kommer individer inom en skola och klassrum vara korrelerade.

Man har ju samma lärare osv i ett klassrum.
VI klustrar därför på den lägsta möjliga nivån, klassrum.

Vi kan också kollapsa på klassrumsnivån och väga med antal observationer per cell sen köra WLS.
Det krävs att de vägs för att man ska få samma beta som kluster och OLS.

Include school fixed effects otherwise OVB. Thus treatment T is randomly assigned conditional on school fixed effects: E[u|T, αs]= E[u|αs].

The school fixed effects also mitigates the clustering problem at the school level.

However, the school fixed effects does not take into account the within class correlation component. As a result, the heteroscedasticity-robust standard errors are not valid due to within classroom correlation. 
Därför klustrar vi eller kollapsar på gruppnivå som ovan nämnt.

Question 10

Q

Hur påverkar random effects våra regressioner?

Hur löser man det?

Answer

A

Om de är random är de alltså inte de okorrelerade med regressionen. Det betyder att det inte påverkar estimaten eftersom de är jämnt spridda. Men de påverkar dock våra standard errors.
Man får alltså rätt Beta men fel SE. Påverkar bara SE.

Man kan kollapsa på den lämpliga nivån. Då löser man korrelationen inom gruppen (som alltså är random i regressionen på behandlingsnivån).

Question 11

Q

Vad är skillnaden med att köra en OLS med klustrade SE eller köra en korrekt WLS på kollapsad data?

Answer

A

Man får samma point estimate. Dock kommer de homoskedastiska SE i WLS antagligen vara mindre än de klustrade felen i OLSn för att man har löst en del genom kollapsa och klustra på det sättet.

Dock har man antagligen fortfarande problem med hetroskedasticitet och bör därför köra hetro error i sin WLS.

Med sin vilktade WLS kan det fortfarande vara så att det finns problem med klustring på en nivå ovanför den man kollapsar på, då får man klustra sin WLS på den nivån!

Question 12

Q

Vad är ett bra sätt att kolla i fall sina RCT estimat är robusta?

Answer

A

Man kör både individuell OLS och en grupperad OLS och en viktad WLS. Den grupperade OLSn ska ge ganska lika resultat som de andra.

Question 13

Q

När kan man inte kollapsa sin data?

Answer

A

om man förändrar variationen i behandlingsvariabeln!

Question 14

Q

Vilka typiska SE problem har man i DiD?

Hur löser man det?

Answer

A

Korrelation inom grupper och tidsseriekorrelation.

Kollapsa datan på gruppnivån för att lösa repeterade observationer inom klustrerna och sen löser man tidskorrelationen(serialkorrelation) om man kan.

Per skriver:
The solution to the two clustering problems is to cluster at the regional level N. However, need to have large number of regions N.

Another solution is first to collapse the data, to solve the correlation problem within groups (Moulton) and then solve the serial correlation problem by clustering the collapsed data at the regional level.

Question 15

Q

Vilka två teoretiska sätt finns det att tänka på SE

Answer

A

Samplingbased inference:
Textbook sättet. Som man tänker i denna kurs.

Designbased inference:
Ett nytt sätt. Detta är inte vad man fokuserar på i denna kurs.

Question 16

Q

Vad är asymtopic proximaions?

Answer

Study These Flashcards

A

Large samples

Question 17

Q

Vad är bootstrapp?

Answer

Study These Flashcards

A

Man behandlar sin data som populationen och drar sedan random därifrån upprepade gånger. Man får sen en distribuering av Beta osv.

Detta är en typ av asymptotic refinment, vilken reduserar finite sample bias.

Detta är inte viktigt i denna kurs!!!

Question 18

Q

Igen, vilka är de fyra olika problemen man kan störa på när man ska räkna SE?

Vilka är lösningarna och vad antar lösningarna?

Answer

Study These Flashcards

A

Problems of computing valid standard errors can be due to
Heteroscedasticity:
- Use heteroscedasticity-robust standard errors
Could be severely biased in small samples (?)

Serial correlation
- Use HAC (Newey West) if T is large (asymptotics is in T), vi måsta ha många T. Assumes that the correlation decreases over time

Correlations within groups G (clusters)

Use cluster-robust standard errors if G is large (asymptotics is in G)
Assumes no correlation between groups

Spatial correlations (e.g., geographical correlation)

Use standard errors robust to spatial correlation (Conley SE)
Assumes that the correlation decreases with the spatial distance between observations

Question 19

Q

Vilka SE problem kan man lösa genom att inkludera kontroll-variabler?

Answer

Study These Flashcards

A

Dessa löser både problemen med standard error samt mildrar problemen med SE.

Exempelvis att lägga in en lag-dependent variable (Yt-1) i tidsserie för att suga upp mycket av seriekorrelationen.

Question 20

Q

Kolla igen på sista SE föreläsningenoch gå igenom om jag har tid

Answer

Study These Flashcards

A

Kolla sista SE och gå igenom om jag har tid när han kolla pappeerna för SE.

6.SE Flashcards

(20 cards)