L8 Inferens og regression Flashcards

1
Q

Hvornår bruger vi F-test

A

Ved test af nulhypotese med flere hældningskoefficienter (typisk dummyvariable eller kategoriske variable).

Eks. test af alle fem uddannelseskategorier effekt på afhængig variabel.

Eks. tjek om randomisering i balancetabel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad betyder en standardfejl for hældningskoefficienten beta1?

A

Typisk afvigelse fra den sande parameter (altså hældningen i populationen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad påvirker standardfejlen for beta1?

A

Variationen omkring regressionslinjen (SSR/(n-k))^2 eller RMSE^2 og variationen i x.

Residualvariationen/var(x) = var(beta1)
RMSE/kvadratrod(var(x) = SE(beta1)

Dermed indirekte stikprøvestørrelsen, som giver både mindre RMSE og SE beta1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvornår biler SE(beta1) hhv. større og mindre?

A

Alt andet lige:
Større n –> mindre SE
Større var(x) –> mindre SE
Større residualer –> større SE (mindre præcist estimat)

Så når RMSE er stor, bliver SE(beta1) også relativt stor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad har størrelsen af SE(Beta1) betydning for type ll fejl?

A

Når SE(beta1) er lille:

  • typisk ved stort n, så har vi masser af power
  • Stikprøvemålsfordelingen klapper om den sande parameterværdi
  • vi begår FÅ type ll fejl (vi forkaster nærmest alle forkerte nulhypoteser)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er ulempen ved robuste standardfejl?

A

De robuste standardfejl er dog typisk lidt større, derfor er det værd at undersøge om antagelsen om homoskedasticitet holder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er sammenhængen mellem SE og multikollinearitet?

A

For MLR vil variansen var(x) afhænge af kontrolvariable. Hvis kontrolvariablene “renser” meget variation, vil var(x) blive mindre og SE større

Kaldes for niveauet af multikollinearitet.

Derfor giver det mening at se på hvor stærk korrelationen mellem x og z er

OBS: medmindre graden af korrelation mellem Z og Y er større!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad indebærer en statistisk hypotesetest i en regressionsanalyse?

A

Tester nulhypotesen ved t-test: sammenhængen er 0

Den forkastes/undlades at forkastes på baggrund af. p-værdien, der viser, hvor sandsynligt det er at få hældningskoefficienten givet at H0 er sand.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad udtrykker p-værdien for hældningskoefficienten?

A

Sandsynligheden for at trække/observere en stikprøve (eller noget mere ekstremt), givet at nulhypotesen er sand.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er forskellen på homo- og hetereoskedasticitet?

A

Dette spørgsmål relaterer sig til fordelingen af residualer langs regressionlinjen.

Er variansen ensartet: homoskedasticitet

Er der et mønster (trompet eks.): heteroskedasticitet.

Særligt problematisk ift. inferens. SE(beta1-hat) bliver biased.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad vil det sige, at en observation er indflydelsesrig?

A

Leverage * residual = indflydelsesrig outlier

Sjældnere et problem i store stikprøver - vær særlig opmærksom på høj leverage (afstand fra gennemsnittet) i små stikprøver

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvilke egenskaber gælder for Beta1-hat?

A

Den er unbiased/middelret under følgende antagelser:
- MLR antagelser

E(beta1-hat)=beta1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvilke typer bias er der i regression?

A

Stikprøvebias (sampling bias): en skæv stikprøve, tager vi højde for via. inferentiel stat

Selektionsbias: forskningsdesign!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Har beta1-hat en stikprøvemålsfordeling?

A

Ja, hvis i.i.d og n>50 (OBS!).

Hvor den sande parameter er gennemsnit og SE er SE(beta1-hat)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad angiver et konfidensinterval for beta1-hat?

A

Et mål for usikkerheden i stikprøven. Med 95% konfidens indeholder intervallet den sande parameter.

Indeholder den 0, er hældningskoefficienten insignifikant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er robuste standardfejl?

A

De justerede standardfjel, som tager højde for heteroskedasticitet (OBS: giver et lidt mere upræcist estimat, men er ofte god at bruge i store stikprøver)

17
Q

Hvad fortælle signifikanstest for dummyvariable?

A

Om kategorien er signifikant forskellig fra referencekategorien.

Brug f-test, hvis du ønsker at teste om hele variablen er signifikant.

18
Q

Hvad betyder restriktioner ift. f-test?

A

Hvor mange parametre, som skal være forskellig fra 0:

3 restriktioner: B1=B2=B3=0

19
Q

Hvordan laver man en f-test+

A

STATA reg-output fikser det for alle koefficienter.

Ellers brug post-estimationskommadoer:

testparm var
test var1 var2 var3
test var==værdi

20
Q

Hvad er forskellen mellem estimation af SE(ystreg) og SE(beta1)?

A

SE(ystreg): SD/kvadratrod(n)

SE(Beta1): s/kvadratrod(nXvar(x))

Hvor SD er standardafvigelsen i stikprøven og s er kvadratroden af de kvadrede residualer (divideret med n-k); altså variansen omkring regressionslinjen.

Forskellen er altså, at var(x) skal medregnes: altså forholdet mellem to varianser!!