Introduktion til regression begreber Flashcards

1
Q

Fejlled

A

Findes i populationen (et populationsparameter) og forsøges estimeret med residualer. Det er alt ved observationen y, som er forklaret af andre faktorer end x.
Afstand fra forventede værdi i population til hvad den rent faktisk er. Grafisk er det forskellen mellem observationen og den lineære model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lineær regressions model

A

Y = β_0+β_1 X_i+u_i

Populationsregressionslinjen kan estimeres ved hjælp af stikprøveobservationer
(Y_i. X_i ), i=1,…,n , ved almindelige mindste kvadraters (OLS)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Residual

A

Estimation af fejlled fra stikprøven.
Afvigelsen fra regressionslinjen. Afstanden fra den faktiske observation til modellens forudsagte værdi.
Residual = forudsagt Værdi - faktisk værdi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

OLS

A

Mindste kvadraters linje: Linjen, hvor vores model tager mindst muligt fejl - linjen med de mindst mulige residualer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

R^2

A

Et mål for modellens fit, der angiver hvor stor en del i variationen i Y som X forklare.
Har IKKE noget med kausalitet at gøre men med sammenhængen mellem x og y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Antagelsen: E(u|x)=0

A

Antagelsen siger, at der er fravær af selektionsbias.
Hvis størrelsen på fejlleddet er korreleret med x så er det noget udeladt fra modellen som forklarer Y og korrelerer med X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

referencekategorien

A

Den kategori, der udelades dvs. den de andre holdes op imod.
Baseline for sammenligningerne mellem de andre kategorier. Normalt vælges den kategori, der antages at have nul effekt eller betragtes som standard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dummyvariabel

A

En bivariat variabel, der enten har værdien 0 eller 1
Fx kvinde=0 og mand=1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En partiel sammenhæng

A

X måles relativt til forventet gennemsnit givet kontrolvariablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Justeret R^2

A

tager højde for kontrolvaribale. Defor denne der rapporteres ved multipel regression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Multikollinearitet

A

når to eller flere af de uafhængige variabler er stærkt lineært afhængige af hinanden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Standard fejlen

A

Standardfejlen for hældningskoefficienten β ̂_1 er et estimat af hvor meget vi typisk rammer ved siden af populationsparameretet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Homoskedasticitet

A

Fejlledets variation skal være uafhængigt af X.
Handler om hvorvidt vores model er velspecificeret og om variation IKKE om kausalitet og korrelation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

heteroskedasticitet

A

Tilstanden, hvor VAR(u|x) = RMSE2 er brudt, dvs der er et mønster.
Handler om hvorvidt vores model er velspecificeret og om variation IKKE om kausalitet og korrelation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

t-værdien udregning

A

vi udregner t-værdien ved at dividere koefficienten med standardfejlen.
Og så kan vi bruge t-fordelingen til at finde frem til, hvor sandsynligt vores resultat er, hvis nulhypotesen er sand - hvor mange standardfejl den ligger ude i fordelingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

F-testen

A

En statistisk test af om mindst en af flere regressionsparametrene er forskellig fra nul.
Modsat t-testen, der er en test af om et enkelt regressionsparameter er forskelligt fra 0.
F-testen er god, fordi det kan være problematisk med mange enkelttest.