HC16 - Assumpties lineaire regressie Flashcards

1
Q

Wat zijn assumpties?

A

Eisen waaraan je model moet voldoen, wil je dat de resultaten valide en interpreteerbaar zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welke theoretische assumpties heeft OLS-regressie?

A

(1) model is zo goed als je data (2) exogeniteit, niet endogeniteit (3) goed meetinstrument.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarom is het van belang dat je model zo goed is als je data?

A

Bij een sample die niet representatief is, is het moeilijk om een valide model of meetinstrument te ontwikkelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is exogeniteit?

A

Dan leidt X tot Y en niet andersom, deze relatie beargumenteer je adhv theorie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wanneer heb je een goed meetinstrument?

A

Als de vragen meten wat je wilt meten, juiste conceptualisering en vraagstelling dus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welke empirische assumpties heeft een OLS-regressie?

A

(1) lineariteit (2) multicollineariteit (3) onafhankelijke residuen (4) homoscedasticiteit in residuen (5) residuen zijn normaal verdeeld (6) invloedrijke cases.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wanneer is je model lineair?

A

Als de relatie tussen X (ook moderatoren en controlevariabelen) en Y kan weergegeven worden door een rechte lijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe checken we een model op lineariteit?

A

Voor elke variabele een scatterplot aanmaken waarin de relatie met Y zichtbaar is. Bij ordinale of nominale variabelen is een boxplot handiger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat zijn gevolgen van een probleem met lineariteit?

A

Mogelijk foutieve b-waarden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wanneer is er sprake van multicollineariteit?

A

Dan hangen de onafhankelijke variabelen teveel samen en meten hetzelfde onderliggende effect.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hoe checken we op multicollineariteit?

A

Vooraf door Pearsons R tussen predictoren (niet hoger dan 0.8) en na de regressie met VIF < 5 of Tolerance < 0.2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is het gevolg van problemen met multicollineariteit?

A

Dan zijn bepaalde predictoren niet meer significant binnen het model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hoe lossen we multicollineariteit op?

A

Door het samenvoegen of weglaten van predictoren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat houdt onafhankelijkheid van residuen in?

A

Dat wil zeggen dat de residuen niet correleren met predictoren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hoe checken we op onafhankelijkheid van residuen?

A

Met een residuals plot van gestandaardiseerde residuen t.o.v. predictoren. De puntenwolk moet gecentreerd zijn rondom de middellijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat betekent homoscedasticiteit in residuen?

A

De variantie van residuen is dan hetzelfde voor verschillende waarden van de voorspelde Y.

17
Q

Hoe checken we op homoscedasticiteit van residuen?

A

Residuals plot, is de variantie links groter dan rechts? Zie: evenredigheid van puntenwolk.

18
Q

Wat is het gevolg van heteroscedasticiteit in residuen?

A

Dan maakt het model betere schattingen voor verschillende predicted values op de X-as, je model werkt dan niet even goed in het voorspellen van waarden op Y voor verschillende residuen.

19
Q

Hoe kan mogelijke heteroscedasticiteit van residuen opgelost worden?

A

Door het standaardiseren van je variabelen.

20
Q

Hoe checken we de normaalverdeling van residuen?

A

Met een P-plot, puntenlijn mag niet teveel afwijken van diagonaal.

21
Q

Wanneer is een outlier een invloedrijke case?

A

Dan beïnvloedt deze case het model onevenredig sterk.

22
Q

Hoe checken we het model op invloedrijke cases?

A

Opvragen van Cook’s distance, waarden die boven de 1 scoren zijn problematisch.