Meervoudige regressieanalyse - week 3 Flashcards

1
Q

Meervoudige regressieanalyse

A

= onderzoeken van verband tussen Y en meerdere onafhankelijke variabelen

We bekijken het verband tussen Y en X1 tm Xp gezamenlijk om tot betere schatters te komen; afzonderlijke verbanden kunnen misleidend zijn. Het meervoudige regressie-model corrigeert voor de invloed van andere variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

toets voor een afzonderlijke variabele

A

t-toets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

toets voor het gehele model (alle variabele)

A

f-toets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

toets voor een groep van variabelen

A

f-toets voor een groep van variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

toetsingsgrootheid afzonderlijke variabelen

A

T verdeling met n-p-1 d.f.

p = aantal x-variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe goed past het model op de data van de steekproef?

A

Meten met R2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Max en min R2

A

Max wordt bereikt als KS (residu) gelijk is aan 0

Min wordt bereikt als alle waarnemingen exact op de regressielijn liggen

R2 neemt toe naarmate KS (regressie) groter is en dus KS(residu) kleiner
Hoe groter R2 des te beter het model past op de steekproefdata

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

(Multi)collineariteit

A

= sterke lineaire samenhang tussen 2 of meer X-variabelen (vermijden)

Hierbij is er niet genoeg onafhankelijke variantie in Xj om het effect van Xj op Y nauwkeurig te kunnen bepalen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Gevolg (multi)collineariteit

A
  • voor elk van de afzonderlijke X-variabelen in het model wordt H0 niet verworpen, dus geen enkele X is statistisch significant van invloed
  • voor H0 voor het gehele model wordt wel verworpen, dus alle X-variabelen tezamen zijn wél statistisch significant van invloed (maar welke verantwoordelijk is hiervoor weet je niet)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hoe spoort je (multi)collineariteit op

A
  1. lage t-waarden (vvoor afzonderlijke X-variabelen), EN hoge F-waarden (voor gehele model of groep X-variabelen)
  2. grote veranderingen in coëfficienten treden op bij verwijdering van een X-variabele uit het model
  3. er zijn hoge correlaties tussen de X-variabelen (bijv. tussen leeftijd en gezondheid)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hoe los je multicollineariteit op

A
  1. Niets doen, want multicollineariteit is alleen een probleem als de samenhang tussen de X’en onderling (gemeten in termen van R2) kleiner is dan de R2 van de regressie zelf
  2. Niets doen, als je niet in de coëfficiënten van de X-variabelen bent geïnteresseerd maar wel in de voorspelkracht van het model als geheel
  3. Maak de steekproef groter
  4. Verwijder sterk gecorreleerde X-variabelen (maar dat is problematisch als juist díe variabelen van belang zijn in je onderzoek; denk aan de hoogte van het vrijwillig eigen risico in het voorbeeld)
  5. Voeg sterk gecorreleerde variabelen samen (kan bv met PC/factoranalyse)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly