multipele regressie Flashcards

1
Q

3 onderzoeksvragen bij multipele regressie

A
  1. Hoe goed kunnen scores van de afhankelijke variabele worden voorspeld door de onafhankelijke variabelen SAMEN (met R2)?
  2. Hoeveel variantie wordt voorspeld door elke onafhankelijke variabele afzonderlijk, als de andere onafhankelijke variabelen constant worden gehouden?
  3. Binnen de set van onafhankelijke variabelen die in de regressievergelijking zijn opgenomen, welke onafhankelijke variabelen heeft het sterkste effect op de afhankelijke variabele? (dmv gestandaardiseerde regressiecoëfficiënt)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

wat zijn de formules voor de multipele regressie
1. ongestandaardiseerd
2. gestandaardiseerd

A
  1. Y’ = b0 + b1X1 + b2X2
  2. Z’y = β1Zx1 + β2Zx2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Y’ = b0 + b1X1 + b2X2

wat is de rol van b1 en b2

A

b1 en b2 zijn partial regression slopes (partiële regressie coëfficiënten)
–> geven het GECONTROLEERDE directe effect van de onafhankelijke variabele(n) op de afhankelijke variabele weer

b1 = Als X1 met 1 eenheid verandert, dan verandert Y met b1 eenheden , ONDER CONSTANT HOUDING VAN X2

b2 = Als X2 met 1 eenheid verandert, dan verandert Y met b2 eenheden, ONDER CONSTANT HOUDING VAN X1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

8 assumpties van multipele regressie analyse

A
  1. Correcte specificatie van de relatie tussen de onafhankelijke variabelen en de afhankelijke variabele
  2. Correcte specificatie van de onafhankelijke variabelen in het regressiemodel
  3. Geen meetfouten in de onafhankelijke variabelen ( betrouwbare meetinstrumenten)
  4. Constante variantie van residuen (homoscedasticiteit)
  5. Residuen zijn onafhankelijk van elkaar
  6. Residuen zijn normaal verdeeld
  7. Geen uitschieters (outliers)
  8. Geen multicollineariteit
    –> wanneer 2 of meer van je onafhankelijke variabelen hetzelfde principe meten. Dit zorgt namelijk voor ene hele sterke correlatie wat effect heeft op de analyse.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is de R2 in multipele regressie

A

Hetzelfde

R2 = SSregression : SStotal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is R2

A

de maat van effect size het algemene model
–> hoe goed voorspellen alle onafhankelijke modellen samen de afhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is de formule voor de F test bij multipele Regressie analyse

A

F= (SSregression: k) : (SSresidual: N-k-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe toets je op significantie

A

door middel van een t-test PER ONAFHANKELIJKE VARIABELE
ti = bi: SEbi
met Df= N-k-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

wat is het verschil tussen semi-partial en partial correlatie

A

partial: Correlatie tussen X1 en Y als zowel de variantie die X1 als Y gemeenschappelijk heeft met X2 eruit is gefilterd

semi-partial: Correlatie tussen X1 en Y als de variantie die alleen X1 gemeenschappelijk heeft met X2 eruit gefilterd wordt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

notatie van semi-partial correlatie

A

ry(1,2) : part correlatie tussen X1 en Y, met constant houding van X2
sri : part correlatie tussen X1 en Y, onder constant houding van de overige variabelen in het regressiemodel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

wat is het nut van semi-partial correlatie

A

geeft een handige maat voor de effect size R2 voor elke onafhankelijke variabele afzonderlijk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

belangrijke regel bij semi-partial correlatie

A

Als je de Semipartial Correlation kwadrateert, krijg je de proportie verklaarde variantie van Y die uniek door elke afzonderlijke onafhankelijke variabele wordt verklaard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

zero-order correlatie

A

de bivariate correlatie zonder de controle variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

wat is multicollineariteit

A

Probleem ontstaat als 2 of meer onafhankelijke variabelen sterk onderling correleren of als onafhankelijke variabelen onderling lineaire relatie vormen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

wat is essentiële multicollineariteit

A

als 2 of meer onafhankelijke variabelen in zeer hoge mate hetzelfde concept meten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

gevolgen multicollineariteit

A
  1. SE wordt groter, waardoor het moeilijker wordt om significante effecten te vinden
  2. tekens van de coëfficiënt “klappen” om: waar een positief verband wordt verwacht, wordt een negatief verband gevonden
17
Q

hoe ontdek je multicollineariteit

A

dmv een correlatie matrix
–> zoek naar predictoren die onderling hoog correleren

maar: methode werkt niet altijd

18
Q

wat is de Variance Inflation Factor (VIF)

A

VIF = 1 : (1-R2i)

methode voor detecteren multicollineariteit

waarbij R2i staat voor de proportie verklaarde variantie waarbij de regressie wordt uitgevoerd van één onafhankelijke variabele Xi op de overige onafhankelijke variabelen in het model

“Hoe goed wordt elke onafhankelijke variabele voorspeld/verklaard door alle
overige onafhankelijke variabelen in de regressievergelijking?”

19
Q

hoe interpreteer je de VIF

A

Relatief grote waarden van VIF signaleren dat multicollineariteit een mogelijk probleem is

maar wat is ‘groot’?

vuist regel: VIF > 10 of de wortel van VIF > 2

20
Q

mogelijke oplossingen voor multicollineariteit

A
  1. goed nadenken over wat je onafhankelijke variabelen eigenlijk meten
  2. eventueel onafhankelijke variabelen verwijderen