Multipele Regressie Flashcards

1
Q

Multipele regressie meetniveau’s

A

Y: minimaal interval.
X: minimaal interval, dichotoom,categorisch met dummy’s

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Formule voorspellen Y bij multipele regressie.

A

Y = b0+b1X1+B2X2+” …”+E
B0= Constant
B1=

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

ASSUMPTIES multipele regressie

A
  1. De participanten zijn aselect gekozen en scoren onafhankelijk van elkaar.
  2. Er is een lineaire relatie tussen de variabelen.
  3. Er zijn geen uitschieters.
  4. Per X-waarde is de spreiding in Y-scores gelijk, ook wel homoscedasticiteit genoemd.
  5. Per X-waarde zijn de Y-scores normaal verdeeld.
  6. Er mag geen hoge correlatie zijn tussen de onafhankelijke variabelen, ook wel multicollineariteit genoemd.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

controleren assumptie multicollineariteit

A

Er mag geen hoge correlatie zijn tussen de onafhankelijke variabelen, ook wel multicollineariteit genoemd.

Kijk naar de tabel Coëfficients.
- Waardes voor de Tolerance kleiner dan .2 duiden op een mogelijk probleem.
- Waardes voor de Tolerance kleiner dan .1 duiden op een probleem.
- De VIF is gelijk aan 1/Tolerance, dus voor de VIF geldt dat waardes groter dan 10 duiden op een probleem. Tolerance mag niet hoger dan .1 zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

assumptie homoscedasticiteit controleren

A
  1. Per X-waarde is de spreiding in Y-scores gelijk, ook wel homoscedasticiteit genoemd.

Het plotten van de gestandaardiseerde residuen tegen de gestandaardiseerde waardes. Als er voor elke voorspelde waarde (X-as) ongeveer evenveel spreiding is op de Y-as, is er voldaan aan de voorwaarde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

R2

A

Kan met het hele model een significant deel van de spreiding in Y verklaard worden? R square (R2) geeft het percentage verklaarde variantie aan in de steekproef.

H0: p2 = 0 H1: p2 < > 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

B’S

A

B’s: Wat is het effect van een afzonderlijke predictor op Y?

H0: B = 0 H1: B < > 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hiërarchische regressie:

A

is toevoeging van X(-en) aan het model statistisch zinvol?

H0: ΔR2 = 0 H1: ΔR2 > 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Aflezen uitschieters

A

Kijk naar minimum en maximumwaardes in de tabel Residuals Statistics.

  • Standardized Residuals: uitschieters in de Y-ruimte. Waardes kleiner dan -3.3 of groter dan 3.3 duiden op uitschieters.
  • Mahalanobis Distance: uitschieters in de X-ruimte. Waardes hoger dan 10 + 2 x (aantal onafhankelijke variabelen) wijzen op uitschieters.
  • Cook’s Distance: uitschieters in de XY-ruimte. Waardes hoger dan 1 duiden op invloedrijke respondenten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

De adjusted R2

A

De adjusted R2 geeft aan wat het geschatte percentage verklaarde variantie is in de populatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

F-toets

A

F-toets die toetst of het gehele model significant is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

3 GEVOLGEN MULTICOLLINEARITEIT

A

De regressiecoëfficiënten (B) zijn onbetrouwbaar.

Het beperkt de grootte van R (de correlatie tussen Y en Ŷ)

Het belang van individuele onafhankelijke variabelen is niet/moeilijk vast te stellen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Onderzoeksvraag multipele regressie:

A

Kunnen we met meerdere X-en de score op Y voorspellen?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Nominaal meetniveau

A

Je kunt je data categoriseren door labels toe te kennen. Elk datapunt kan maar tot één label behoren en er is geen rangorde.

Geboorteplaats
Gender
Etniciteit
Automerken
Geloofsovertuiging

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ordinaal meetniveau

A

Je kunt je data categoriseren en rangschikken, maar je kunt niets zeggen over de intervallen tussen de categorieën. De intervallen zijn niet te bepalen of niet betekenisvol.

Zo kun je bijvoorbeeld een top vijf van Olympische medaillewinnaars opstellen, maar dat zegt niet dat tussen iedere winnaar evenveel verschil zit in termen van gewonnen wedstrijden. Wellicht heeft de nummer 1 twee wedstrijden meer gewonnen dan de nummer 2, maar heeft de nummer 2 vier wedstrijden meer gewonnen dan de nummer 3.

Top tien bestsellers (boeken)
Taalvaardigheid (zoals laag, gemiddeld, hoog)
Likertschaal-vragen (bijvoorbeeld een vijfpuntsschaal van heel ontevreden tot heel tevreden)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Interval

A

Je kunt de data categoriseren en rangschikken, en er zijn gelijke intervallen tussen de categorieën. Er is geen betekenisvol of absoluut nulpunt.
Het verschil tussen twee opeenvolgende temperaturen is hetzelfde: 1 graad. Je kunt dus spreken van gelijke intervallen. Nul graden betekent echter niet hetzelfde op alle temperatuurschalen: het betekent meestal niet dat er geen temperatuur is.

Dit geldt bijvoorbeeld ook voor testscores: als iemand een 0 haalt op een toets betekent dat niet dat diegene helemaal niet over de gemeten vaardigheid beschikt. Het nulpunt bij een toets is dus arbitrair.

Toetsscores (zoals die van examens)
Scores op een persoonlijkheidstest
Temperatuur in Fahrenheit of graden Celsius

17
Q

Ratio

A

Je kunt je data categoriseren en rangschikken, en er is sprake van gelijke intervallen tussen opeenvolgende datapunten. Ook is er een betekenisvol of absoluut nulpunt.
Een betekenisvol nulpunt betekent dat de bestudeerde variabele bij 0 helemaal afwezig is. Bij ratioschalen staat 0 dus gelijk aan die absolute afwezigheid van de eigenschap.

Een voorbeeld hiervan is de temperatuur in Kelvin. Hierbij heb je geen negatieve temperatuurwaarden (zoals een temperatuur van -3). In dit geval betekent 0 dus daadwerkelijk dat er geen thermische energie aanwezig is.
Lengte
Leeftijd
Gewicht
Temperatuur in Kelvin

18
Q

doel multipele regressie analyse

A
  • Beschrijven relaties tussen variabelen
  • Toetsen van hypothesen over relaties (significantie)
  • Kwantificeren van relaties (effectgrootte)
  • Kwalificeren van relaties (klein, medium, groot)
  • Beoordelen relevantie relaties (subjectief)
  • Voorspellen van iemands waarde a.d.h.v. model