Multipele Regressie Flashcards
Multipele regressie meetniveau’s
Y: minimaal interval.
X: minimaal interval, dichotoom,categorisch met dummy’s
Formule voorspellen Y bij multipele regressie.
Y = b0+b1X1+B2X2+” …”+E
B0= Constant
B1=
ASSUMPTIES multipele regressie
- De participanten zijn aselect gekozen en scoren onafhankelijk van elkaar.
- Er is een lineaire relatie tussen de variabelen.
- Er zijn geen uitschieters.
- Per X-waarde is de spreiding in Y-scores gelijk, ook wel homoscedasticiteit genoemd.
- Per X-waarde zijn de Y-scores normaal verdeeld.
- Er mag geen hoge correlatie zijn tussen de onafhankelijke variabelen, ook wel multicollineariteit genoemd.
controleren assumptie multicollineariteit
Er mag geen hoge correlatie zijn tussen de onafhankelijke variabelen, ook wel multicollineariteit genoemd.
Kijk naar de tabel Coëfficients.
- Waardes voor de Tolerance kleiner dan .2 duiden op een mogelijk probleem.
- Waardes voor de Tolerance kleiner dan .1 duiden op een probleem.
- De VIF is gelijk aan 1/Tolerance, dus voor de VIF geldt dat waardes groter dan 10 duiden op een probleem. Tolerance mag niet hoger dan .1 zijn.
assumptie homoscedasticiteit controleren
- Per X-waarde is de spreiding in Y-scores gelijk, ook wel homoscedasticiteit genoemd.
Het plotten van de gestandaardiseerde residuen tegen de gestandaardiseerde waardes. Als er voor elke voorspelde waarde (X-as) ongeveer evenveel spreiding is op de Y-as, is er voldaan aan de voorwaarde.
R2
Kan met het hele model een significant deel van de spreiding in Y verklaard worden? R square (R2) geeft het percentage verklaarde variantie aan in de steekproef.
H0: p2 = 0 H1: p2 < > 0
B’S
B’s: Wat is het effect van een afzonderlijke predictor op Y?
H0: B = 0 H1: B < > 0
Hiërarchische regressie:
is toevoeging van X(-en) aan het model statistisch zinvol?
H0: ΔR2 = 0 H1: ΔR2 > 0
Aflezen uitschieters
Kijk naar minimum en maximumwaardes in de tabel Residuals Statistics.
- Standardized Residuals: uitschieters in de Y-ruimte. Waardes kleiner dan -3.3 of groter dan 3.3 duiden op uitschieters.
- Mahalanobis Distance: uitschieters in de X-ruimte. Waardes hoger dan 10 + 2 x (aantal onafhankelijke variabelen) wijzen op uitschieters.
- Cook’s Distance: uitschieters in de XY-ruimte. Waardes hoger dan 1 duiden op invloedrijke respondenten.
De adjusted R2
De adjusted R2 geeft aan wat het geschatte percentage verklaarde variantie is in de populatie.
F-toets
F-toets die toetst of het gehele model significant is.
3 GEVOLGEN MULTICOLLINEARITEIT
De regressiecoëfficiënten (B) zijn onbetrouwbaar.
Het beperkt de grootte van R (de correlatie tussen Y en Ŷ) Het belang van individuele onafhankelijke variabelen is niet/moeilijk vast te stellen.
Onderzoeksvraag multipele regressie:
Kunnen we met meerdere X-en de score op Y voorspellen?
Nominaal meetniveau
Je kunt je data categoriseren door labels toe te kennen. Elk datapunt kan maar tot één label behoren en er is geen rangorde.
Geboorteplaats
Gender
Etniciteit
Automerken
Geloofsovertuiging
Ordinaal meetniveau
Je kunt je data categoriseren en rangschikken, maar je kunt niets zeggen over de intervallen tussen de categorieën. De intervallen zijn niet te bepalen of niet betekenisvol.
Zo kun je bijvoorbeeld een top vijf van Olympische medaillewinnaars opstellen, maar dat zegt niet dat tussen iedere winnaar evenveel verschil zit in termen van gewonnen wedstrijden. Wellicht heeft de nummer 1 twee wedstrijden meer gewonnen dan de nummer 2, maar heeft de nummer 2 vier wedstrijden meer gewonnen dan de nummer 3.
Top tien bestsellers (boeken)
Taalvaardigheid (zoals laag, gemiddeld, hoog)
Likertschaal-vragen (bijvoorbeeld een vijfpuntsschaal van heel ontevreden tot heel tevreden)