HC5 Flashcards
Wat betekent als variabelen correleren?
Verandering in de ene variabele hangt samen met verandering in de andere variabele.
Welke meetniveau’s hebben de variabelen wanneer je toetst voor correlatie?
Dit zijn alle twee interval-ratio variabelen. Er is dus geen sprake van een OV of AF, maar X1 en X2.
Wat is Pearson’s R?
Dit is een gestandaardiseerde maat voor de mate van correlatie tussen twee variabelen, scores vallen tussen -1 en +1.
Hoe bewegen variabelen bij positieve correlatie?
Verandering in dezelfde richting, R = 1 bij een perfect positieve correlatie.
Hoe bewegen variabelen bij negatieve correlatie?
Verandering in de tegenovergestelde richting, R = -1 bij een perfect negatieve correlatie.
Wat betekent perfecte correlatie in dit geval?
Dit zegt niks over of de samenhang ‘goed’ is of niet, maar over de sterkte van het verband.
Wat is de H0 wanneer je correlatie toetst?
R = 0 of er is geen sprake van correlatie tussen de twee variabelen.
Wat is de H1 wanneer je correlatie toets?
R = anders dan 0 of er is sprake van een correlatie tussen de twee variabelen die anders is dan 0.
Waarom maken we eerst een scatterplot als we correlatie toetsen?
Om te checken voor outliers, die hebben een onevenredig sterk effect op de R-waarde.
Hoe kan Pearsons’ R nog meer geïnterpreteerd worden?
Als een maat voor de grootte van het effect.
Hoe groot is het effect als R = 0.1?
Klein.
Hoe groot is het effect als R = 0.3?
Medium.
Hoe groot is het effect als R = 0.5?
Groot.
Wanneer is de correlatie niet-significant?
Als R gelijk is aan 0, er is dan geen relatie tussen de variabelen. Dit is vaker zo als R dichterbij 0 komt.
Wat is co-variantie?
Dit is het onderliggende mechanisme van correlatie. De co-variantie laat zien hoeveel de scores van twee variabelen afwijken van het gemiddelde van beide variabelen. OF: variëren twee variabelen samen?
Wat zijn non-parametrische alternatieven voor Pearsons’ R om correlatie te toetsen?
Spearman’s Rho en Kendall’s Tau.
Wat zijn de assumpties voor correlatie toetsen met Pearson’s R?
(1) beide variabelen zijn interval-ratio (2) lineariteit (3) homoscedasticiteit (4) geen outliers.
Wat betekent lineraiteit?
Of de relatie tussen twee variabelen gerepresenteerd kan worden door een model met een rechte lijn.
Hoe check je een correlatie-analyse met Pearson’s R op lineariteit?
Doormiddel van een scatterplot of beredeneren. Zie je afwijking/curve in de scatterplot? Is de rechte lijn wel terecht?
Wat als er niet voldaan wordt aan de assumptie van lineariteit?
Dan kan je geen correlatie-analyse uitvoeren.
Wat betekent homoscedasticiteit?
Dat de variantie gelijk is voor de verschillende waarde van een variabele. Je wilt dat variantie op scores ongeveer gelijk zijn.
Hoe check je homoscedasticiteit?
Door een scatterplot, hoe ziet de puntenwolk eruit? Liggen de datapunt dicht bij de lijn of ongelijkmatig verspreid?
Wat voor effect hebben outliers op de waarde van R?
De R wordt erg groot als de outlier in lijn is met het model of erg klein als de outlier niet in lijn is met het model.
Hoe verhelp je het probleem van outliers?
Gebruik maken van Z-scores, elke waarde krijgt Z-score, dan alle cases filteren tussen -3.29 en 3.29.
Wanneer gebruik je Spearman’s Rho?
Als je een correlatie wilt toetsen waarbij een van de variabelen ordinaal is, of data hebt met veel outliers (want we werken met rangschikking).
Wanneer gebruik je Kendall’s Tau?
Bij een kleine sample, n < 30.