Mate van samenhang en correlatie Flashcards
kentall’s tau
= aantal concordante paren - aantal discordante paren gedeeld door aantal paren
kendall’s tau a = negeert ties volkomen
kendalls’s tau b= houdt rekening met ties.
kendall’s b levert lagere waarden van correlatie op dan spearmans rho. Is strenger, gelijke waarden verminderen de hoogte van de correlatie.
Cohen’s kappa
wordt gebruikt bij het bepalen van interbeoordelaarsbetrouwbaarheid.
als rijen in de kruistabel worden gevormd door beoordelaars en de kolommen door beoordelingspunten.
Pearson productmoment-correlatie
bij 1 of -1 is er een perfect lineair verband
maakt gebruik van de informatie over de afstanden tussen de metingen.
Pearson’s r
Voorwaarden:
- pearsons gebruiken bij interval en rationiveau data anders doe je jezelf tekort.
- beide variabelen normaal verdeeld
- geen kromlijnig verband tussen de variabelen
spurious correlation
schijnverband: correlatie tussen 2 variabelen wordt veroorzaakt door een 3e. Zoals verband Filmster in films met aantal verdrinkingen.
illusory correlation
illusoire correlatie: er blijkt geen correlatie te zijn ook al is die er gevoelsmatig wel. Bijv. maanziekte bij volle maan.
multipele correlatie
verband tussen setje variabelen en afzonderlijke variabele
hoofdletter R ipv r.
partiële correlatie
een maat voor de sterkte en richting van een lineaire relatie tussen twee continue variabelen, terwijl er wordt gecontroleerd voor het effect van een of meer andere continue variabelen.
bijv: kinderen die veel lezen zijn dikker
leesvaardigheid correleren met gewicht en corrigeren voor leeftijd.
canonische correlatie
Correlatie tussen setjes variabelen.
Heeft wel een richting: het effect van x1,x2,x3 op y1,y2,y3
bijv. bij jongere kinderen heeft gezinsinkomen meer invloed op leerprestaties school (rekenen, taal, spelling)
restriction of range
variabele neemt maar heel klein bereik aan (voldoende/onvoldoende) terwijl er eigenlijk een groter bereik is (ruwe toetsscore).
intra-klasse correlatie
Van toepassing bij 2 sets metingen (bijv. 2 beoordelaars)
voor het berekenen van correlatie tussen 2 sets metingen op dezelfde variabele en wanneer de absolute waarde ertoe doet.
In dat geval is pearson’s r geen goede maat voor samenhang maar ICC wel.
hoge pearson’s r en ICC laag geeft aan dat er sprake is van verschil in strengheid(ICC) (geen agreement) maar wel consistency(hoge pearson).
kortom:
lage ICC = beoordelaars zijn het oneens
hoge pearsons= ze zijn wel consistent in hun beoordeling
time-lagged’ correlatie
Correlatie van variabele met zichzelf, maar dan op een later meetmoment: hoe stabiel zijn leerlingkenmerken over lange tijd.
time-lagged cross-correlation = 2 variablelen die over tijd worden gecorreleerd met elkaar.
ecologische correlatie
correlatie op basis van gemiddelde waarden tussen variabelen.
Bijv. klasgrootte heeft negatieve correlatie met leerprestaties in 6 landen maar 1 land daarvan daar kan het niet voor gelden.
Als je verbanden op groepsniveau meet en toepast op individu dan is sprake van ecological error.
Bijv. Kiva is effectief voor de groep maar 20% lln voelt zich toch gepest en is niet geholpen.
heel terughoudend zijn met gebruik van groepsgemiddelde voor individu.
Spearman rangcorrelatie
letter p
voor samenhang tussen ordinale variabelen, en ook tussen een ordinale + interval/ratio variabele.
vereist dat er een sterke rangorde is in de waarnemingen.
bivariate correlation
samenhang tussen 2 variabelen
Samenhang berekenen
De variabele met het laagste meetniveau bepaalt de methode die gebruikt wordt om samenhang te berekenen.
Je kunt het alleen over samenhang hebben als variabelen kunnen variëren, een constante kan iet samenhangen want hij kan niet variëren.
vb: samenhang lengte en gewicht is niet te berekenen persoonlijk, wel in een groep omdat daar de variabelen variëren. Persoonlijk is op een meetmoment de lengte/gewicht 1 getal.
optimale situatie is als beide variabelen normaal verdeeld zijn. Bij sterk afwijkende variabelen (meertoppige verdeling) is het niet mogelijk om zinvol samenhang te berekenen.