Thema 6 - t-toetsen en Cohen's d Flashcards
wat is het nut om de gemiddelde van de ene groep en het gemiddelde van de andere groep te kennen? (vb gemiddelde vd exp.groep en gemiddelde vd controle groep)
- als het gemiddelde vd ene groep hoger is dan het gemiddelde vd andere groep, kunnen we iemands score op de afhankelijke variabele beter voorspellen als we weten tot welke groep iemand behoort, dan als we dat niet weten
hoe komt het dat het verschil tussen groepsgemiddelden ook een standaardfout heeft?
Het verschil tussen gemiddelden komt namelijk uit een steekproevenverdeling met alle mogelijke verschillen die we hadden kunnen vinden
hoe is de steekproevenverdeling van het verschil van gemiddelden verdeeld?
- de steekproevenverdeling van het verschil van gemiddelden is verdeeld volgens een t-verdeling met een aantal vrijheidsgraden gelijk aan de steekproefomvang minus twee (twee dichotome variabelen)
- het verschil tussen gemiddelden is een puntschatting uit een gegeven steekproef en is niet informatief voor de populatie => daarom een betrouwbaarheidsinterval nodig
hoe stellen we een betrouwbaarheidsinterval voor het verschil tussen gemiddelden op?
- de t-verdeling kan gebruikt worden om het BI voor het verschil van gemiddelden op te stellen
- BI = steekproefwaarde +/- breedte-index * standaardfout
- breedte-index = kritieke t-waarde
- steekproefwaarde = het verschil tussen de gemiddelde
- standaardfout= gegeven via software
wat is de kritieke t-waarde?
- de kritieke t-waarde is de breedte-index die komt uit de t-verdeling (zie tabel of software)
- die tabel bevat een aantal kolommen die de kritieke t-waarden tonen die corresponderen met een bepaald BI
- tot aan de 100 vrijheidsgraden verschillen de kritieke t-waarden -> daarboven is de kritische t-waarde = 1,96
wat hebben we nodig om te bepalen volgens welke t-verdeling het verschil tss gemiddelden verdeeld is
- om te bepalen volgens welke t-verdeling het verschil tss de gemiddelden verdeeld is, moeten we weten hoeveel vrijheidsgraden er zijn -> het aantal vrijheidsgraden van de t-verdeling is de steekproefomvang minus 2 (dichotome variabele)
wat kan je besluiten op basis van een BI van het verschil tss gemiddelden?
- op vh BI van het verschil tss gemiddelden kunnen we besluiten dat het verschil tussen de gemiddelden tss de twee groepen in de populatie verschillen
- ook bij een negatief BI aan beide einden is de conclusie dat in de populatie de gemiddelden waarschijnlijk verschillen
- !! als het BI aan één uiteinde negatief is, maar aan het andere einde positief => dan kunnen we concluderen dat het niet plausibel is dat de gemiddelden in de populatie verschillen !!
wat is het voordeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.
- een voordeel is dat het verschil in groepsgemiddelden wordt uitgedrukt in een concrete eenheid -> makkelijker te interpreteren
wat is het nadeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.
- het is dan moeilijk te bepalen hoe relevant dit verschil is
- de sterkte van dit verband is dan niet te vergelijken met verschillen uit andere studies, tenzij in die andere studies exact dezelfde meetinstrumenten gebruikt zijn
hoe kunnen we een verschil tussen gemiddelden dat afhankelijk is van de schaal waarop de continue variabele gemeten wordt, onafhankelijk maken van die schaal?
Cohen’s d = een maat voor het verschil tss gemiddelden die onafhankelijk is van de schaal vd continue variabele
wat is Cohen’s d? en wat is de formule daarvoor?
- **Cohen’s d **= het verschil tss twee groepen, gecorrigeerd voor de standaarddeviatie.
- En de standaarddeviatie is een maat voor de meetschaal van de betreffende variabele => door het verschil tussen de gemiddelden te delen door de sd krijgen we een schaalonafhankelijke maat voor het verschil tss de groepen
- Cohen’s d = het verschil tss de gemiddelden uitgedrukt in standaardeviaties -> een Cohen’s d van .50 betekent dat de twee gemiddelden een halve standaardeviatie uit elkaar liggen
wat is een z-waarde?
- de z-waarde die correspondeert met elk datapunt = is gelijk aan het verschil van dat datapunt en het gemiddelde, gedeeld door de standaardeviatie
wat betekent de p-waarde van een onafhankelijke t-toets
- p-waarde is de p-waarde voor het ruwe verschil tussen de gemiddelden in de oorspronkelijke meeteenheid EN ook de p-waarde vd bijhorende Cohen’s d
- de methode om die p-waarde te berekenen heet de onafhankelijke t-toets
–> ‘t’ komt van de t-verdeling die gebruikt wordt
–> ‘toets’ wordt gebruikt omdat binnen de NHST de p-waarde wordt gezien als middel op de nulhypothese te toetsen
–> ‘de nulhypothese’ hier is, is de hypothese dat de variabelen niet samenhangen, dat betekent in dit geval dat het verschil tss de gemiddelden nul is
uit welke twee stappen bestaat de t-toets?
- eerst wordt de t-waarde berekend
- daarna met behulp van de t-verdeling wordt de bijhorende p-waarde bepaald
hoe wordt de t-waarde berekend?
- formule voor de t-waarde (vgl met de formule voor de z-waarde) = het verschil tss beide gemiddelden gedeeld door de standaardfout van dat verschil
- (standaardfout is de naam vd standaardeviatie in een steekproevenverdeling en de t-verdeling is een steekproevenverdeling)
- als de t-waarde berekend is, dan kan de bijlhorende p-waarde worden opgezocht
wat betekent een t-waarde van -4?
-> een t-waarde van -4 betekent dat de twee gemiddelden 4 standaardfouten van elkaar liggen
waarvoor wordt de Welch’s t-toets gebruikt?
de Welch’s t-toets wordt gebruikt om rekening te houden met mogelijke verschillende varianties tussen twee groepen -> het is een correctie voor de t-toets
hoe kan je controleren of de varianties tussen twee groepen GELIJK ZIJN?
of varianties tussen twee groepen gelijk zijn kan gecontroleerd worden met een Levene’s toets
hoe kan je toetsen op homoscedasticiteit?
- om te toetsen of steekproeven gelijke varianties hebben (homoscedastisch zijn) is er de F-toets of Levene’s toets
- in statistische toetsen waarin groepen vergeleken worden, én de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, kan de Levene’s toets of de F-toets gebruikt worden om die assumptie te toetsen
hoe de Levene’s toets gebruiken? wat is het uitgangspunt?
- De Levene’s toets is F-verdeeld en heeft als nullypothese dat alle varianties hetzelfde zijn
- => als de Levene’s test een significante F-waarde heeft (p<alfa, en alfa meestal .05) dan verwerpt men de nulhypothese dat alle varianties hetzelfde zijn
- => Levene’s test significant betekent dat de assumptie van gelijke varianties geschonden is
welke zijn de assumpties van de t-toets?
- de observaties zijn onafhankelijk (groepen vgl die los van elkaar staan)
- de **residuen normaal verdeeld **zijn (het verschil tss geobserveerde en werkelijke waarden zijn overal gelijk -> test voor normaliteit Shapiro-Wilk)
- de varianties tss groepen zijn gelijk (= homoscedasticiteit -> toetsen met Levene’s test)
wat zijn afhankelijke of gepaarde metingen?
-> als je bij dezelfde personen twee keer een meting doet, is er wel een verband tss die twee metingen, het zijn geen onafhankelijke, maar afhankelijke of gepaarde metingen
wat is een within-subjects design?
je vergelijkt de score van elke persoon namelijk met een andere score vn diezelfde persoon -> als dezelfde personen vaker gemeten worden spreken we van een within-subjects design
hoe manifesteert zich de variantie van persoonlijke verschillen in een between-subjects design?
- de variantie door persoonlijke verschillen manifesteert zich in een between-subjects design als een meetfout en resulteert in een grotere standaardeviatie