- de z-waarde die correspondeert met elk datapunt = is gelijk aan het verschil van dat datapunt en het gemiddelde, gedeeld door de standaardeviatie

Thema 6 - t-toetsen en Cohen's d Flashcards by Paul Van Geyt

wat is het nut om de gemiddelde van de ene groep en het gemiddelde van de andere groep te kennen? (vb gemiddelde vd exp.groep en gemiddelde vd controle groep)

als het gemiddelde vd ene groep hoger is dan het gemiddelde vd andere groep, kunnen we iemands score op de afhankelijke variabele beter voorspellen als we weten tot welke groep iemand behoort, dan als we dat niet weten

How well did you know this?

Not at all

Perfectly

hoe komt het dat het verschil tussen groepsgemiddelden ook een standaardfout heeft?

Het verschil tussen gemiddelden komt namelijk uit een steekproevenverdeling met alle mogelijke verschillen die we hadden kunnen vinden

How well did you know this?

Not at all

Perfectly

hoe is de steekproevenverdeling van het verschil van gemiddelden verdeeld?

de steekproevenverdeling van het verschil van gemiddelden is verdeeld volgens een t-verdeling met een aantal vrijheidsgraden gelijk aan de steekproefomvang minus twee (twee dichotome variabelen)
het verschil tussen gemiddelden is een puntschatting uit een gegeven steekproef en is niet informatief voor de populatie => daarom een betrouwbaarheidsinterval nodig

How well did you know this?

Not at all

Perfectly

hoe stellen we een betrouwbaarheidsinterval voor het verschil tussen gemiddelden op?

de t-verdeling kan gebruikt worden om het BI voor het verschil van gemiddelden op te stellen
BI = steekproefwaarde +/- breedte-index * standaardfout
breedte-index = kritieke t-waarde
steekproefwaarde = het verschil tussen de gemiddelde
standaardfout= gegeven via software

How well did you know this?

Not at all

Perfectly

wat is de kritieke t-waarde?

de kritieke t-waarde is de breedte-index die komt uit de t-verdeling (zie tabel of software)
die tabel bevat een aantal kolommen die de kritieke t-waarden tonen die corresponderen met een bepaald BI
tot aan de 100 vrijheidsgraden verschillen de kritieke t-waarden -> daarboven is de kritische t-waarde = 1,96

How well did you know this?

Not at all

Perfectly

wat hebben we nodig om te bepalen volgens welke t-verdeling het verschil tss gemiddelden verdeeld is

om te bepalen volgens welke t-verdeling het verschil tss de gemiddelden verdeeld is, moeten we weten hoeveel vrijheidsgraden er zijn -> het aantal vrijheidsgraden van de t-verdeling is de steekproefomvang minus 2 (dichotome variabele)

How well did you know this?

Not at all

Perfectly

wat kan je besluiten op basis van een BI van het verschil tss gemiddelden?

op vh BI van het verschil tss gemiddelden kunnen we besluiten dat het verschil tussen de gemiddelden tss de twee groepen in de populatie verschillen
ook bij een negatief BI aan beide einden is de conclusie dat in de populatie de gemiddelden waarschijnlijk verschillen
!! als het BI aan één uiteinde negatief is, maar aan het andere einde positief => dan kunnen we concluderen dat het niet plausibel is dat de gemiddelden in de populatie verschillen !!

How well did you know this?

Not at all

Perfectly

wat is het voordeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.

een voordeel is dat het verschil in groepsgemiddelden wordt uitgedrukt in een concrete eenheid -> makkelijker te interpreteren

How well did you know this?

Not at all

Perfectly

wat is het nadeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.

het is dan moeilijk te bepalen hoe relevant dit verschil is
de sterkte van dit verband is dan niet te vergelijken met verschillen uit andere studies, tenzij in die andere studies exact dezelfde meetinstrumenten gebruikt zijn

How well did you know this?

Not at all

Perfectly

hoe kunnen we een verschil tussen gemiddelden dat afhankelijk is van de schaal waarop de continue variabele gemeten wordt, onafhankelijk maken van die schaal?

Cohen’s d = een maat voor het verschil tss gemiddelden die onafhankelijk is van de schaal vd continue variabele

How well did you know this?

Not at all

Perfectly

wat is Cohen’s d? en wat is de formule daarvoor?

**Cohen’s d **= het verschil tss twee groepen, gecorrigeerd voor de standaarddeviatie.
En de standaarddeviatie is een maat voor de meetschaal van de betreffende variabele => door het verschil tussen de gemiddelden te delen door de sd krijgen we een schaalonafhankelijke maat voor het verschil tss de groepen
Cohen’s d = het verschil tss de gemiddelden uitgedrukt in standaardeviaties -> een Cohen’s d van .50 betekent dat de twee gemiddelden een halve standaardeviatie uit elkaar liggen

How well did you know this?

Not at all

Perfectly

wat is een z-waarde?

de z-waarde die correspondeert met elk datapunt = is gelijk aan het verschil van dat datapunt en het gemiddelde, gedeeld door de standaardeviatie

How well did you know this?

Not at all

Perfectly

wat betekent de p-waarde van een onafhankelijke t-toets

p-waarde is de p-waarde voor het ruwe verschil tussen de gemiddelden in de oorspronkelijke meeteenheid EN ook de p-waarde vd bijhorende Cohen’s d
de methode om die p-waarde te berekenen heet de onafhankelijke t-toets
–> ‘t’ komt van de t-verdeling die gebruikt wordt
–> ‘toets’ wordt gebruikt omdat binnen de NHST de p-waarde wordt gezien als middel op de nulhypothese te toetsen
–> ‘de nulhypothese’ hier is, is de hypothese dat de variabelen niet samenhangen, dat betekent in dit geval dat het verschil tss de gemiddelden nul is

How well did you know this?

Not at all

Perfectly

uit welke twee stappen bestaat de t-toets?

eerst wordt de t-waarde berekend
daarna met behulp van de t-verdeling wordt de bijhorende p-waarde bepaald

How well did you know this?

Not at all

Perfectly

hoe wordt de t-waarde berekend?

formule voor de t-waarde (vgl met de formule voor de z-waarde) = het verschil tss beide gemiddelden gedeeld door de standaardfout van dat verschil
(standaardfout is de naam vd standaardeviatie in een steekproevenverdeling en de t-verdeling is een steekproevenverdeling)
als de t-waarde berekend is, dan kan de bijlhorende p-waarde worden opgezocht

How well did you know this?

Not at all

Perfectly

wat betekent een t-waarde van -4?

-> een t-waarde van -4 betekent dat de twee gemiddelden 4 standaardfouten van elkaar liggen

waarvoor wordt de Welch’s t-toets gebruikt?

de Welch’s t-toets wordt gebruikt om rekening te houden met mogelijke verschillende varianties tussen twee groepen -> het is een correctie voor de t-toets

hoe kan je controleren of de varianties tussen twee groepen GELIJK ZIJN?

of varianties tussen twee groepen gelijk zijn kan gecontroleerd worden met een Levene’s toets

hoe kan je toetsen op homoscedasticiteit?

om te toetsen of steekproeven gelijke varianties hebben (homoscedastisch zijn) is er de F-toets of Levene’s toets
in statistische toetsen waarin groepen vergeleken worden, én de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, kan de Levene’s toets of de F-toets gebruikt worden om die assumptie te toetsen

hoe de Levene’s toets gebruiken? wat is het uitgangspunt?

De Levene’s toets is F-verdeeld en heeft als nullypothese dat alle varianties hetzelfde zijn
=> als de Levene’s test een significante F-waarde heeft (p<alfa, en alfa meestal .05) dan verwerpt men de nulhypothese dat alle varianties hetzelfde zijn
=> Levene’s test significant betekent dat de assumptie van gelijke varianties geschonden is

welke zijn de assumpties van de t-toets?

de observaties zijn onafhankelijk (groepen vgl die los van elkaar staan)
de **residuen normaal verdeeld **zijn (het verschil tss geobserveerde en werkelijke waarden zijn overal gelijk -> test voor normaliteit Shapiro-Wilk)
de varianties tss groepen zijn gelijk (= homoscedasticiteit -> toetsen met Levene’s test)

wat zijn afhankelijke of gepaarde metingen?

-> als je bij dezelfde personen twee keer een meting doet, is er wel een verband tss die twee metingen, het zijn geen onafhankelijke, maar afhankelijke of gepaarde metingen

wat is een within-subjects design?

je vergelijkt de score van elke persoon namelijk met een andere score vn diezelfde persoon -> als dezelfde personen vaker gemeten worden spreken we van een within-subjects design

hoe manifesteert zich de variantie van persoonlijke verschillen in een between-subjects design?

de variantie door persoonlijke verschillen manifesteert zich in een between-subjects design als een meetfout en resulteert in een grotere standaardeviatie

waarom is het berekenen van de t-waarde bij de gepaarde t-toets (of afhankelijke t-toets) makkelijker dan bij de ongepaarde t-toets (onafhankelijke t-toets)?

- dat komt omdat je nu per deelnemer het verschil tussen de twee datapunten kunt berekenen, waarna er nog maar één datareeks met de verschilscore per deelnemer overblijft. - deze datareeks heeft een gemiddelde, sd en een se => !! de t-waarde bij de gepaarde t-toets is het gemiddelde gedeeld door de standaardfout (se)!!

hoe gebeurt de berekening van Cohen's d bij de gepaarde t-toets?

bij de gepaarde t-toets wordt bij de berekening van Cohen's d in plaats van het verschil tss de gemiddelden, wordt het gemiddelde van de verschilscores gedeeld door de standaarddeviatie

wat is het verschil voor de power tss de gepaarde t-toetsen en de onafhankelijke t-toetsen?

het grote voordeel voor de power van de gepaarde t-toets is dat er veel minder deelnemers nodig zijn -> elke deelnemer levert namelijk twee datapunten bij de gepaarde t-toets

wat is het effect op de Cohen's d van een grotere sd?

- Cohen's d wordt berekend door het verschil tss de gemiddelden te delen door de sd => Cohen's d wordt dus kleiner als de sd groter wordt - sd die groter wordt -> dan wordt het verband tss de twee variabelen dus zwakker - als de steekproefomvang gelijk blijft, wordt ook de standaardfout groter als de sd stijgt - omdat de t-waarde berekend wordt door het verschil tss de gemiddelden te delen door de standaardfout, wordt ook de t-waarde kleiner als de sd groter wordt

wat betekent het als t-waarde kleiner wordt of minder extreem bij afhankelijke steekproeven?

- een gevonden t-waarde die minder extreem is betekent dat onder de nulhypothese dat het waarschijnlijker wordt om een dergelijke t-waarde te vinden => de p-waarde, die deze kans uitdrukt, wordt dus groter en zal minder vaak onder het significantieniveau liggen => dat alles betekent dan dat de power van de toets lager wordt als de sd groter is EN de BI worden dan overigens ook breder (want berekend met de standaardfout die meegroeit met de sd)