Thema 6 - t-toetsen en Cohen's d Flashcards

1
Q

wat is het nut om de gemiddelde van de ene groep en het gemiddelde van de andere groep te kennen? (vb gemiddelde vd exp.groep en gemiddelde vd controle groep)

A
  • als het gemiddelde vd ene groep hoger is dan het gemiddelde vd andere groep, kunnen we iemands score op de afhankelijke variabele beter voorspellen als we weten tot welke groep iemand behoort, dan als we dat niet weten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

hoe komt het dat het verschil tussen groepsgemiddelden ook een standaardfout heeft?

A

Het verschil tussen gemiddelden komt namelijk uit een steekproevenverdeling met alle mogelijke verschillen die we hadden kunnen vinden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

hoe is de steekproevenverdeling van het verschil van gemiddelden verdeeld?

A
  • de steekproevenverdeling van het verschil van gemiddelden is verdeeld volgens een t-verdeling met een aantal vrijheidsgraden gelijk aan de steekproefomvang minus twee (twee dichotome variabelen)
  • het verschil tussen gemiddelden is een puntschatting uit een gegeven steekproef en is niet informatief voor de populatie => daarom een betrouwbaarheidsinterval nodig
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

hoe stellen we een betrouwbaarheidsinterval voor het verschil tussen gemiddelden op?

A
  • de t-verdeling kan gebruikt worden om het BI voor het verschil van gemiddelden op te stellen
  • BI = steekproefwaarde +/- breedte-index * standaardfout
  • breedte-index = kritieke t-waarde
  • steekproefwaarde = het verschil tussen de gemiddelde
  • standaardfout= gegeven via software
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

wat is de kritieke t-waarde?

A
  • de kritieke t-waarde is de breedte-index die komt uit de t-verdeling (zie tabel of software)
  • die tabel bevat een aantal kolommen die de kritieke t-waarden tonen die corresponderen met een bepaald BI
  • tot aan de 100 vrijheidsgraden verschillen de kritieke t-waarden -> daarboven is de kritische t-waarde = 1,96
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

wat hebben we nodig om te bepalen volgens welke t-verdeling het verschil tss gemiddelden verdeeld is

A
  • om te bepalen volgens welke t-verdeling het verschil tss de gemiddelden verdeeld is, moeten we weten hoeveel vrijheidsgraden er zijn -> het aantal vrijheidsgraden van de t-verdeling is de steekproefomvang minus 2 (dichotome variabele)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

wat kan je besluiten op basis van een BI van het verschil tss gemiddelden?

A
  • op vh BI van het verschil tss gemiddelden kunnen we besluiten dat het verschil tussen de gemiddelden tss de twee groepen in de populatie verschillen
  • ook bij een negatief BI aan beide einden is de conclusie dat in de populatie de gemiddelden waarschijnlijk verschillen
  • !! als het BI aan één uiteinde negatief is, maar aan het andere einde positief => dan kunnen we concluderen dat het niet plausibel is dat de gemiddelden in de populatie verschillen !!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

wat is het voordeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.

A
  • een voordeel is dat het verschil in groepsgemiddelden wordt uitgedrukt in een concrete eenheid -> makkelijker te interpreteren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

wat is het nadeel van een verschil tussen de gemiddelden dat afhankelijk is van de schaal waarop de continue variabelen gemeten hebben.

A
  • het is dan moeilijk te bepalen hoe relevant dit verschil is
  • de sterkte van dit verband is dan niet te vergelijken met verschillen uit andere studies, tenzij in die andere studies exact dezelfde meetinstrumenten gebruikt zijn
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

hoe kunnen we een verschil tussen gemiddelden dat afhankelijk is van de schaal waarop de continue variabele gemeten wordt, onafhankelijk maken van die schaal?

A

Cohen’s d = een maat voor het verschil tss gemiddelden die onafhankelijk is van de schaal vd continue variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

wat is Cohen’s d? en wat is de formule daarvoor?

A
  • **Cohen’s d **= het verschil tss twee groepen, gecorrigeerd voor de standaarddeviatie.
  • En de standaarddeviatie is een maat voor de meetschaal van de betreffende variabele => door het verschil tussen de gemiddelden te delen door de sd krijgen we een schaalonafhankelijke maat voor het verschil tss de groepen
  • Cohen’s d = het verschil tss de gemiddelden uitgedrukt in standaardeviaties -> een Cohen’s d van .50 betekent dat de twee gemiddelden een halve standaardeviatie uit elkaar liggen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

wat is een z-waarde?

A
  • de z-waarde die correspondeert met elk datapunt = is gelijk aan het verschil van dat datapunt en het gemiddelde, gedeeld door de standaardeviatie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

wat betekent de p-waarde van een onafhankelijke t-toets

A
  • p-waarde is de p-waarde voor het ruwe verschil tussen de gemiddelden in de oorspronkelijke meeteenheid EN ook de p-waarde vd bijhorende Cohen’s d
  • de methode om die p-waarde te berekenen heet de onafhankelijke t-toets
    –> ‘t’ komt van de t-verdeling die gebruikt wordt
    –> ‘toets’ wordt gebruikt omdat binnen de NHST de p-waarde wordt gezien als middel op de nulhypothese te toetsen
    –> ‘de nulhypothese’ hier is, is de hypothese dat de variabelen niet samenhangen, dat betekent in dit geval dat het verschil tss de gemiddelden nul is
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

uit welke twee stappen bestaat de t-toets?

A
  1. eerst wordt de t-waarde berekend
  2. daarna met behulp van de t-verdeling wordt de bijhorende p-waarde bepaald
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

hoe wordt de t-waarde berekend?

A
  • formule voor de t-waarde (vgl met de formule voor de z-waarde) = het verschil tss beide gemiddelden gedeeld door de standaardfout van dat verschil
  • (standaardfout is de naam vd standaardeviatie in een steekproevenverdeling en de t-verdeling is een steekproevenverdeling)
  • als de t-waarde berekend is, dan kan de bijlhorende p-waarde worden opgezocht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

wat betekent een t-waarde van -4?

A

-> een t-waarde van -4 betekent dat de twee gemiddelden 4 standaardfouten van elkaar liggen

17
Q

waarvoor wordt de Welch’s t-toets gebruikt?

A

de Welch’s t-toets wordt gebruikt om rekening te houden met mogelijke verschillende varianties tussen twee groepen -> het is een correctie voor de t-toets

18
Q

hoe kan je controleren of de varianties tussen twee groepen GELIJK ZIJN?

A

of varianties tussen twee groepen gelijk zijn kan gecontroleerd worden met een Levene’s toets

19
Q

hoe kan je toetsen op homoscedasticiteit?

A
  • om te toetsen of steekproeven gelijke varianties hebben (homoscedastisch zijn) is er de F-toets of Levene’s toets
  • in statistische toetsen waarin groepen vergeleken worden, én de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, kan de Levene’s toets of de F-toets gebruikt worden om die assumptie te toetsen
20
Q

hoe de Levene’s toets gebruiken? wat is het uitgangspunt?

A
  • De Levene’s toets is F-verdeeld en heeft als nullypothese dat alle varianties hetzelfde zijn
  • => als de Levene’s test een significante F-waarde heeft (p<alfa, en alfa meestal .05) dan verwerpt men de nulhypothese dat alle varianties hetzelfde zijn
  • => Levene’s test significant betekent dat de assumptie van gelijke varianties geschonden is
21
Q

welke zijn de assumpties van de t-toets?

A
  1. de observaties zijn onafhankelijk (groepen vgl die los van elkaar staan)
  2. de **residuen normaal verdeeld **zijn (het verschil tss geobserveerde en werkelijke waarden zijn overal gelijk -> test voor normaliteit Shapiro-Wilk)
  3. de varianties tss groepen zijn gelijk (= homoscedasticiteit -> toetsen met Levene’s test)
22
Q

wat zijn afhankelijke of gepaarde metingen?

A

-> als je bij dezelfde personen twee keer een meting doet, is er wel een verband tss die twee metingen, het zijn geen onafhankelijke, maar afhankelijke of gepaarde metingen

23
Q

wat is een within-subjects design?

A

je vergelijkt de score van elke persoon namelijk met een andere score vn diezelfde persoon -> als dezelfde personen vaker gemeten worden spreken we van een within-subjects design

24
Q

hoe manifesteert zich de variantie van persoonlijke verschillen in een between-subjects design?

A
  • de variantie door persoonlijke verschillen manifesteert zich in een between-subjects design als een meetfout en resulteert in een grotere standaardeviatie
25
waarom is het berekenen van de t-waarde bij de gepaarde t-toets (of afhankelijke t-toets) makkelijker dan bij de ongepaarde t-toets (onafhankelijke t-toets)?
- dat komt omdat je nu per deelnemer het verschil tussen de twee datapunten kunt berekenen, waarna er nog maar één datareeks met de verschilscore per deelnemer overblijft. - deze datareeks heeft een gemiddelde, sd en een se => !! de t-waarde bij de gepaarde t-toets is het gemiddelde gedeeld door de standaardfout (se)!!
26
hoe gebeurt de berekening van Cohen's d bij de gepaarde t-toets?
bij de gepaarde t-toets wordt bij de berekening van Cohen's d in plaats van het verschil tss de gemiddelden, wordt het gemiddelde van de verschilscores gedeeld door de standaarddeviatie
27
wat is het verschil voor de power tss de gepaarde t-toetsen en de onafhankelijke t-toetsen?
het grote voordeel voor de power van de gepaarde t-toets is dat er veel minder deelnemers nodig zijn -> elke deelnemer levert namelijk twee datapunten bij de gepaarde t-toets
28
wat is het effect op de Cohen's d van een grotere sd?
- Cohen's d wordt berekend door het verschil tss de gemiddelden te delen door de sd => Cohen's d wordt dus kleiner als de sd groter wordt - sd die groter wordt -> dan wordt het verband tss de twee variabelen dus zwakker - als de steekproefomvang gelijk blijft, wordt ook de standaardfout groter als de sd stijgt - omdat de t-waarde berekend wordt door het verschil tss de gemiddelden te delen door de standaardfout, wordt ook de t-waarde kleiner als de sd groter wordt
29
wat betekent het als t-waarde kleiner wordt of minder extreem bij afhankelijke steekproeven?
- een gevonden t-waarde die minder extreem is betekent dat onder de nulhypothese dat het waarschijnlijker wordt om een dergelijke t-waarde te vinden => de p-waarde, die deze kans uitdrukt, wordt dus groter en zal minder vaak onder het significantieniveau liggen => dat alles betekent dan dat de power van de toets lager wordt als de sd groter is EN de BI worden dan overigens ook breder (want berekend met de standaardfout die meegroeit met de sd)