Thema 6 Flashcards
Het verband tussen een dichotome en een continue variabele kan gezien worden als het verschil tussen 2 gemiddelden
- als 2 groepsgemiddelden verschillen, hangt de dichotome variabele -waarvan de 2 meetwaarden zich manifesteren als 2 groepen- samen met de continue variabele
- dit verschil tussen de 2 groepsgemiddelden heeft ook een standaardfout: het verschil tussen gemiddelden komt namelijk uit een steekproevenverdeling met alle mogelijke verschillen die we hadden kunnen vinden
Cohen’s D
is het verschil tussen 2 groepen, gecorrigeerd voor de standaarddeviatie
- door het verschil tussen de gemiddelden te delen door de standaarddeviatie, krijgen we een schaal onafhankelijke maat voor het verschil tussen de groepen
- bijna hetzelfde als berekenen Z-waarde, maar Z-waarde is “ verschil van een enkel datapunt t.o.v. het gemiddelde en Cohen’s D “het verschil tussen 2 gemiddelden”
Bij Cohen’s d wordt Y gebruikt ipv X omdat het gebruikelijk is om de afhankelijke variabele met Y te duiden en de onafhankelijke variabele met X
Wanneer we naar het verschil tussen gemiddelde kijken, is de variabele waarvan we het gemiddelde berekenen meestal de afhankelijke varriabele (Y)
en de variabele waarvan de meetwaarden de groepen bepalen, de onafhankelijke variabele (X)
- Cohen’s D is het verschil tussen gemiddelden, uitegrukt in standaarddeviaties:”
* Cohen’s d van .50 = 2 gemiddelden liggen een halve standaarddeviatie uit elkaar
* Cohen’s d van .80 = liggen 8 tiende SD uit elkaar
- bij een Cohen’s d van .20 overlappen de populatie verdelingen 92%. Dit betekent dat maar 8% van de scores zó extreem zijn in de betreffende populatie, dat ze niet voorkomen in de andere populatie.
Net als bij correlaties en regressie coëfficiënten is het ook voor het verschil tussen 2 gemiddelden mogleliljk om een P-waarde te berekenen.
Dee P-waarde is de P-waarde voor het ruwe verschil tussen de gemiddelden (in de oorspronkelijke meeteenheid) en ook de P-waarde van de bijbehorende Cohen’s d (methode = t-toets)
T-Toets heeft 2 stappen
1) T-waarde berekenen
2) Met behulp van T-verdeling P-waarde bepalen
- T-waarde berekening is bijna zelfde als Z-waarde/ Cohen’s D
- om T-waarde te krijgen, wordt het verschil tussen beide gemiddelden dus gedeeld door de standaardfout van dat verschil
- de standaardfout is de naam voor de standaarddeviatie in een steekproevenverdeling; een T-verdeling is zo’n steekproevenverdeling
Z-score van 3 = datapunt ligt 3 standaarddeviaties boven gemiddelde
T-waarde van -4 = de 2 gemiddelde liggen 4 standaardfouten van elkaar
Om rekening te houden met mogelijke verschillende varianties tussen de 2 groepen, bestaat er een correctie voor de t-toets:
Welch’s T-toets
- Of varianties tussen 2 groepen gelijk zijn kan gecontroleerd worden met een Levene’s toets
net als bij correlaties wort bij t-toetsen ook gesproken over Power
= aantal deelnemers dat benodigd is
In al het onderzoek geldt; hoe meer P-waarden er worden berekend, hoe groter de kans wordt op type 1 fouten
(hoe meer P-waarden, hoe meer deelnemers je nodig hebt)
Het onderzoeken van het verband tussen een dichotome variabele en een continue variabele vereist veel meer deelnemers dan het ondderzoeken van het verband tussen 2 continue variabelen
- hoe lager het meetniveau van de variabelen, hoe lager de power
( categorische variabelen vermijden)
Om te toetsen of K steekproeven gelijke varianties hebben (en dus homoscedastisch zijn) stelde Levene een robuuste F-toets voor (Levene’s toets)
in statistische toetsen, waar groepen vergeleken worden en de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn kan Levene dit verifieren
alternatief is Bartlett (wanneer vrijwel geen twijfel is dat de populatieverdeling normaal verdeeld is)
Levene’s toets is een one way ANOVA waarbij de afhankelijke variabele het (absolute) verschil is tussen een observatie en
het centrum (gemiddelde) van de groep waar deze observatie toe behoort
* de Levene’s toets is F-verdeeld en heeft als nulhypothese dat alle varianties hetzelfde zijn
* Levene’s test significant = de assumptie van gelijke varianties is geschonden
Gepaarde T-toets:
als je bij dezelfde mensen twee keer een meting doet (voor - en nameting) is er een verband; het zijn geen onafhankelijke, maar afhankelijke/gepaarde metingen
Als 2 gropene mensen (bv) de toegankelijkheid van een folder beoordelen, bestaat een deel van de spreiding (variantie) tussen de meetwaarden uit individuele verschillen
- de variantie door persoonlijke verschillen manifesteert zich in zo’n “Between-Subjects-Design” als meetfout en resulteert in hogere standaarddeviatie
- bij gepaarde meetwaarden elimineer je persoonlijkheids kenmerken
- dezelfde personen vaker gemeten = “Within-Subjects- Design
Het berekenen van de T-waarde bij de gepaarde/afhankelijke T-toets is makkelijker dan de onafhankelijke T-toets
- per deelnemer het verschil tussen 2 datapunten berekenen, waarna nog maar één datareeks met de verschilscore per deelnemer overblijft
- T-waarde bij gepaarde T-toets is het gemiddelde gedeeld door de standaardfout
- berekening voor Cohen’s d; ipv het verschil tussen de gemiddelden wordt het gemiddelde van de verschilscores gedeeld door de standaarddeviatie
Wat is het gevolg van een grotere standaarddeviatie voor de waarde van Cohen’s d
- omdat Cohen’s d berekend wordt door het verschil tussen de gemiddelden te delen door de standaarddeviatie, wordt Cohen’s d kleiner als de standaarddeviatie groter wordt; het verband tussen de variabelen wordt zwakker.
Als de steekproefomvang gelijk blijft, wordt ook de standaardfout groter als de standaarddeviatie stijgt