Hoorcollege 4: Betrouwbaarheid Flashcards
Betrouwbaarheid
De mate waarin testscores variëren wanneer de test tweemaal of vaker onder gelijkblijvende condities aan dezelfde persoon wordt voorgelegd.
95% betrouwbaarheidsinterval
In 95% van de gevallen valt het ware steekproefgemiddelde in dit interval.
Ondergrens: X - (1.96 x SE)
Bovengrens X + (1.96 x SE)
Smal interval?
Breed interval?
Smal interval = weinig zekerheid, veel nauwkeurigheid
Breed interval = veel zekerheid, weinig nauwkeurigheid
Uit welke onderdelen bestaat testscore X
X = T + E
1. Systematisch deel T = varieert niet over onafhankelijke replicaties
2. Toevallige invloeden (error) = variëren wel over onafhankelijke replicaties –> meetfout (bepalen dus de betrouwbaarheid)
Wat zijn de aannames over 1 individu over replicaties?
- Gemiddelde meetfout = 0
- SEi = SX: alle variantie in testscores van een persoon i over onafhankelijke replicaties zit in de meetfout, de meetfout bepaald wat jouw geobserveerde score is.
Wat zijn aannames over de populatie bij één testafname?
- Gemiddelde meetfout = 0, gevolg; gemiddelde X = gemiddelde T
- rEY (correlatie meetfout en iets willekeurigs) = 0, voor alle mogelijke opties van Y. Gevolg: rET = 0 –> meetfout zit in X en niet in T.
Meetfout is compleet willekeurig, dus hangt nergens mee samen behalve met X want die bestaat uit T + E
Wat is de variantie van de geobserveerde score?
S2X = S2T + S2E
Betrouwbaarheid (r)
correlatie tussen testscore bij de ene afname en de testscore bij de andere afname. Rxx ligt tussen de 0 en de 1.
Bij Rxx = 1, is er geen meetfout
Bij Rxx = 0, is er alleen maar meetfout
Type conclusies adhv testscore
-Individueel belangrijk 9-8
-Individueel minder belangrijk 8-7
-Groepsniveau 7-6
Je gaat van Onvoldoende - Voldoende - Goed
Waar gaan we in de klassieke testtheorie vanuit bij de SE
Dat die voor iedereen gelijk is
Wat is de relatie tussen de meetfout en het betrouwbaarheids interval?
- Hoe meer meetfout –> Hoe lager Rxx –> Hoe breder het interval –> hoe meer de verdelingen overlappen –> hoe minder goed we kunnen onderscheiden.
- Hoe minder meetfout –> Hoe hoger Rxx –> Hoe smaller het interval –> Hoe minder overlap –> Hoe beter we kunnen onderscheiden