Week 2 (H5 t/m 7) Flashcards
Wat is de Klassieke test theorie? (KTT)
Geobserveerde scores (x⁰) + meetfouten (xe) = ware score (xt)
Wat zijn er naast de meetfouten van invloed op de ware score?
Tijdelijke en vergankelijke factoren , zoals fysieke gesteldheid en mentale staat.
De invloed van meetfouten heeft twee kenmerken. Leg uit.
> het gemiddelde van alle meetfouten in een test is gelijk aan 0
Meetfouten correleren niet met ware scores, Rte = 0
Wat zijn de vier benaderingen van betrouwbaarheid?
- Betrouwbaarheid in termen van ‘proporties van de variantie’
(Rxx = St² / So²) - Betrouwbaarheid in termen van ‘gebrek aan meetfout error’
(Rxx = 1 - (Se² / So²)) - Betrouwbaarheid in termen van ‘correlaties’
(Rxx = Rot²) - Betrouwbaarheid in termen van ‘gebrek aan correlatie’
(Rxx = 1 - Roe²)
Wat zijn vier methoden om de betrouwbaarheid te schatten?
A. Parallelle testen
- zelfde error variantie
- intercept tussen ware scores is 0
- Helling tussen testen is 1
B. Het tau-equivalent test model
- intercept tussen ware scores is 0
- Helling tussen testen is 1
C. Het essential tau-equivalent test model
- Helling tussen twee testen is 1
D. Congeneric test model
- de ware scores van de testen zijn gelijk
Wat is de domain sampling theorie?
De betrouwbaarheid is de gemiddelde grootte van de correlaties tussen alle mogelijke paren van testen met N items. Dit is geselecteerd uit een gebied (domain) van test items.
Hoe wordt de betrouwbaarheid geschat met alternate forms?
Een paralleltest heeft twee testen. Met deze scores wordt de correlatie tussen testscores berekent.
Het is hierbij nooit zeker of dezelfde ware scores gemeten worden. Ook is er een kans op overdracht/besmetting.
Hoe wordt de hertest betrouwbaarheid berekend?
Dit is mogelijk bij hermeetbare constructen zoals intelligentie en extraversie. Hiermee wordt de error gemeten.
Waarom is de aanname dat ware scores gelijk zijn niet altijd na te streven?
A. Sommige concepten zijn minder stabiel dan andere, zo ontstaan verschillende scores.
B. De lengte van de tussenperiode tijdens het testen kunnen de stabiliteit beïnvloeden.
C. De periode waarin de testen worden afgenomen is van belang (precies in een ontwikkeling)
Wat is interne consistentie?
Een alternatief voor de paralleltest en test-hertest. Hierin wordt gebruik gemaakt van een samengestelde score (van meerdere items). Delen van een test worden als gehele testen behandeld.
Een lange test is betrouwbaarder.
Wat zijn drie manieren om interne consistentie te onderzoeken?
- Split-half betrouwbaarheid (Spearman brown)
- Cronbach’s Alpha
- Gestandaardiseerde Alpha
- Cronbach’s Alpha voor binaire items (KR²⁰)
Welke factoren beïnvloeden de betrouwbaarheid?
A. Gelijkheid tussen de testdelen (bij ongelijkheid worden items verwijderd of herschreven)
B. De lengte van de test (lang is goed)
Welke twee bronnen dragen bij aan testscore-evaluatie?
- puntschatter (point estimate) = de best geschatte waarde
- betrouwbaarheidsinterval (confidence interval) = bij een groot interval is de geobserveerde score een slechte puntschatter van de ware score.
Wat zijn de twee soorten puntschatters?
- Een geschatte ware score op basis van de geobserveerde score
- Een schatting van de ware score op basis van de score op de eerste test.
De tweede keer ligt een score dichterbij het gemiddelde -> regression to the mean.
Waar is de regression to the mean van afhankelijk?
- De betrouwbaarheid van de scores.
- Het verschil in grootte tussen de orgineel geobserveerde score en het gemiddelde.
- Het verschil in richting tussen de orgineel geobserveerde score en het gemiddelde.