College 4 Flashcards
Betrouwbaarheid
refereert naar de consistentie of stabiliteit van testresultaten. Je kijkt naar hoe
nauwkeurig de meetprocedure is. Betrouwbaarheid is een vereiste voor validiteit.
classical test theory/true score theory (CTT) – Spearman
elke score op een mentale test
bestaat uit 2 componenten; de werkelijke score en de foutenmarge
Focust op random meetfouten
Systematische meetfouten
meetfouten die systematisch zorgen voor
verschillen in testprestatie tussen individuen of groepen, wat komt door factoren
die niet te maken hebben met het construct dat gemeten wordt. Hier gaat CTT
dus niet over!
3 bronnen van toevallige meetfouten
- content sampling error (selectie van testitems dekken niet het hele domein)
- time sampling error (reflecteert individuele factoren: moeheid, honger, angst, en omgevingsfactoren: herrie, temperatuur)
- administratieve/scoringsfouten (error door manier van beoordeling)
Betrouwbaarheidscoefficient (rxx)
symbool voor betrouwbaarheid van testresultaten
Betrouwbaarheidsindex
reflecteerd de correlatie tussen werkelijke en geobserveerde
scores. Het is de wortel van betrouwbaarheidscoëfficient.
test-hertest betrouwbaarheid
dezelfde test afnemen bij dezelfde groep op verschillende
tijdstippen en de correlatie tussen de scores berekenen (stabiliteit).
parallele testbetrouwbaarheid
de resultaten van twee parallele testen vergelijken (andere
items, maar zelfde construct, format, groep, enz).
interne consistentie
meet fouten gerelateerd aan content sampling, gebaseerd op de relatie
tussen items binnen de test.
generalizability theory
Dit is een uitbreiding van de classical test theory (CTT). CTT laat ons een
ongedifferentieerde error component zien, maar in werkelijkheid bestaat error
uit meer dan één component. Met CTT kan je niet bepalen hoeveel error door
welke componeent komt. Dit kan wel met de generalizability theory.
item-analysis statistics/procedures
zijn kwantitatieve procedures om de kwaliteit en measurement
eigenschappen van individuele test-items te analyseren (niet de gehele test)
difficulty index/item difficulty level
het percentage/proportie personen die de test maken
die correct een item beantwoorden.
percent endorsement
De percent endorsement berekent het percentage van de geteste mensen dat
een bepaald antwoord gegeven heeft.
item-discrimination
de mate waarin een item accuraat
onderscheid kan maken tussen de verschillen tussen personen die de test hebben ingevuld, op het
gemeten construct.
discrimination index (D)
Dit is een statistische manier om de mate van discriminatie te testen. Dit is
gebaseerd op het verschil in prestatie tussen twee groepen. Meestal kiest men
voor de top en laagste groep van 27% van de deelnemers