testen en toetsen Flashcards
psychologische test
meetinstrument om uitspraken te doen over psychologische kenmerken van individu
Kwaliteit van testen
- betrouwbaarheid
- validiteit
- normering
kwalitatieve prestatietests
test zegt zowel iets over prestatieniveau als over gedragswijze.
bijv. dyslexie: leestest is slecht + bepaald soort fouten
Schooltoets
test voor prestatieniveau met doel de aangeleerde kennis of vaardigheden te meten. ook wel vorderingentest.
een instrument om vast te stellen of een leerling geleerd heeft of om te bepalen welke kennis of vaardigheden nog niet beheerst worden
betrouwbaarheid (ρ)
als meting bij herhaling dezelfde uitkomst geeft.
betrouwbaarheid is een eigenschap van metingen en niet van meetinstrumenten.
is een meting niet betrouwbaar, dan kan deze ook niet valide zijn.
een betrouwbare meting kan wel niet valide zijn (meet iets anders).
De beste garantie voor een hoge toetsbetrouwbaarheid is een toets die veel items van de juiste kwaliteit bevat.
toets is betrouwbaar vanaf 0,7 en bij grote consequenties 0,9
validiteit
+ de vormen van validiteit
Meet de toets wat je wilt meten
Er zijn meerdere vormen van validiteit mogelijk:
- inhoudsvaliditeit= meet toets de inhoud wel
- begripsvaliditeit= meet toets begrip wel
- criteriumvaliditeit (kun je voorspellingen doen)
- complexiteit =
Je moet bewijs verzamelen dat je toets valide is.
face validity
validiteit die ‘op het oog’ geborgd is bijv. een dictee.
desondanks is empirische onderbouwing wel nodig door testconstructuur.
p-waarde (probability)
De moeilijkheid van de toetsvraag
s de proportie studenten die de vraag correct heeft beantwoord. De p
staat voor probability
(aantal goed/totaal aantal vragen= p waarde)
Rit-waarde
relatie item toets
Het onderscheidend vermogen van de toetsvraag
Met andere woorden:
Scoort de student die de leerdoelen beter beheerst een hogere score
op de toets dan een andere leerling.
(correlatie van items)
Cronbachs alfa
zegt iets over de betrouwbaarheid van de gehele toets
(maar nog niets over de inhoud van de toets)
Hoe langer de toets, hoe hoger de cronbach’s alfa.
interne consistentie > meten alle items dezelfde vaardigheid/eigenschap
is altijd een momentopname: geldt alleen bij deze toets bij deze populatie op dit moment.
trekking uit populatie met onbekend gemiddelde en onbekende variantie
is in grote steekproef pas betrouwbaar, vanaf 500 personen.
In homogene groep met weinig spreiding is cronbach’s alfa relatief laag, er is weinig variantie.
bij gedragstesten vaak alleen cronbach’s alfa als betrouwbaarheid, bij schooltoets ook nog de inhoud per vraag.
toets verlengen zinvol wanneer
Betrouwbaarheid oorspronkelijke toets hoog is en als die uit relatief weinig vragen bestaat
Interne structuur toets bewijzen
de relatie tussen de (scores op de) vragen
onderling en tussen de (scores op de) vragen en de (scores op de) complete toets.
bewijzen zijn kwalitatief als kwantitatief van aard.
Wanneer we met één toets twee vaardigheden willen beoordelen, zullen we moeten
onderzoeken of er in de interne structuur van de toetsscores een tweedeling te vinden is.
Als we een tweedeling vinden, kunnen we nagaan of deze overeenkomt met de
verwachte tweedeling in bijvoorbeeld rekenvaardigheid en ruimtelijk inzicht. Een bewijs
voor deze tweedeling is dat de items ‘rekenvaardigheid’ meer met elkaar samenhangen
dan met de items ‘ruimtelijke ordening’.
Externe structuur toets bewijzen
de samenhang tussen de scores van
leerlingen op een bepaalde toets en hun scores op andere toetsen of bijvoorbeeld de oordelen
van docenten
Uitslagregels examens
- Complementair: niet op alle toetsen moet een voldoende cijfer behaald worden.
-Conjunctief: op alle toetsen moet een voldoende cijfer behaald worden. - Compensatorisch: onvoldoende cijfers op sommige toetsen kunnen
gecompenseerd worden met voldoende cijfers op andere toetsen.
Meetfout toets
+ noemen van de 2 soorten meetfouten
het verschil tussen de geobserveerde score en de ware score.
Is de geobserveerde score groter dan de ware score (gemiddelde trekking uit 1000 geobserveerde scores), dan is de meetfout positief. In geval van een positieve meetfout behaalt Jan een score die groter is dan wat hij
gemiddeld genomen op deze toets zou behalen. Is de geobserveerde score kleiner dan de ware
score dan is er sprake van een negatieve meetfout.