Taak 2 Flashcards
Reliability
Betrouwbaarheid verwijst naar de consistentie van een meetmethode. Als dezelfde methode wordt gebruikt voor dezelfde steekproef onder dezelfde omstandigheden, zou het hetzelfde resultaat moeten opleveren. Tests die vrij zijn van meetfouten worden als betrouwbaar beschouwd.
4 type reabiliteit:
Test-hertest betrouwbaarheid
interbeoordelaarsbetrouwbaarheid (Interrater reliability)
Parallelle vormen betrouwbaarheid (Parallel forms reliability)
Interne consistentie (Internal consistency)
Test-hertest betrouwbaarheid (Test-retest reliability)
Test-hertest betrouwbaarheid meet de consistentie van resultaten wanneer dezelfde test op dezelfde steekproef op een ander moment wordt herhaald. Het wordt gebruikt om iets te meten dat naar verwachting in de loop van de tijd stabiel blijft. Test-hertest betrouwbaarheid is belangrijk om te bepalen hoe goed een methode bestand is tegen factoren die de resultaten kunnen beïnvloeden.
Voorbeeld;
Interbeoordelaarsbetrouwbaarheid (Interrater reliability)
Interbeoordelaarsbetrouwbaarheid meet de mate van overeenstemming tussen verschillende mensen die hetzelfde waarnemen of beoordelen. Het zorgt ervoor dat verschillende onderzoekers of beoordelaars dezelfde resultaten verkrijgen. Het is belangrijk om subjectiviteit te minimaliseren en consistentie tussen beoordelaars te waarborgen.
(andere drie zijn beter)
kritiek interbeoordelaarsbetrouwbaarheid
Subjectiviteit: Omdat beoordelaars hun eigen interpretaties en perspectieven hebben, kan er een gebrek aan objectiviteit zijn in de beoordelingen. Dit kan leiden tot inconsistenties tussen beoordelaars en lagere betrouwbaarheid.
Onduidelijke criteria: Als de criteria voor beoordeling niet duidelijk zijn gedefinieerd en niet consistent worden toegepast door beoordelaars, kan dit leiden tot inconsistenties in de beoordelingen en lagere betrouwbaarheid.
Training en ervaring: Beoordelaars kunnen verschillende niveaus van training en ervaring hebben, wat invloed kan hebben op hun beoordelingen. Onvoldoende training of onervarenheid kan leiden tot lagere interbeoordelaarsbetrouwbaarheid.
Parallelle vormen betrouwbaarheid (Parallel forms reliability)
Parallelle vormen betrouwbaarheid meet de correlatie tussen twee equivalent versies van een test. Het wordt gebruikt wanneer er twee verschillende beoordelingsinstrumenten zijn ontworpen om hetzelfde te meten. Hoge parallelle vormen betrouwbaarheid geeft aan dat beide versies van de test consistente en betrouwbare resultaten geven.
Interne consistentie (Internal consistency)
Interne consistentie beoordeelt de correlatie tussen meerdere items in een test die is ontworpen om hetzelfde construct te meten. Het zorgt ervoor dat alle items in de test hetzelfde aspect meten. Interne consistentie kan worden gemeten met methoden zoals gemiddelde inter-item correlatie of split-half betrouwbaarheid.
Cronbach’s alpha
Cronbach’s alpha is een maat voor interne consistentiebetrouwbaarheid. Het kwantificeert de mate waarin items in een schaal met elkaar gecorreleerd zijn. Cronbach’s alpha varieert van 0,00 tot 1,00, waarbij hogere waarden wijzen op een hogere interne consistentie. Cronbach’s alpha wordt gebruikt om de betrouwbaarheid van een test of vragenlijst te schatten.
Reliability meestal geschat door een van drie manieren
test-retest, parallel forms, internal consistency
Hoe kun je de bron van de meetfout vinden bij het evalueren van de reliability?
- Test-retest method - Een methode om de betrouwbaarheid van een test te schatten door dezelfde test aan dezelfde personen op twee verschillende tijdstippen af te nemen en de consistentie tussen de scores te meten.
- Parallel forms - Een methode om de betrouwbaarheid van een test te schatten door verschillende versies (vormen) van dezelfde test aan dezelfde personen af te nemen en de consistentie tussen de scores te meten.
- Split-half method - Een methode om de betrouwbaarheid van een test te schatten door de test in twee helften te splitsen en de consistentie tussen de scores op beide helften te meten.
- KR20 method - Een methode om de interne consistentie van een test te schatten door de Kuder-Richardson-formule 20 te gebruiken. Deze formule is specifiek ontworpen voor tests met dichotome items, zoals ja/nee-vragen. De KR20-methode berekent een betrouwbaarheidscoëfficiënt op basis van de correlatie tussen de scores op de verschillende items in de test. Het geeft een schatting van de mate waarin de items samenhangend meten wat ze beogen te meten. De KR20-coëfficiënt varieert tussen 0 en 1, waarbij hogere waarden duiden op een hogere interne consistentie.
- Alpha coefficient - Een schattingsmaat voor de interne consistentie van een test, die aangeeft in hoeverre alle items in de test consistent meten wat ze beogen te meten.
als de betrouwbaarheid zeer laag is kun je dit verhelpen door..
- meer items toe te voegen
- factor en item analysis
- correction for attenuation
7 beoordelingscriteria kwaliteit test
- theoretische basis
- kwaliteit testmateriaal
- volledigheid handleiding
- normen
- betrouwbaarheid
- construct validiteit
- criterium validiteit
Fout in psychologische testen
Onnauwkeurigheden die kunnen optreden bij het meten van psychologische eigenschappen, veroorzaakt door factoren zoals meetfouten, subjectieve beoordelingen of andere bronnen van variabiliteit.
Testscoretheorie
Ware score - Het werkelijke niveau van een psychologische eigenschap dat een persoon bezit, onafhankelijk van meetfouten.
Waargenomen score - De score die wordt verkregen door een persoon op een psychologische test, inclusief zowel de ware score als eventuele meetfouten.
Meetfout - De variabiliteit in meetresultaten die wordt veroorzaakt door factoren zoals toevallige fouten, subjectieve interpretatie of andere bronnen van onnauwkeurigheid.
Standaardfout van meting - Een schatting van de gemiddelde variabiliteit tussen de werkelijke scores en de waargenomen scores in een test.
Basis sampling theorie
Een theoretisch kader dat zich richt op de statistische principes en methoden voor het trekken van steekproeven uit een populatie en het maken van generalisaties op basis van de steekproefresultaten.
extra: Dit is een theoretisch kader dat wordt gebruikt om methoden en technieken voor steekproeftrekking te ontwikkelen en te rechtvaardigen. Het is gebaseerd op het idee van willekeurige steekproeftrekking, waarbij elke individuele eenheid in de populatie een bekende kans heeft om in de steekproef te worden opgenomen. De basis sampling theorie houdt rekening met verschillende factoren, zoals steekproefomvang, selectiebias en schattingen van parameters, om betrouwbare inferenties te maken over de populatie op basis van de steekproef.