Testtheorie Flashcards
Fiatmeting
Meting van bijv. subjectieve concepten zoals ervaringen, tevredenheid, etc. Bijv. in een Likertschaal.
Indexmeting
Bijv. CPI (consumentenprijsindex). Een bepaald jaar wordt als indexjaar genomen en is dus 100. Het daaropvolgende jaar is 104, dit is een stijging van 4 procentpunten ten opzichte van het indexjaar.
Voorwaarden lineaire regressie
- Samenhang tussen onafhankelijke variabele X en afhankelijke variabele Y. 2. Afhankelijke variabele mag alleen continu zijn. 3. Niet geschikt voor herhaaldelijke metingen (mag maar 1 keer gemeten zijn). 4. De variabele
Y heeft een normaalverdeling voor elke waarde van X. 5. De verdelingen van de Y variabele hebben een gelijke variantie (of standaarddeviatie) voor elke waarde van X.
Pijlers van kwaliteit van een test.
Validiteit, betrouwbaarheid en normering.
Tests voor prestatieniveau
Foute of goede antwoorden
Tests voor gedragswijzen
Bijvoorbeeld een beroepskeuzetest (je kunt niet hoog of laag testen).
Kwalitatieve prestatietests
Kwalitatieve prestatietests zijn evaluaties die niet alleen de prestaties van een individu meten, maar ook proberen inzicht te krijgen in de onderliggende processen en eigenschappen die tot die prestaties leiden.
Vorderingentest
Testen die specifiek gericht zijn op het meten van prestaties die door leren of oefening tot
stand zijn gekomen.
p-waarde
Probability. Moeilijkheid van de toetsvraag.
Rit-waarde R=Relation I=Item T=Totale score
De toetsvragen die door de hoogscorende leerlingen goed gemaakt zijn, en foutief door de laagscorende leerlingen zorgen voor een onderscheid tussen die twee groepen. = onderscheidend vermogen. Bereik +1 en -1.
Normen Rit-waarde
0.35 en hoger = zeer goed
0.25-0.35 = voldoende goed
0.15-0.25 = middelmatig voldoende
<0.15 = slecht/middelmatig
Berekening P-waarde
De toetsvragen die door de hoogscorende leerlingen goed gemaakt zijn, en foutief door de laagscorende leerlingen zorgen voor een onderscheid tussen die twee groepen. P= percentage per item in % gedeeld door 100. Beste P-waarde voor (juist/onjuist vraag is 0,75. )Ongecorrigeerd tussen 0,5-0,75. Gecorrigeerde p-waarde ong. 0,5
Heel laag of heel hoog zijn geen goede vragen.
Gebruik Rit-waarde en Spearmans rangcorrelatiecoefficient
Een hoge Rit-waarde betekent dat de vraag goed discrimineert tussen leerlingen die de stof goed beheersen en degenen die dat minder doen. Spearman’s rangcorrelatiecoëfficiënt wordt vaak gebruikt wanneer de data niet normaal verdeeld zijn of wanneer de relatie tussen de variabelen niet lineair is. De waarde varieert van -1 tot 1, waarbij 1 een perfecte positieve monotone relatie aangeeft, -1 een perfecte negatieve monotone relatie, en 0 geen monotone relatie.
Betrouwbaarheid
Stabiliteit of consistentie van de toetsscores. Als een toets betrouwbaar genoemd wordt, betekent het dat de toetsscores de leerlingen op een betrouwbare manier ordenen. Het moet herhaalbaar zijn. Een meting is betrouwbaar wanneer zij bij herhaling tot dezelfde uitkomst leidt. Betrouwbaarheid is een eigenschap van metingen en niet van meetinstrumenten.
Test-hertestbetrouwbaarheid
Om te weten of de toets betrouwbaar is en of de meting iets te betekenen heeft, zou eigenlijk direct na de toetsafname een vergelijkbare toets moeten worden afgenomen onder dezelfde studenten.
Cronbachs alfa
Meten van betrouwbaarheid of interne consistentie. Tussen 0 en 1 (1=max betrouwbaar). 0.6 = laag acceptabel op schooltoetsen. 0,85 op tevredenheidsonderzoek meten dus hetzelfde construct binnen de vragen. Hoe meer vragen in de toets hoe betrouwbaarder het wordt. (Beperking bij kleine toetsen en weinig deelnemers, wat zeggen de toetsvragen (zegt de toets iets over de prestatie)).
Meetfout
Het verschil tussen de geobserveerde score en de ware score.
Geobserveerde score
De som van de
ware score van die leerling en de meetfout die we maken op het moment van de toetsafname. De geobserveerde score is het cijfer dat de student daadwerkelijk krijgt, dat kan worden beïnvloed door toevallige factoren zoals zenuwen of een onverwacht lastig geformuleerde vraag.
Variantie berekenen
1 Bereken de gemiddelde toetsscore.
2 Trek van de toetsscore van elke leerling de gemiddelde toetsscore af. Dit resulteert in
negatieve en positieve verschillen.
3 Kwadrateer die verschillen en tel ze op.
4 Deel de uitkomst van stap 3 door het aantal leerlingen. Deze uitkomst geeft de variantie.
Standaardafwijking berekenen
Neem de vierkantswortel van de variantie en die uitkomst is de standaardafwijking.
Goodman en Kruskal’s tau
meet bijv. hoeveel beter je de voorkeur voor het product kunt voorspellen als je het geslacht kent, vergeleken met een willekeurige voorspelling. Nominale/categorische variabelen.
Cramer’s V
Cramér’s V is een maat voor de associatie tussen twee nominale variabelen. Het wordt vaak gebruikt in combinatie met de chi-kwadraattoets om de sterkte van de relatie tussen de variabelen te bepalen. Bereik tussen 0 en 1. 1 is perfecte samenhang.