College 4 Flashcards

Question 1

Q

Betrouwbaarheid

Answer

A

refereert naar de consistentie of stabiliteit van testresultaten. Je kijkt naar hoe
nauwkeurig de meetprocedure is. Betrouwbaarheid is een vereiste voor validiteit.

Question 2

Q

classical test theory/true score theory (CTT) – Spearman

Answer

A

elke score op een mentale test
bestaat uit 2 componenten; de werkelijke score en de foutenmarge
Focust op random meetfouten

Question 3

Q

Systematische meetfouten

Answer

A

meetfouten die systematisch zorgen voor
verschillen in testprestatie tussen individuen of groepen, wat komt door factoren
die niet te maken hebben met het construct dat gemeten wordt. Hier gaat CTT
dus niet over!

Question 4

Q

3 bronnen van toevallige meetfouten

Answer

A

content sampling error (selectie van testitems dekken niet het hele domein)
time sampling error (reflecteert individuele factoren: moeheid, honger, angst, en omgevingsfactoren: herrie, temperatuur)
administratieve/scoringsfouten (error door manier van beoordeling)

Question 5

Q

Betrouwbaarheidscoefficient (rxx)

Answer

A

symbool voor betrouwbaarheid van testresultaten

Question 6

Q

Betrouwbaarheidsindex

Answer

A

reflecteerd de correlatie tussen werkelijke en geobserveerde
scores. Het is de wortel van betrouwbaarheidscoëfficient.

Question 7

Q

test-hertest betrouwbaarheid

Answer

A

dezelfde test afnemen bij dezelfde groep op verschillende
tijdstippen en de correlatie tussen de scores berekenen (stabiliteit).

Question 8

Q

parallele testbetrouwbaarheid

Answer

A

de resultaten van twee parallele testen vergelijken (andere
items, maar zelfde construct, format, groep, enz).

Question 9

Q

interne consistentie

Answer

A

meet fouten gerelateerd aan content sampling, gebaseerd op de relatie
tussen items binnen de test.

Question 10

Q

generalizability theory

Answer

A

Dit is een uitbreiding van de classical test theory (CTT). CTT laat ons een
ongedifferentieerde error component zien, maar in werkelijkheid bestaat error
uit meer dan één component. Met CTT kan je niet bepalen hoeveel error door
welke componeent komt. Dit kan wel met de generalizability theory.

Question 11

Q

item-analysis statistics/procedures

Answer

A

zijn kwantitatieve procedures om de kwaliteit en measurement
eigenschappen van individuele test-items te analyseren (niet de gehele test)

Question 12

Q

difficulty index/item difficulty level

Answer

A

het percentage/proportie personen die de test maken
die correct een item beantwoorden.

Question 13

Q

percent endorsement

Answer

A

De percent endorsement berekent het percentage van de geteste mensen dat
een bepaald antwoord gegeven heeft.

Question 14

Q

item-discrimination

Answer

A

de mate waarin een item accuraat
onderscheid kan maken tussen de verschillen tussen personen die de test hebben ingevuld, op het
gemeten construct.

Question 15

Q

discrimination index (D)

Answer

A

Dit is een statistische manier om de mate van discriminatie te testen. Dit is
gebaseerd op het verschil in prestatie tussen twee groepen. Meestal kiest men
voor de top en laagste groep van 27% van de deelnemers

Question 16

Q

item-total correlation coëfficients;

Answer

A

correlatie tussen performance op een specifiek item en
de totale test score.

Question 17

Q

Distracter analysis

Answer

A

laat je zien hoeveel personen in de top en bottom groep een bepaalde optie
hebben geselecteerd op een multiple-choice item (sluit aan bij onderdeel moeilijkheidsgraad KTT).

Distracters zijn verkeerde antwoordmogelijkheden die personen afleiden van het juiste antwoord
Effectieve distracters zouden vaker gekozen moeten worden dan juiste antwoord door mensen in de bottem groep dan in de top groep = negatieve discriminatie
Meer mensen in de top groep kiezen het juiste antwoord dan mensen in de bottom groep= positieve discriminatie

Question 18

Q

item-characteristic curve (ICC)

Answer

A

curve met op horizontale
as de vaardigheid en op verticale as de
waarschijnlijkheid dat iemand het juiste antwoord geeft.

Question 19

Q

IRT-modellen

Answer

A

one-parameter model/Rasch model; suggereert dat items verschillen op maar 1
parameter, namelijk difficulty. Alleen de locatie verschilt, de helling is hetzelfde.
two-parameter model; suggereert dat items verschillen op zowel difficulty als
discrimination.
three-parameter model; suggereert dat de lijn niet begint bij 0, omdat het kan zijn
dat iemand met 0 vaardigheidsniveau toch een item goed beantwoord door gokkans
(c-parameter

Question 20

Q

computer adaptive testing

Answer

A

een deelnemer krijgt een item en op basis van
zijn antwoord krijgt hij een makkelijker of moeilijker item. De test gaat door
tot een bepaald niveau is bereikt