T7 Flashcards
1 Een voordeel van de item-response-theorie boven de klassieke testtheorie is dat in de
item-response-theorie
a de onderzoeker als meetniveau een intervalschaal mag veronderstellen.
b iemands meetwaarde onafhankelijk is van de moeilijkheid van de test.
c de onderzoeker niet hoeft te toetsen of het model past bij de gegevens.
d de validiteit van een test altijd groter is dan in de klassieke testtheorie.
b iemands meetwaarde onafhankelijk is van de moeilijkheid van de test
Wanneer men factoranalyse toepast op een verzameling items die aan één bepaald
IR-model voldoen, zal men in het algemeen vinden:
a verscheidene factoren die tezamen veel variantie verklaren.
b soms verscheidene factoren, soms één factor, dat hangt van de inhoud van de items af.
c één factor; de items meten gezamenlijk één psychologische eigenschap.
d dat de items onderling hoog correleren en dus zijn er verscheidene groepsfactoren.
c één factor; de items meten gezamenlijk één psychologische eigenschap.
In het Rasch-model is van de items g en h gegeven dat dg> dh. Hieruit kan men concluderen dat
a item g moeilijker is dan item h.
b de lKP van item g rechts loopt van die van item h.
c item g gemakkelijker is dan item h.
d item g beter discrimineert dan item h
a item g moeilijker is dan item h.
Zelftoets 5 Het verschil tussen het Rasch-model en de twee Birnbaum-modellen is dat
a in het Raschmodel alle items dezelfde moeilijkheidsparameter hebben en in de Birnbaum-modellen niet.
b het Rasch-model minder streng is dan de Birnbaum-modellen.
c uit het Rasch-model een ordinaal meetniveau volgt en uit de Birnbaum-modellen een intervalmeetniveau.
d in het Rasch-model de items dezelfde discriminatiewaarde hebben en in het Birnbaummodel niet.
d
In het kort, het belangrijkste verschil tussen het Rasch-model en het Birnbaum-model is dat het Birnbaum-model een extra parameter bevat om rekening te houden met het gokgedrag van de respondenten. Dit maakt het Birnbaum-model complexer, maar mogelijk ook nauwkeuriger in bepaalde situaties.
Zelftoets 6 Een grote verzameling rekenitems voor 10-jarigen voldoet aan het Raschmodel. Populatieonafhankelijk meten
beteken
Stelling 1 Elke steekproef uit deze grote verzameling items die aan 10-jarige kinderen wordt voorgelegd, levert dezelfde fi-waarden op.
Stelling 2 Als de items aan een groep 11-jarige kinderen wordt voorgelegd, voldoen de items ook
dan aan het Rasch-model.
a Stelling I is juist en stelling 2 is juist.
b Stelling I is onjuist en stelling 2 is juist.
c Stelling 1 is juist en stelling 2 is onjuist.
d Stelling I is onjuist en stelling 2 is onjuist
Stelling 1 is onjuist en stelling 2 is juist.
Het feit dat een grote verzameling rekenitems voor 10-jarigen voldoet aan het Raschmodel betekent niet dat elke steekproef uit deze verzameling dezelfde fi-waarden zal opleveren. De fi-waarden zijn afhankelijk van de specifieke steekproef en zullen variëren afhankelijk van de individuele kenmerken van de deelnemers.
Echter, als de items aan een groep 11-jarige kinderen worden voorgelegd, is het mogelijk dat de items nog steeds voldoen aan het Raschmodel, omdat het model gericht is op het meten van de vaardigheid ongeacht de specifieke leeftijdsgroep.
Zelftoets 7 De nauwkeurigheid van een test waarvan de items voldoen aan een IRmodel, is
a onafhankelijk van het aantal items in de test.
b niet op alle plaatsen van de fi-schaal even groot.
c onafhankelijk van de nauwkeurigheid van elk afzonderlijk item.
d hetzelfde, ongeacht de deelverzameling van items uit de itembank die men in de test opneemt.
b
telling a is onjuist.
De nauwkeurigheid van een test waarvan de items voldoen aan een IR-model is niet onafhankelijk van het aantal items in de test. Over het algemeen geldt dat hoe meer items er in een test zitten, hoe hoger de betrouwbaarheid van de test zal zijn. Dit komt doordat de scores van de verschillende items samen een betrouwbaarder beeld geven van de vaardigheid die wordt gemeten dan de score van een enkel item.
Stelling b is juist.
De nauwkeurigheid van een test waarvan de items voldoen aan een IR-model is niet op alle plaatsen van de fi-schaal even groot. Dit komt doordat de items van een test verschillen in moeilijkheidsgraad en dus verschillende informatie bieden over de vaardigheid van de deelnemer, afhankelijk van het niveau van de deelnemer.
Stelling c is onjuist.
De nauwkeurigheid van een test waarvan de items voldoen aan een IR-model is niet onafhankelijk van de nauwkeurigheid van elk afzonderlijk item. De nauwkeurigheid van de test wordt beïnvloed door de nauwkeurigheid van elk afzonderlijk item, omdat de betrouwbaarheid van de test afhankelijk is van de consistentie van de scores van de verschillende items.
Stelling d is onjuist.
De nauwkeurigheid van een test waarvan de items voldoen aan een IR-model is niet hetzelfde, ongeacht de deelverzameling van items uit de itembank die men in de test opneemt. De nauwkeurigheid van de test hangt af van de specifieke items die in de test zijn opgenomen en hoe deze items samen de vaardigheid meten die wordt gemeten.
Zelftoets 8 Voor de modellen van Mokken is kenmerkend dat
a de items niet alleen gelijke discriminatiewaarden, maar ook gelijke moeilijkheidsparameters moeten hebben.
b de meting op intervalniveau plaatsvindt.
c wanneer de waarde van de persoonsparameter gelijk is aan de moeilijkheidsparameter, de succeskans dan 0,50 is.
d elke IKF voldoet zolang deze maar monotoon niet-dalend is.
d
Deze modellen zijn bedoeld voor het meten van latente trekken met behulp van geordende categorische items. De Mokken-schaalmodellen zijn gericht op het meten van unidimensionele latente trekken, waarbij de items in de test worden beoordeeld op basis van hun consistentie in het meten van de latente trek.
De Mokken-schaalmodellen omvatten onder andere het enkelvoudige schaalmodel, het dubbele schaalmodel en het veelvoudige schaalmodel. Deze modellen zijn gericht op het beoordelen van de schaalzuiverheid van items en het vaststellen van de mate van homogeniteit van de test als geheel.
De Mokken-schaalmodellen zijn van belang in de testtheorie vanwege hun toepasbaarheid op tests met geordende categorische items, zoals Likertschaal-items, en hun vermogen om de betrouwbaarheid en validiteit van dergelijke tests te beoordelen.
Zelftoets 9 Van de items in een itembank die voldoen aan het twee-parameter-model,
a is vastgesteld dat zij een beroep doen op één en dezelfde psychologische eigenschap.
b is niet vastgesteld voor welke populatie personen zij bedoeld zijn.
c zijn de schattingen van sommige a- en &-parameters nog onbekend.
d is alleen voor sommige O-waarden bekend hoe informatief zij zijn
a
Zelftoets 10 In de item-response-theorie spreekt men van een ‘zuiver’ item wanneer twee personen
a uit dezelfde populatie maar met verschillende meetwaarden een verschillende succeskans op
item g hebben.
b uit dezelfde populatie en met dezelfde meetwaarden een verschillende succeskans op item “g”
hebben.
c uit verschillende populaties en met verschillende meetwaarden dezelfde succeskans op item g
hebben.
d uit verschillende populaties maar met dezelfde meetwaarde dezelfde succeskans hebben
d
Zelftoets 11 Wanneer men een doelinformatiefunctie van een test opstelt, dan is voor een bepaald
punt op de O-schaal de functiewaarde
a gelijk aan de minimumwaarde van de testinformatiefunctie die nog acceptabel is; de
waarde van de testinformatiefunctie mag niet lager zijn.
b gelijk aan de maximumwaarde van de testinformatiefunctie; de waarde van de testinformatiefunctie mag ook hoger zijn.
c precies gelijk aan de waarde van de testinformatiefunctie; een hogere of lagere waarde is niet
toegestaan.
d hoger of lager dan de waarde van de testinformatiefunctie; hoevéél hoger of lager hangt af van
hoe nauwkeurig de test op dat punt moet meten
a
Zelftoets 12 Wanneer een persoon een ‘afwijkend scorepatroon’ heeft, worden
a items met grote succeskansen goed beantwoord en items met lage succeskansen foutief.
b veel items goed en weinig items foutief beantwoord.
c weinig items goed en veel items foutief beantwoord.
d items met grote succeskansen foutief beantwoord en items met lage succeskansen goed.
d
Stelling 1 In de item-response-theorie is de meting op elke plaats van de fi-schaal even betrouwbaar.
Stelling 2 In de klassieke testtheorie zijn de metingen populatieafhankelijk.
a Stelling 1 is juist en stelling 2 is onjuist.
b Stelling 1 is onjuist en stelling 2 is juist.
c Stelling 1 en 2 zijn beide onjuist.
d Stelling 1 en 2 zijn beide juist.
b
Zelftoets 14 Adaptief testen in de item-response-theorie betekent dat men
a via het afnemen van een veelheid aan tests de sterke en zwakke punten van een persoon opspoort.
b op grond van de antwoorden op items die voor elke persoon verschillend kunnen zijn, een
zo nauwkeurig mogelijke schatting van iemands meetwaarde geeft.
c op grond van de antwoorden die een persoon op een aantal items heeft gegeven, een gedifferentieerd individueel scoreprofiel opstelt.
d de items in volgorde van opklimmende moeilijkheid aanbiedt
b
Eindtoets 51 ‘Adaptief testen’ in de Item Response Theorie betekent
a het kiezen van die test welke optimaal de diversiteit van de capaciteiten van de persoon tot uiting
laat komen.
b het afnemen van een aantal tests die tezamen een maximale schatting geven van iemands concrete vaardigheid.
c het afnemen van die items aan de persoon die naar verwachting het beste bij zijn meetwaarde passen.
c
TT bundel 1 41 Wat is het cruciale verschil tussen de klassieke testtheorie en de item-response
modellen?
a Bij item-response modellen is het meetniveau afleidbaar uit de theorie.
b De validiteit van item-response modellen is in alle gevallen veel hoger dan in de klassieke testtheorie.
c Bij item-response modellen kan men populatie-afhankelijk meten, dat kan bij testen uit de klassieke testtheorie nie
b