Tt vragen Flashcards
- Een examen bestaat uit 40 items en heeft een betrouwbaarheid van .74. De docent besluit het examen te verlengen tot 60 items. Wat is de betrouwbaarheid van het nieuwe examen?
a. .73
b. .85
c. .81
c. .81
- Stelling 1: Door middel van het toepassen van item-respons modellen kan lokale betrouwbaarheid worden berekend.
Stelling 2: De iteminformatiefunctie is geformuleerd in de context van klassieke test theorie
a. Stelling 1 is correct, stelling 2 is niet correct
b. Beide stellingen zijn correct
c. Stelling 1 is niet correct, stelling 2 is correct
a. Stelling 1 is correct, stelling 2 is niet correct
- Bij testconstructie op basis van een itembank wordt gebruik gemaakt van
a. Het Mokken model van monotome homogeniteit
b. Coëfficient alpha
c. Item informatiefunctie
c. Item informatiefunctie
- Wat is waar met betrekking tot meerkeuzevragen ten opzichte van open vragen?
a. Er kunnen meer meerkeuzevragen gesteld worden in dezelfde tijd, dit komt de betrouwbaarheid ten goede.
b. Meerkeuzevragen bedenken is moeilijker dan open vragen bedenken
c. Alle bovenstaande antwoorden zijn juist
c. Alle bovenstaande antwoorden zijn juist
- Voor het combineren van testresultaten kan het beste
a. De klinische methode worden gebruikt
b. De actuarische methode worden gebruikt
c. De klinische of de actuarische methode worden gebruikt, afhankelijk van het doel van de beslissing.
b. De actuarische methode worden gebruikt
- Het begrip concurrent validity heeft betrekking op de relatie tussen de testprestaties en
a. Op het zelfde tijdstip verkregen criteriumprestaties
b. Op een later tijdstip verkregen criteriumprestaties
c. Op een eerder tijdstip verkregen criteriumprestaties
a. Op het zelfde tijdstip verkregen criteriumprestaties
- De Thematic Apperception Test (TAT), is een
a. Projectietest
b. Interpretatietest
c. Zowel een projectietest als een interpretatietest
c. Zowel een projectietest als een interpretatietest
- Wat is juist?
a. Alfa is gebaseerd op één testafname
b. De splitsingmethode veronderstelt meerdere testafnamen.
c. Alfa laat zien of de items in de test hetzelfde construct meten
a. Alfa is gebaseerd op één testafname
- Het gebruiken van tests met een relatief lage validiteit is zinvol als
a. De selectieratio laag is en de base rate hoog of laag is.
b. De selectieration hoog is en de base rate laag is.
c. De selectieratio laag is en de base rate niet hoog of laag is
c. De selectieratio laag is en de base rate niet hoog of laag is
- Om te beoordelen wat een patiënt nog kan na een operatie aan de arm krijgt deze patiënt een vragenlijst waarbij wordt veronderstelt dat er een duidelijke ordening zit in de vragen wat betreft de complexiteit (moeilijkheid) van de uit te voeren bewegingen. Er wordt verondersteld dat deze ordening geldt voor elke persoon, onafhankelijk van de latente trekwaarde. Welke IRT-model is handig om te gebruiken om na te gaan of deze veronderstelling klopt?
A. Het rasch-model
B. Het 2-parameter logistisch model
C. Het 3-parameter logistisch model
A. Het rasch-model
- In de klassieke testtheorie is de correlatie tussen de meetfout en de betrouwbare score
a. Nul
b. Negatief
c. Postief
a. Nul
- Wat is juist wat betreft de volgende methoden van interne consistentie om de betrouwbaarheid te schatten?
a. Greatest lower Bound (GLB) < alfa
b. Alfa < lambda2
c. Greatest lower Bound (GLB) < lambda2
b. Alfa < lambda2
- Welke uitspraak is niet waar
a. Bij adaptief testen wordt het niveau van de test aangepast aan de respondent.
b. Afwijkende patronen van itemscores kunnen worden veroorzaakt door bedrog of fraude
c. Theta-scores worden op een percentielscore-schaal weergegeven
c. Theta-scores worden op een percentielscore-schaal weergegeven
- In de klassieke testtheorie is de correlatie tussen de geobserveerde score en de meetfout
a. Positief
b. Negatief
c. Positief of negatief
a. Positief
- Voor het Mokken model van dubbele monotomie geldt dat
a. Het pseudokansniveau voor alle items gelijk is aan 0
b. Het discriminerend vermogen van de items varieert
c. De itemsresponsfuncties elkaar niet snijden
c. De itemsresponsfuncties elkaar niet snijden
- Wat is niet van invloed op de betrouwbaarheid van een testscore?
a. De validiteit van de test
b. De lengte van de test
c. De hoogte van de item-rest correlaties
a. De validiteit van de test
- Een onderzoeker neemt in februari en april dezelfde test af bij dezelfde groep kinderen. De correlatie tussen de testscores geeft een schatting van de
a. Betrouwbaarheid van de test
b. Inhoudsvaliditeit van de test
c. Predictieve validiteit van de test
a. Betrouwbaarheid van de test
- Rating scale items worden vaak gebruikt voor
a. Tests voor gedragswijze
b. Intelligentietests
c. Projectieve tests
a. Tests voor gedragswijze
- In een recent verschenen boek “Noise” bespreken Kahneman et al. (2021) het fenomeen dat wanneer dezelfde rechters dezelfde casus ’s morgens of aan het einde van de dag beoordelen, de vonnissen van elkaar verschillen. Na deze cursus testtheorie zou dit fenomeen kenschetsen als een gebrek aan
a. Betrouwbaarheid
b. Validiteit
c. Utiliteit
a. Betrouwbaarheid
- Welk alternatief is juist wat betreft de verdeling van scores
a. De scores op dit tentamen zijn normaal verdeeld
b. De IQ-scores zijn normaal verdeeld
c. De scores op basis van het deviatie IQ zijn normaal verdeeld
c. De scores op basis van het deviatie IQ zijn normaal verdeeld
- De toegevoegde waarde van een test hangt niet af van
a. De base rate
b. De predictieve validiteit
c. De indruksvaliditeit
c. De indruksvaliditeit
- Een onderzoeker maakt een nieuwe test voor technisch inzicht. Zij correleert de scores op deze nieuwe test met de scores op een test die ook technisch inzicht meet. Dit doet ze om te zien of beide tests hetzelfde meten. Zij onderzoekt hier de
a. Synthetische validiteit
b. Concurrent validity
c. Congruente validiteit
c. Congruente validiteit
- Een docent Frans op de middelbare school geeft zowel les in klas 2 (12-13 jarigen) als in klas 5 (15-16 jarigen). Zij maakt een fout en geeft een multiple-choice tentamen leesvaardigheid Frans gemaakt voor klas 2 aan de leerlingen van klas 5. U verwacht
a. Hoge p-waarden
b. Lastig te zeggen, dat ligt aan het soort items dat wordt gebruikt
c. Hoge item-rest correlaties
a. Hoge p-waarden
- Wat is juist met betrekking tot incrementele validiteit?
a. Als de scores op test X en Y weinig samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.
b. Als de scores op test X en Y weinig samenhangen en een zwak verband met het criterium vertonen, is de incrementele validiteit van test Y groot.
c. Als de scores op test X en Y sterk samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.
a. Als de scores op test X en Y weinig samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.