Tt vragen Flashcards by Josephine Dijk

Een examen bestaat uit 40 items en heeft een betrouwbaarheid van .74. De docent besluit het examen te verlengen tot 60 items. Wat is de betrouwbaarheid van het nieuwe examen?

a. .73
b. .85
c. .81

c. .81

How well did you know this?

Not at all

Perfectly

Stelling 1: Door middel van het toepassen van item-respons modellen kan lokale betrouwbaarheid worden berekend.
Stelling 2: De iteminformatiefunctie is geformuleerd in de context van klassieke test theorie

a. Stelling 1 is correct, stelling 2 is niet correct
b. Beide stellingen zijn correct
c. Stelling 1 is niet correct, stelling 2 is correct

a. Stelling 1 is correct, stelling 2 is niet correct

How well did you know this?

Not at all

Perfectly

Bij testconstructie op basis van een itembank wordt gebruik gemaakt van

a. Het Mokken model van monotome homogeniteit
b. Coëfficient alpha
c. Item informatiefunctie

c. Item informatiefunctie

How well did you know this?

Not at all

Perfectly

Wat is waar met betrekking tot meerkeuzevragen ten opzichte van open vragen?

a. Er kunnen meer meerkeuzevragen gesteld worden in dezelfde tijd, dit komt de betrouwbaarheid ten goede.
b. Meerkeuzevragen bedenken is moeilijker dan open vragen bedenken
c. Alle bovenstaande antwoorden zijn juist

c. Alle bovenstaande antwoorden zijn juist

How well did you know this?

Not at all

Perfectly

Voor het combineren van testresultaten kan het beste

a. De klinische methode worden gebruikt
b. De actuarische methode worden gebruikt
c. De klinische of de actuarische methode worden gebruikt, afhankelijk van het doel van de beslissing.

b. De actuarische methode worden gebruikt

How well did you know this?

Not at all

Perfectly

Het begrip concurrent validity heeft betrekking op de relatie tussen de testprestaties en

a. Op het zelfde tijdstip verkregen criteriumprestaties
b. Op een later tijdstip verkregen criteriumprestaties
c. Op een eerder tijdstip verkregen criteriumprestaties

a. Op het zelfde tijdstip verkregen criteriumprestaties

How well did you know this?

Not at all

Perfectly

De Thematic Apperception Test (TAT), is een

a. Projectietest
b. Interpretatietest
c. Zowel een projectietest als een interpretatietest

c. Zowel een projectietest als een interpretatietest

How well did you know this?

Not at all

Perfectly

Wat is juist?

a. Alfa is gebaseerd op één testafname
b. De splitsingmethode veronderstelt meerdere testafnamen.
c. Alfa laat zien of de items in de test hetzelfde construct meten

a. Alfa is gebaseerd op één testafname

How well did you know this?

Not at all

Perfectly

Het gebruiken van tests met een relatief lage validiteit is zinvol als

a. De selectieratio laag is en de base rate hoog of laag is.
b. De selectieration hoog is en de base rate laag is.
c. De selectieratio laag is en de base rate niet hoog of laag is

c. De selectieratio laag is en de base rate niet hoog of laag is

How well did you know this?

Not at all

Perfectly

Om te beoordelen wat een patiënt nog kan na een operatie aan de arm krijgt deze patiënt een vragenlijst waarbij wordt veronderstelt dat er een duidelijke ordening zit in de vragen wat betreft de complexiteit (moeilijkheid) van de uit te voeren bewegingen. Er wordt verondersteld dat deze ordening geldt voor elke persoon, onafhankelijk van de latente trekwaarde. Welke IRT-model is handig om te gebruiken om na te gaan of deze veronderstelling klopt?

A. Het rasch-model
B. Het 2-parameter logistisch model
C. Het 3-parameter logistisch model

A. Het rasch-model

How well did you know this?

Not at all

Perfectly

In de klassieke testtheorie is de correlatie tussen de meetfout en de betrouwbare score
a. Nul
b. Negatief
c. Postief

a. Nul

How well did you know this?

Not at all

Perfectly

Wat is juist wat betreft de volgende methoden van interne consistentie om de betrouwbaarheid te schatten?

a. Greatest lower Bound (GLB) < alfa
b. Alfa < lambda2
c. Greatest lower Bound (GLB) < lambda2

b. Alfa < lambda2

How well did you know this?

Not at all

Perfectly

Welke uitspraak is niet waar

a. Bij adaptief testen wordt het niveau van de test aangepast aan de respondent.
b. Afwijkende patronen van itemscores kunnen worden veroorzaakt door bedrog of fraude
c. Theta-scores worden op een percentielscore-schaal weergegeven

c. Theta-scores worden op een percentielscore-schaal weergegeven

How well did you know this?

Not at all

Perfectly

In de klassieke testtheorie is de correlatie tussen de geobserveerde score en de meetfout

a. Positief
b. Negatief
c. Positief of negatief

a. Positief

How well did you know this?

Not at all

Perfectly

Voor het Mokken model van dubbele monotomie geldt dat

a. Het pseudokansniveau voor alle items gelijk is aan 0
b. Het discriminerend vermogen van de items varieert
c. De itemsresponsfuncties elkaar niet snijden

c. De itemsresponsfuncties elkaar niet snijden

How well did you know this?

Not at all

Perfectly

Wat is niet van invloed op de betrouwbaarheid van een testscore?

a. De validiteit van de test
b. De lengte van de test
c. De hoogte van de item-rest correlaties

a. De validiteit van de test

How well did you know this?

Not at all

Perfectly

Een onderzoeker neemt in februari en april dezelfde test af bij dezelfde groep kinderen. De correlatie tussen de testscores geeft een schatting van de

a. Betrouwbaarheid van de test
b. Inhoudsvaliditeit van de test
c. Predictieve validiteit van de test

a. Betrouwbaarheid van de test

How well did you know this?

Not at all

Perfectly

Rating scale items worden vaak gebruikt voor

a. Tests voor gedragswijze
b. Intelligentietests
c. Projectieve tests

a. Tests voor gedragswijze

How well did you know this?

Not at all

Perfectly

In een recent verschenen boek “Noise” bespreken Kahneman et al. (2021) het fenomeen dat wanneer dezelfde rechters dezelfde casus ’s morgens of aan het einde van de dag beoordelen, de vonnissen van elkaar verschillen. Na deze cursus testtheorie zou dit fenomeen kenschetsen als een gebrek aan

a. Betrouwbaarheid
b. Validiteit
c. Utiliteit

a. Betrouwbaarheid

How well did you know this?

Not at all

Perfectly

Welk alternatief is juist wat betreft de verdeling van scores

a. De scores op dit tentamen zijn normaal verdeeld
b. De IQ-scores zijn normaal verdeeld
c. De scores op basis van het deviatie IQ zijn normaal verdeeld

c. De scores op basis van het deviatie IQ zijn normaal verdeeld

How well did you know this?

Not at all

Perfectly

De toegevoegde waarde van een test hangt niet af van

a. De base rate
b. De predictieve validiteit
c. De indruksvaliditeit

c. De indruksvaliditeit

How well did you know this?

Not at all

Perfectly

Een onderzoeker maakt een nieuwe test voor technisch inzicht. Zij correleert de scores op deze nieuwe test met de scores op een test die ook technisch inzicht meet. Dit doet ze om te zien of beide tests hetzelfde meten. Zij onderzoekt hier de

a. Synthetische validiteit
b. Concurrent validity
c. Congruente validiteit

c. Congruente validiteit

How well did you know this?

Not at all

Perfectly

Een docent Frans op de middelbare school geeft zowel les in klas 2 (12-13 jarigen) als in klas 5 (15-16 jarigen). Zij maakt een fout en geeft een multiple-choice tentamen leesvaardigheid Frans gemaakt voor klas 2 aan de leerlingen van klas 5. U verwacht

a. Hoge p-waarden
b. Lastig te zeggen, dat ligt aan het soort items dat wordt gebruikt
c. Hoge item-rest correlaties

a. Hoge p-waarden

How well did you know this?

Not at all

Perfectly

Wat is juist met betrekking tot incrementele validiteit?

a. Als de scores op test X en Y weinig samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.
b. Als de scores op test X en Y weinig samenhangen en een zwak verband met het criterium vertonen, is de incrementele validiteit van test Y groot.
c. Als de scores op test X en Y sterk samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.

a. Als de scores op test X en Y weinig samenhangen en een sterk verband met het criterium vertonen, is de incrementele validiteit van test Y groot.

How well did you know this?

Not at all

Perfectly

27. Als je een item wilt selecteren met een maximale variantie, selecteer je een item met a. Een zo laag mogelijke p-waarde b. Een zo hoog mogelijke p-waarde c. P = .5

c. P = .5

28. Stel, een item waarvoor het 2-parameter logistisch model geldt, heeft een moeilijkheidsparameter gelijk aan 1 en een discriminatieparameter gelijk aan 1.5. Wat is de kans dat iemand met een theta-waarde van 0 dit item goed beantwoordt? (Rond tussentijdse berekeningen af op twee decimalen.): a. .87 b. .18 c. .75

b. .18

29. Om de kwaliteit van dit tentamen te verhogen beoordeelt een collega die ook expert is op het gebied van de testtheorie de vragen en geeft feedback over de vragen die worden gesteld. Deze procedure draagt vooral bij aan de a. De synthetische validiteit b. De indruksvaliditeit c. De inhoudsvaliditeit

c. De inhoudsvaliditeit

30. Een onderzoeker heeft een intelligentietest ontwikkeld om ‘fluid’ intelligentie en ‘crystallized’ intelligentie afzonderlijk te kunnen meten. Welke methode kan de onderzoeker het beste gebruiken om de structuur van de test te onderzoeken? a. Een principale componentenanalyse met een vooraf vastgesteld aantal componenten. b. De multiple group method. c. Een principale componenten analyse met Kaiser criterium

b. De multiple group method.

31. Volgens Drenth & Sjitsma zijn de zes kenmerken van een goede test a. Efficiëntie, standaardisatie, objectiviteit, normering, betrouwbaarheid en validiteit b. Betrouwbaarheid, begripsvaliditeit, predictieve validiteit, unidimensionaliteit, utiliteit en representativiteit c. Inhoudsvaliditeit, congruente validiteit, divergentie validiteit, predcitieve validiteit, incrementele validiteit en betrouwbaarheid

a. Efficiëntie, standaardisatie, objectiviteit, normering, betrouwbaarheid en validiteit

32. Wat is kenmerkend voor tests voor typical performance test a. High stakes tests en polytome tests b. Low stakes tests en polytome items c. Low stakes tests en dichotome items

b. Low stakes tests en polytome items

33. Wat is een geschikte methode om te betrouwbaarheid van snelheidstests (speedtests) in kaart te brengen? a. Cronbach’s alfa b. Test-hertestbetrouwbaarheid c. Guttman’s lambda-2

b. Test-hertestbetrouwbaarheid

34. Testbureaus die tests leveren aan grote klanten klagen soms dat de klant het niets interesseert of de test valide is als de test er maar leuk uitziet en spannend is om te doen. Klanten beoordelen een test dus vooral op a. Adaptiviteit b. Constructvaliditeit c. Indruksvaliditeit

c. Indruksvaliditeit

35. Het voornaamste doel van rotatie in factoranalyse is a. Om de factoren orthogonaal te maken b. Om de verklaarde variantie (VAF) te vergroten c. Om de interpretatie van de factoren te vereenvoudigen

c. Om de interpretatie van de factoren te vereenvoudigen

36. Wat is juist wat betreft item-test en item-rest correlaties? a. Item-test correlaties onderschatten de samenhang tussen de itemscore en de testscore. b. Item-rest correlaties zijn altijd groter dan item-test-correlaties. c. Hoe kleiner het aantal items in de test, hoe groter het verschil tussen item-rest en item-test correlaties.

c. Hoe kleiner het aantal items in de test, hoe groter het verschil tussen item-rest en item-test correlaties.

37. Bij studies naar predictieve validiteit zijn er vaak problemen met: a. Range gestriction b. Betrouwbaarheid c. Normen

a. Range gestriction

39. Wanneer we de onderlinge relatie beschouwen van een aantal items-responsemodellen, dan is het algemeenste model (dat wil zeggen; het model dat het makkelijkste past bij de data), van de drie onderstaande modellen a. Het 1-parameter logistisch model b. Het 3-parameter logistisch model c. Het Mokken model van monotome homogeniteit

c. Het Mokken model van monotome homogeniteit

40. Een test bestaande uit 40 items heeft een betrouwbaarheid van .60. Een onderzoeker wil de betrouwbaarheid verhogen. Een mogelijkheid is om a. Items met hoge p-waarden te verwijderen b. Items met lage discriminatieparameters te verwijderen c. Items met hoge item-rest-correlaties te verwijderen

b. Items met lage discriminatieparameters te verwijderen

44. De betrouwbaarheid van een tentamen testteorie bestaande uit 60 items was vorig jaar gelijk aan .74. Verder is bekend dat de gemiddelde testscore gelijk is aan 41 en de standaarddeviatie van de scores gelijk is aan SD = 6.40. Wat is de standaardmeetfout van de scores a. 3.26 b. 5.51 c. 1.67

a. 3.26

45. In de testtheorie verstaan we onder efficiëntie a. Dat een test snel gemaakt kan worden b. Dat een test snel gescoord kan worden c. Dat we enkel de te meten eigenschap meten

c. Dat we enkel de te meten eigenschap meten

46. Wat kan men onderzoeken aan de hand van een multitrek-multimethode matrix? a. De soortgenootvaliditeit en de divergente validiteit b. De concurrent validity en de predictieve validiteit c. De predictieve validiteit en de incrementele validiteit

a. De soortgenootvaliditeit en de divergente validiteit

47. Wat is juist? a. Items uit tests die een heterogeen construct meten hebben vaak hoge item-rest correlaties. b. Persoonlijkheidsschalen meten vaak homogene constructen, wat zorgt voor hoge item-rest correlaties. c. Items met een hoge p-waarde (> .70) discrimineren goed tussen personen

b. Persoonlijkheidsschalen meten vaak homogene constructen, wat zorgt voor hoge item-rest correlaties.

48. Een experimenteel psycholoog is geïnteresseerd in het verband tussen intelligentie en extraversie. Zij verzamelt data op zowel een intelligentietest als een extraversievragenlijst en correleert de scores op de beide vragenlijsten. Welke bewering is juist? a. De betrouwbaarheid van beide tests is hier onbelangrijk b. De constructvaliditeit van beide tests is hier onbelangrijk c. Normen voor beide tests zijn hier niet noodzakelijk

c. Normen voor beide tests zijn hier niet noodzakelijk

49. Naarmate de helling van een itemresponsfunctie steiler wordt, zal de discriminatieparameter van het item a. Toenemen. b. Gelijk blijven. c. Afnemen.

a. Toenemen

50. Morfologische methoden als indicatie voor persoonlijkheidskenmerken a. Hebben een hoge utiliteit b. Zijn onbetrouwbaar c. Hebben een geringe validiteit

c. Hebben een geringe validiteit

51. Marije heeft de Cito-toets voor groep 8 gemaakt. Op haar rapportage staat onder andere dat zij een percentielscore van 70 heeft voor ‘Begrijpend lezen’. Wat betekent dat? a. Marije heeft hoger gescoord op begrijpend lezen dan 70% van de andere leerlingen. b. Marije heeft 70% van de vragen over begrijpend lezen, gecorrigeerd door gokken, goed beantwoord. c. Marije heeft 70% van de vragen over begrijpend lezen goed beantwoord.

a. Marije heeft hoger gescoord op begrijpend lezen dan 70% van de andere leerlingen.

52. Onder kruisvalidering wordt verstaan a. Het onderzoeken of een test even valide is in verschillende specifieke groepen (bijv. mannen en vrouwen). b. Het herhalen van een onderzoek met een ander vergelijkbaar meetinstrument. c. Het controleren van een voorspellingsmodel in een nieuwe steekproef van personen.

c. Het controleren van een voorspellingsmodel in een nieuwe steekproef van personen.

53. Een meisje uit groep 8 maakt de doorstroomtoets (de vroegere Cito-toets; (geschatte betrouwbaarheid doorstroomtoets r = .85 predictieve validiteit r = .38) en behaalt een hele hoge score. Deze score bevestigt haar rapportcijfers op de basisschool en haar leraar is ervan overtuigd dat ze later “heel succesvol” zal worden op de middelbare school. Hoewel dit zeker niet uitgesloten is, moet bij deze voorspelling ook rekening worden gehouden met het feit dat a. De selectieratio in deze context vrij laag is b. De doorstroomtoets vrij onbetrouwbaar is c. De predictieve validiteit van de doorstroomtoets veel lager is dan één.

c. De predictieve validiteit van de doorstroomtoets veel lager is dan één.

54. Een selectiepsycholoog wil de scores op een interview (Likert scores: 1-5) en scores op een intelligentietest (z-scores) op eenzelfde schaal brengen zodat ze beter te interpreteren zijn ten opzichte van elkaar. In de oorspronkelijke scoring correleren de scores r = .43. De correlatie tussen de scores op beide tests na de transformatie van de Likert scores in z-scores is a. Kleiner dan .43. b. Groter dan .43. c. Gelijk aan .43.

c. Gelijk aan .43.

55. Wat voor type test is de RAKIT? a. Een test voor gedragswijze b. Een test voor geschiktheid c. Een individuele ontwikkelingstest

c. Een individuele ontwikkelingstest

56. Waarom kunnen we in de klassieke testtheorie de betrouwbaarheid van een score alleen schatten en niet precies bepalen? a. Omdat we de betrouwbare score niet kunnen weten b. Omdat we de variantie van de geobserveerde score niet kunnen weten c. Omdat we niet weten wat de gemiddelde meetfout in de populatie is.

a. Omdat we de betrouwbare score niet kunnen weten

57. Op een intelligentietest heeft Ilse 50 van de 70 items goed beantwoord a. Ilse heeft gemiddeld gescoord b. Ilse heeft bovengemiddeld gescoord c. We kunnen op basis van deze scores geen conclusies trekken over de score van Ilse

c. We kunnen op basis van deze scores geen conclusies trekken over de score van Ilse

58. In een factoranalyse leidt het gebruik van het Kaiser criterium tot a. Een overschatting van het aantal factoren b. Een onderschatting van het aantal factoren c. Het maximale aantal factoren

a. Een overschatting van het aantal factoren

60. Beslissingen nemen over individuen in de praktijk a. Moet altijd op basis van resultaten van meerdere tests, want één test is nooit perfect betrouwbaar. b. Kan op basis van één test, als er geen bekende aanvullingen met incrementele validiteit zijn. c. Kan op basis van één test, als die een betrouwbaarheid hoger dan r = .90 heeft.

b. Kan op basis van één test, als er geen bekende aanvullingen met incrementele validiteit zijn.

Wat geeft de item-testcorrelatie aan? A) De samenhang tussen een item en de rest van de test B) De samenhang tussen een item en de totaalscore C) De moeilijkheidsgraad van een item .

Antwoord: B) De samenhang tussen een item en de totaalscore Analyse: De item-testcorrelatie meet hoe goed een item bijdraagt aan de totaalscore, zoals uitgelegd in de context van itemanalyse

Wat is een kenmerk van een test met een hoge betrouwbaarheid? A) De test meet nauwkeurig verschillende constructen tegelijkertijd. B) De testresultaten blijven stabiel over herhaalde metingen. C) De test voorspelt gedrag in verschillende contexten even goed. .

Antwoord: B) De testresultaten blijven stabiel over herhaalde metingen. Analyse: Betrouwbaarheid verwijst naar de consistentie van testresultaten, zoals beschreven in de klassieke testtheorie (X = T + E)

Welke conclusie kan worden getrokken als een test een lage congruente validiteit heeft? A) De test correleert slecht met andere tests die hetzelfde construct meten. B) De test heeft een lage betrouwbaarheid en meet inconsistent. C) De test heeft een lage face-validiteit en lijkt ongeschikt voor het doel. .

Antwoord: A) De test correleert slecht met andere tests die hetzelfde construct meten. Analyse: Congruente validiteit houdt in dat een test vergelijkbare resultaten oplevert als andere tests die hetzelfde construct meten

In de itemresponstheorie (IRT) wordt een item met een lage moeilijkheidsgraad gekenmerkt door: A) Een hogere kans dat personen met lage vaardigheidsniveaus correct antwoorden. B) Een lage discriminatieparameter. C) Een steilere itemresponsfunctie.

Antwoord: A) Een hogere kans dat personen met lage vaardigheidsniveaus correct antwoorden. Analyse: De moeilijkheidsgraad in IRT bepaalt de positie van de curve op de vaardigheidsschaal θ. Een lage moeilijkheidsgraad verschuift de curve naar links

Wat betekent een factorlading van 0,85 in een factoranalyse? A) Het item verklaart 85% van de variantie in de factor. B) Het item correleert sterk met de factor. C) Het item is onafhankelijk van de andere factoren. .

Antwoord: B) Het item correleert sterk met de factor. Analyse: Factorladingen geven de correlatie weer tussen een item en de onderliggende factor, waarbij hoge ladingen wijzen op een sterkere relatie

Wat is het meest waarschijnlijke effect van een test met een plafondeffect? A) De test discrimineert slecht bij hogere vaardigheidsniveaus. B) De test meet niet consistent over verschillende herhaalde metingen. C) De test voorspelt minder goed voor lagere vaardigheidsniveaus.

Antwoord: A) De test discrimineert slecht bij hogere vaardigheidsniveaus. Analyse: Een plafondeffect ontstaat wanneer een test te gemakkelijk is, waardoor het moeilijk wordt om verschillen in vaardigheid aan de bovenkant van de schaal te onderscheiden .

Welke van de volgende methoden is geschikt om de betrouwbaarheid van een test te schatten op basis van interne consistentie? A) Test-hertest methode B) Cronbach’s alfa C) Parallelle testmethode

Antwoord: B) Cronbach’s alfa Hoofdstuk: Hoofdstuk 3 Analyse: Interne consistentie wordt vaak gemeten met Cronbach's alfa, zoals besproken bij de betrouwbaarheidsschattingen .

Wat is de belangrijkste eigenschap van een latente variabele in de itemresponstheorie? A) Het is direct observeerbaar. B) Het is een construct dat wordt afgeleid uit geobserveerde responsen. C) Het wordt bepaald door de moeilijkheidsgraad van de items.

Antwoord: B) Het is een construct dat wordt afgeleid uit geobserveerde responsen. Hoofdstuk: Hoofdstuk 5 Analyse: Latente variabelen zijn onzichtbare eigenschappen die worden gemeten door geobserveerde itemscores, zoals in IRT wordt beschreven .

Waarom is het belangrijk om de interbeoordelaarsbetrouwbaarheid te meten bij subjectieve tests? A) Om de validiteit van de test te vergroten. B) Om te zorgen dat de resultaten onafhankelijk zijn van de beoordelaar. C) Om de invloed van externe factoren te minimaliseren.

Antwoord: B) Om te zorgen dat de resultaten onafhankelijk zijn van de beoordelaar. Hoofdstuk: Hoofdstuk 2 Analyse: Interbeoordelaarsbetrouwbaarheid zorgt ervoor dat subjectieve scores niet beïnvloed worden door individuele beoordelaars, wat objectiviteit bevordert .

Wat is een belangrijke reden om een normgroep te gebruiken bij het interpreteren van testscores? A) Om individuele verschillen te verklaren met absolute standaarden. B) Om scores te vergelijken met een representatieve populatie. C) Om de betrouwbaarheid van de test te verhogen.

Antwoord: B) Om scores te vergelijken met een representatieve populatie. Hoofdstuk: Hoofdstuk 2 Analyse: Normen helpen scores betekenis te geven door ze te vergelijken met een relevante referentiegroep .

Wat is een voordeel van het gebruik van een orthogonale rotatie in factoranalyse? A) Het vergemakkelijkt de interpretatie door factoren onafhankelijk te houden. B) Het maximaliseert de verklaarde variantie. C) Het vermindert de complexiteit van de factorstructuur.

Antwoord: A) Het vergemakkelijkt de interpretatie door factoren onafhankelijk te houden. Hoofdstuk: Hoofdstuk 4 Analyse: Orthogonale rotatie zorgt ervoor dat factoren niet gecorreleerd zijn, wat een duidelijke interpretatie mogelijk maakt .

Standaardscores hebben altijd a) Een gemiddelde van 0 en een standaarddeviatie van 0 b) Een gemiddelde van 0 en een standaarddeviatie van 1 c) Een gemiddelde van 1 en een standaarddeviatie van 1

b) Een gemiddelde van 0 en een standaarddeviatie van 1

De variantie van een variabele X is gelijk aan 3. Wat is de variantie van de lineair getransformeerde variabele (2X — 1)? (a) 5 (b) 6 (c) 12

Voor het berekenen van de betrouwbare score (𝑇) in het Rasch-model hoef je alleen maar de kansen p1, p2, p3, etc. op een goed antwoord per item af te trekken waar of niet waar

niet waar: je hoeft het alleen maar op te tellen

Binnen de klassieke testtheorie is een belangrijk onderdeel het achterhalen van de rol van de meetfout in een test. Hiervoor kijk je naar de betrouwbaarheid. Waar komt de betrouwbaarheid op neer? a) variantie van T gedeeld door variantie van geobserveerde scores b) proportie betrouwbare variantie c) zowel a als b

c) zowel a als b

Als je de ondergrens wilt schatten van de betrouwbaarheid van een test bestaande uit dichotome items kun je gebruik maken van de a) alfaformule b) KR20-formule c) zowel a als b

c) zowel a als b

De klassieke testtheorie doet twee aannames over de meetfout. Waar komen deze aannames op neer? a) meetfouten zijn gemiddeld nul en hangen nergens mee samen b) meetfouten hebben een SD van 1 en hangen nergens mee samen c) meetfouten zijn gemiddeld nul en hangen samen met T

a) meetfouten zijn gemiddeld nul en hangen nergens mee samen

Een toevalscorrectie komt neer op een lineaire transformatie van de ruwe scores. Wat zie je als je de lineair getransformeerde scores vergelijkt met de ruwe scores? a) gelijke ordening, gelijke correlatie met een andere variabele b) gelijke ordening, ongelijke correlatie met een andere variabele c) ongelijke ordening, gelijke correlatie met een andere variabele

a) gelijke ordening, gelijke correlatie met een andere variabele

Bij normering van de test kun je de ruwe score op een aantal manieren normeren. Als wilt weten hoe iemands score zich verhoud tot de andere scores, met wat voor type normering werk je dan? a) vergelijking op basis van rangorde b) vergelijking met absolute standaard c) vergelijking op basis van gemiddelde en SD

a) vergelijking op basis van rangorde

Soms staan bij tentamens de vragen op volgorde van onderwerp. Alle vragen uit hoofdstuk 1 eerst, dan alle vragen uit hoofdstuk 2, etc. Tijdens het tentamen blijkt dat de laatste helft van de vragen niet afgedrukt is door de Repro. De docent wil een cijfer gaan baseren op het percentage goed van alleen de eerste helft maar realiseert zich dat deze score een gebrek aan.............. heeft a) inhoud validiteit b) synthetische validiteit c) concurrente validiteit

a) inhoud validiteit

Wat zijn twee voordelen van de Item-Respons Theorie ten opzichte van de klassieke testtheorie? a) populatie onafhankelijk meten, gelijke nauwkeurigheid meting voor respondenten b) populatie afhankelijk meten, gelijke nauwkeurigheid meting voor respondenten c) populatie onafhankelijk meten, ongelijke nauwkeurigheid meting voor respondenten

c) populatie onafhankelijk meten, ongelijke nauwkeurigheid meting voor respondenten

Welke schaalverdeling heb je op de verticale as nodig in het plaatje hierboven voor de itemkarakteristieke curves voor het 3PLM model? a) -3 tot 3 b) -3 tot 0 c) 0 tot 1

c) 0 tot 1

Van een test voor creativiteit is bekend dat deze test in de populatie Nederlanders een betrouwbaarheid van 0,90 heeft. Als je weet dat een onderzoeker deze test gaat gebruiken in een steekproef van kunstacademiestudenten, is de verwachting dat de betrouwbaarheid in deze steekproef lager dan 0,90 is. Welk fenomeen geeft een verklaring hiervoor? a) regressie naar het midden b) restriction of range c) stratificatie

b) restriction of range

De klassieke testtheorie draait om het achterhalen van de rol van de meetfout in een testscore. Als je een betrouwbare testscore wilt hebben, waar komt dit dan op neer wat betreft de rol van de meetfout? a) Over het algemeen liggen de meetfouten zo dicht mogelijk bij nul b) De SD van de meetfouten is zo klein mogelijk c) zowel a al b

c) zowel a al b

Stel je voor dat iemands percentielscore op een bepaalde test 80 is. Wat voor normering is gebruikt om deze percentielscore te maken? a) vergelijking op basis van rangorde b) vergelijking met absolute standaard c) vergelijking op basis van gemiddelde en SD

a) vergelijking op basis van rangorde