7. Structurele validiteit met Item Response Theory Flashcards

Question 1

Q

Item Response Theory (IRT) richt zich op..

Answer

A

The kwaliteit van individuele items binnen een meetinstrument.

Question 2

Q

Classical Test Theory (CTT) richt zich op…

Answer

A

(hoofdzakelijk) op de kwaliteit van sub-schalen. De focus ligt op (de ontwikkeling van) het instrument

Beoordeling middels Factor Analyse (FA)

Question 3

Q

IRT en CTT zijn alleen relevant voor..

Answer

A

Multi-item instruments, based on a reflective model

Question 4

Q

Wat is het doel van IRT?

Answer

A

Het ontwikkelen van een schaal (metric) om een bepaald construct te meten.

PROMS gebaseerd op CTT hebben geen gemeenschappelijke schaal (de scores zijn niet vergelijkbaar)

Question 5

Q

Wat biedt IRT?

Answer

A

Een gemeenschappelijke schaal om scores vergelijkbaar te maken

Question 6

Q

Hoe ziet het IRT metric er uit?

Answer

A

metric = Theta (θ)
mean = 0
SD = 1

(In de populatie waarin het IRT model is ontwikkeld)

Question 7

Q

Wat zijn mogelijke toepassingen voor IRT?

Answer

A

Bestaande instrumenten op een gemeenschappelijke schaal plaatsen (cross-walk)
Het ontwikkelen van een ‘item bank’ and het selecteren van vragen van de item bank voor de intwikkeling van instrumenten

Question 8

Q

Wat wordt er bedoelt met een ‘item bank’?

Answer

A

Een grote set aan vragen, geordent op een schaal in op basis van ‘moeilijkheid’ (difficulty/ ability)
Hoe meer items er zijn, hoe meer precies
Dit kan ook worden gebruikt om tailored PROMs te ontwikkelen (bijv. verschillende vragenlijsten voor subgroepen zoals ouderen)

Alle items moeten hetzelfde construct meten

Question 9

Q

Wat is Computerized Adaptive Testing (CAT)?

Answer

A

Een geavanceerdere vorm van IRT
Hierbij begin je bij een vraag in het midden van de schaal, en gebaseerd op de antwoorden van de respondent kan er meer en meer precies worden bepaald waar de respondent zich op de schaal (theta metric) bevind
Meestal zijn er 5 tot 7 vragen nodig om een goede inschatting te kunnen maken

Question 10

Q

Wat zijn de voordelen van CAT?

Answer

A

Patienten krijgen meer relevante vragen
Patienten hoeven minder vragen te beantwoorden
CATs hebben betere measurement properties

Question 11

Q

Wat modelleert IRT?

Answer

A

De relatie tussen de vragenlijst vragen en de personen die daarop antwoorden
* gebaseerd op kansen; hoe meer van een onderliggend construct (eigenschap, vermogen) een persoon heeft, hoe waarschijnlijker het is dat de persoon een bepaald antwoord zal geven.

Question 12

Q

Wat is de ‘item difficulty’? Bij IRT

Answer

A

De waarde voor Theta waar p=0.5

Question 13

Q

Wat is ‘item discrimination’ bij IRT?

Answer

A

De helling (slope) bij p=0.5

Des te stijler de helling, des te beter de discrimination (onderscheidend vermogen)

Question 14

Q

Welke twee soorten IRT zijn er?

Answer

A

1-parameter model (Rash model)
Hierbij verschillen de items in difficulty, maar hebben ze wel het zelfde onderscheidende vermogen (helling is hetzelfde)

2-parameter model
Hierbij verschillen de items in difficulty én in onderscheidend vermogen

Question 15

Q

Wat als een item meerdere reponse opties heeft?

Answer

A

Dit noem je polytomous items

Hierbij wordt de kans op elke respons gemodelleert (zie figuur aantekeninen)
* Theta metric is waar de kans op het geven van een bepaald antwoord van de ene naar de andere categorie verschuift.

= Meerdere thresholds (aantal antwoord opties - 1), maar wel maar één discrimination parameter (slope)

Question 16

Q

Wat zijn de assumpties voor IRT?

Answer

A

Het construct is gebaseerd op een reflectief model
De item bank is unidimensional
Resterende correlaties tussen items moeten klein zijn; geen local dependence
De waarschijnlijkheid om een hogere item-antwoordcategorie te krijgen moet toenemen (of in ieder geval niet afnemen) met toenemende niveaus van het onderliggende construct (=monotoniciteit)

Question 17

Q

Hoe and de unidimensionality wordt gechecked?

Answer

A

Met Confirmatory Factor Analysis (CFA)
* CFI: >0.95
* TLI: >0.95
* RMSEA: <0.06
* SRMR: <0.08

Steeds vaker wordt ook bi-factor analyse gebruikt:
* Explained common variance (ECV) > 0.70
* Omega-hierarchical index (wH) > 0.80

Question 18

Q

Hoe kan local dependence wordt beoordeeld?

Answer

A

Door het bekijken van de residual correlations tussen items (gebaseerd op de correlatie matric van CFA)

**Residual correlations: <0.20 **

Question 19

Q

Hoe kan monotonicity worden beoordeeld?

Answer

A

Middels de Mokken scoring:

item H >0.30
item bank H > 0.50

Grafiek moet vergelijkbaar zijn met die van de polytomous items

monotonicity = De waarschijnlijkheid om een hogere item-antwoordcategorie te krijgen moet toenemen (of in ieder geval niet afnemen) met toenemende niveaus van het onderliggende construct

Question 20

Q

Hoe beoordeel je de validiteit van een IRT model?

Dit doe je voor elk item apart!

Answer

A

S-X^2 wordt vaak gebruikt –> vergelijkt de waargenomen (observed) en verwachte (expected) responsfrequenties onder het geschatte IRT-model vergelijkt de observed en expected response frequencies

P-waarde van de S-X^2 moet NIET <0.001 zijn

Question 21

Q

Wat is Differential Item Functioning (DIF) en waarom is dat belangrijk voor de validiteit van een IRT

Answer

A

DIF vindt plaats wanneer mensen met hetzelfde ability level een andere kans hebben op een item

Uniform DIF = zelfde helling, maar consistent lagere hogere probability (confounding)

Non-uniform DIF = verschillende helling; kruisen elkaar (effect-modificatie)

Question 22

Q

Hoe bepaal je de betrouwbaarheid (reliability) in CTT en IRT?

Answer

A

CTT: Cronbach’s alpha –> een waarde voor iedereen

IRT: SE (theta) –> vershillend per persoon

SE = 1/√ I (information)
Reliability = 1 - SE^2

SE (theta) is een parameter voor interne consistentien