HC7 Betrouwbaarheid: verbeteren & gevolgen Flashcards
Ontwikkelen goede test
- een test bestaat idealiter uit een groot aantal items
- een toest moet maar één hypothtisch begrip meten
- testverlenging over het algemeen verstandig (Spearman-Brown)
- ls items in kwaliteit verschillen kan juist verwijderen zwakke items beter zijn
Item-selectie
Selectie altijd aan de hand van indicatoren van item-discriminatie
- item-restscore correlatie
- gedichotomiseerde item-restscore correlatie
- item-discriminatie index D
Item restscore correlatie
- standaard power test
Restscore R = som van alles scores zonder interesse item
- r >.3 is goede score (liefst >.4)
Item-restscore correlatie
Correlatie tussen item en scores zonder item
Correlatie bij dichotome variabelen
- ook bij twee dichotome variabelen X en Y kunnen we de associatie onderzoeken
- correlatie word anders berekend –> phi
- gaat nog steeds om geobserveerde overeenkomst tussen de twee variabelen
- score 1 op beide variabelen = overeenkomst
- score 0 op beide variabelen = overeenkomst
Phi-coëfficiënt
- iedereen valt in een van de vier ellen in een 2x2 frequentietabel
- B en C zijn overeenkomst en A en D hebben geen overeenkomst
phi = (BxC - AxD)/ wortel(A+B x C+D x A+C x B+D)
Gedichotomiseerde item-restscore correlatie (selectietest)
Test om een bepaald percentage respondenten met de hoogste (of laagste) betrouwbare scores te selecteren
- dit doe je door de doelgroep die je zoekt een score van 1 te geven en de rest een score van 0 –> gebruik daarna phi
Gebruik van phi voor item-restscore correlatie
Vul de tabel in met aan de ene kant de Itemscore en aan de andere kant de Rdich
>.3 is wenselijk
Item-discriminatie index D (dichotome items) formule
D = Phigh - Plow
- Kies de hoogste percentage en kijk hoeveel daarvan het correcte antwoord hebben en doe dit ook voor de laagste percentage
Item-discriminatie index D informatie
- Items meoten goed onderscheid kunnen maken tussen mensen die hoog vs. laag op het construct scoren (hoge discriminatie is gewenst)
- Hoge restscore is vraag goed, lage restscore is vraag fout –> dit is gewenst, maar niet altijd het geval
- deel personen op in laag, middel en hoge groep (bijv. 30 - 40 - 30%)
- hoge D is betere discriminatie = betere betrouwbaarheid
Gevolgen betrouwbaarheid
Lage betrouwbaarheid heeft invloed op
- correlaties testscore met andere constructen
- effect size schatting
- power van statistische test
Attenuatie van correlaties
- attenueren is vertroebelen
- Iedere observatie heeft meetfout (willekeurig)
- Meetfouten vertroebelen/confounden de meting
- Het gemeten construct (T) kan samenhangen met iets anders (Y)
- Geobserveerde (X) zal een zwakkere samenhang tonen door vertroebeling met T
–> meer meetfout is meer vertroebeling is lagere correlatie X en Y - lage betrouwbaarheid attenueert de geobserveerde correlaties
Attenuatie
Verlagen, vertroebelen
Stel T en Y correleren perfect
- Correlatie tussen de x en y
rTY = 1
- correlatie tussen X en Y is wortelRXX
- rxy = rTY x wortelRXX
Correlatie tussen X en Y bij niet perfecte betrouwbaarheid
Meetfout in X én Y attenueren de correlatie
rxy = rTxTy x wortelRXX x wortelRYY
- correlatie tussen de twee constructen (rTxTy) daarmee vaak veel hoger dan correlatie tussen de testscores waarmee die constucten gemeten worden rxy