Klassieke Testtheorie deel 2 Flashcards
Betrouwbaarheid verschilscores
Rvv’= 1- S2(X1)(1-R11’)+S2(X2)(1-R22’) /
S2(X1)+S2(X2)-2S(X1,X2)
als we verschilscores willen gebruiken moeten we dus streven naar
- zo betrouwbaar mogelijke tests
- zo onafhankelijk mogelijke tests (hoe lager hun testscores correleren, hoe beter)
bij het interpreteren van verschilscores moet men zeer voorzichtig zijn, vooral bij testscores die onderling samenhangen.
attenuatie
neem twee testen met geobserveerde scores X en Y
stel dat we zouden weten dat de correlatie tussen de betrouwbare scores gelijk is aan 0.5
de betrouwbaarheid waarmee X bepaald wordt is 0.4 en de betrouwbaarheid waarmee Y bepaald wordt is 0.6
r(X,Y) = r(TX,TY) √rXX’ √ rYY’
= 0.5 x √0.4 x √0.6
= 0.5 x 0.63 x 0.77
=0.24
geobserveerde correlatie is kleiner geworden dan de correlatie tussen de betrouwbare scores .23
door onbetrouwbaarheid is de correlatie tussen de geobserveerde scores lager dan de correlatie tussen de betrouwbare scores
attenuatie
correctie voor attenuatie
r(TX,TY) =r(X,Y)/√rXX’ √ rYY’
het product van betrouwbaarheidsindeces is een bovengrens voor validiteit
r(X,Y) <= rXX’ rYY’
het product van betrouwbaarheidsindeces is een bovengrens voor validiteit
correlatie tussen een test en een criterium kan nooit groter zijn dan de wortel uit het product van de betrouwbaarheid van de testen
r(X,Y) <= rXX’
de betrouwbaarheidsindex is bovengrens voor validiteit
correlatie tussen een test en een criterium kan nooit groter zijn dan de wortel uit de betrouwbaarheid van de test
betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit
betrouwbaarheid is echter geen voldoende voorwaarde voor validiteit: hoge betrouwbaarheid impliceert niet automatisch hoge validiteit
correctie voor dilutie
b = Rxx’ bT
als bT ≥ 0 dan volgt, omdat rXX’ ≤ 1, dat
b ≤ bT
dus als bv bT=3.33 en rXX’ = .9 dan is b=.300
als bT ≤ 0 dan volgt, omdat rXX’ ≤ 1, dat
b ≥ bT
dus als bv bT=-3.33 en rXX’ = .9 dan is b=-.300
dilutie of regressive attenuatie
in beide gevallen drukt b een minder sterke relatie uit dan bT
een lage betrouwbaarheid leidt tot
onnauwkeurige schattingen van de betrouwbare score
lage betrouwbaarheid van de verchilscore
een verlaging van de correlatie en dus een lage validiteit (attenuatie)
lage validiteit (bovengrens)
een verlaging van de regressie coefficient (dilutie)
op basis van twee afnames
parallellie: test-hertestbetrouwbaarheid
paralleltestbetrouwbaarheid
op basis van één afname in 2 gesplitst
splitsingsbetrouwbaarheid
equivalentie: guttman; flanagan; rulon; lambda 4
parallellie: spearman-brown
op basis van één afname in k gesplitst
equivalentie: cronbach (alfa)
betrouwbaarheid bepalen op basis van twee afnames
noteer de scores met XI en XII
als we er van uitgaan dat de tests I en II equivalent zijn, dan geldt
RX1 X1’= S(X1,X2) / S2(X1)
RX2 X2’= S(X1,X2) / S2(X2)
RX1 X1 /= RX2 X2’
Deze methode niet gebruikt omdat niet duidelijke welke betrouwbaarheid
als parallel
RX1 X1 = RX2 X2’ = Rxx’ = R(X1,X2)
als testen parallel zijn is er maar één betrouwbaarheid
dit leidt tot een werkwijze om betrouwbaarheid te schatten
test-hertest
neem tweemaal dezelfde test af bij een grote groep representatieve personen met een zeker tijdsinterval tussen de afnames
bereken de correlatie tussen geobserveerde scores op de twee afnames van dezelfde test (XA en XB)
dit is de schatting van de betrouwbaarheid van deze test, als we er van uitgaan dat een test parallel is aan zichzelf
paralleltest
neem twee parallelle tests (XI en XII) af bij een grote groep representatieve personen met een zeker tijdsinterval tussen de tests
bereken de correlatie tussen geobserveerde scores op de twee tests
dit is een schatting van de betrouwbaarheid van elke van deze tests