Week 2 (H5 t/m 7) Flashcards

1
Q

Wat is de Klassieke test theorie? (KTT)

A

Geobserveerde scores (x⁰) + meetfouten (xe) = ware score (xt)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat zijn er naast de meetfouten van invloed op de ware score?

A

Tijdelijke en vergankelijke factoren , zoals fysieke gesteldheid en mentale staat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

De invloed van meetfouten heeft twee kenmerken. Leg uit.

A

> het gemiddelde van alle meetfouten in een test is gelijk aan 0
Meetfouten correleren niet met ware scores, Rte = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat zijn de vier benaderingen van betrouwbaarheid?

A
  1. Betrouwbaarheid in termen van ‘proporties van de variantie’
    (Rxx = St² / So²)
  2. Betrouwbaarheid in termen van ‘gebrek aan meetfout error’
    (Rxx = 1 - (Se² / So²))
  3. Betrouwbaarheid in termen van ‘correlaties’
    (Rxx = Rot²)
  4. Betrouwbaarheid in termen van ‘gebrek aan correlatie’
    (Rxx = 1 - Roe²)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn vier methoden om de betrouwbaarheid te schatten?

A

A. Parallelle testen

  • zelfde error variantie
  • intercept tussen ware scores is 0
  • Helling tussen testen is 1

B. Het tau-equivalent test model

  • intercept tussen ware scores is 0
  • Helling tussen testen is 1

C. Het essential tau-equivalent test model
- Helling tussen twee testen is 1

D. Congeneric test model
- de ware scores van de testen zijn gelijk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is de domain sampling theorie?

A

De betrouwbaarheid is de gemiddelde grootte van de correlaties tussen alle mogelijke paren van testen met N items. Dit is geselecteerd uit een gebied (domain) van test items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hoe wordt de betrouwbaarheid geschat met alternate forms?

A

Een paralleltest heeft twee testen. Met deze scores wordt de correlatie tussen testscores berekent.
Het is hierbij nooit zeker of dezelfde ware scores gemeten worden. Ook is er een kans op overdracht/besmetting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe wordt de hertest betrouwbaarheid berekend?

A

Dit is mogelijk bij hermeetbare constructen zoals intelligentie en extraversie. Hiermee wordt de error gemeten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Waarom is de aanname dat ware scores gelijk zijn niet altijd na te streven?

A

A. Sommige concepten zijn minder stabiel dan andere, zo ontstaan verschillende scores.
B. De lengte van de tussenperiode tijdens het testen kunnen de stabiliteit beïnvloeden.
C. De periode waarin de testen worden afgenomen is van belang (precies in een ontwikkeling)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is interne consistentie?

A

Een alternatief voor de paralleltest en test-hertest. Hierin wordt gebruik gemaakt van een samengestelde score (van meerdere items). Delen van een test worden als gehele testen behandeld.

Een lange test is betrouwbaarder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat zijn drie manieren om interne consistentie te onderzoeken?

A
  1. Split-half betrouwbaarheid (Spearman brown)
  2. Cronbach’s Alpha
  3. Gestandaardiseerde Alpha
  4. Cronbach’s Alpha voor binaire items (KR²⁰)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welke factoren beïnvloeden de betrouwbaarheid?

A

A. Gelijkheid tussen de testdelen (bij ongelijkheid worden items verwijderd of herschreven)
B. De lengte van de test (lang is goed)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welke twee bronnen dragen bij aan testscore-evaluatie?

A
  • puntschatter (point estimate) = de best geschatte waarde
  • betrouwbaarheidsinterval (confidence interval) = bij een groot interval is de geobserveerde score een slechte puntschatter van de ware score.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat zijn de twee soorten puntschatters?

A
  1. Een geschatte ware score op basis van de geobserveerde score
  2. Een schatting van de ware score op basis van de score op de eerste test.
    De tweede keer ligt een score dichterbij het gemiddelde -> regression to the mean.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Waar is de regression to the mean van afhankelijk?

A
  1. De betrouwbaarheid van de scores.
  2. Het verschil in grootte tussen de orgineel geobserveerde score en het gemiddelde.
  3. Het verschil in richting tussen de orgineel geobserveerde score en het gemiddelde.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hoe kan een betrouwbaarheidsinterval geïnterpreteerd worden?

A

Er kan met 95% zekerheid gezegd worden dat de ware score ergens in het betrouwbaarheidsinterval zit.

17
Q

Van welke 2 factoren is de correlatie van geobserveerde scores van twee metingen afhankelijk?

A
  • de correlatie tussen de ware scores van twee constructen (RxtRyt⁰)
  • de betrouwbaarheid van twee metingen (Rxx en Ryy)
18
Q

Wat zijn consequenties van het verschil tussen de correlatie van de geobserveerde en de ware scores?

A
  1. Metingen zijn imperfect; geobserveerde correlaties zijn altijd zwakker dan ware correlaties.
  2. De mate van verzwakking is afhankelijk van alle individuele testen. 1 laag betrouwbare test maakt de correlatie zwakker.
  3. Error beperkt de maximaal te vinden correlatie.
  4. De ware correlatie is niet te schatten.
19
Q

Welke drie meest voorkomende effectgroottes zijn er?

A
  1. Correlaties > verband tussen twee continue variabelen.
  2. Cohen’s D > verband tussen dichotomie en continue variabelen.
  3. N² > om het verband tussen continue en categorische variabelen met twee of meer te meten.
20
Q

Wat is statistische significantie?

A

Dit is een belangrijk resultaat. Er wordt een duidelijk verschil aangetoond. Hoe groter de effectgrootte, hoe meer kans op statistische significantie.

21
Q

Wat zijn drie implicaties bij het meerekenen van de betrouwbaarheid?

A

A. De betrouwbaarheid moet meegenomen worden bij de interpretatie van effectgroottes en statistische significantie.

B. verzwakking wordt geminimaliseerd door metingen met een hoge betrouwbaarheid te gebruiken.

C. Betrouwbaarheidschattingen moeten meegenomen worden in het onderzoek zodat lezers de resultaten kunnen interpreteren.

22
Q

Om te kijken naar de bijdrage van een item voor de interne consistentie wordt gekeken naar 3 punten. Dit zijn…

A
  • itemdiscriminatie
  • itemvariatie
  • itemgemiddelde