Hoofdstuk 4 Flashcards
Wat houdt betrouwbaarheid in?
Hoe consistent een methode iets meet, als hetzelfde specifieke onderzoek consistent kan worden bereikt door dezelfde methoden te gebruiken onder dezelfde omstandigheden
Hoe verschillen validiteit en betrouwbaarheid van elkaar?
- validiteit: meten wat we beogen te meten?
- betrouwbaarheid: zelfde resultaten als onderzoek op dezelfde wijze uitvoeren
Welke twee soorten fouten zijn er?
1 systematische fouten
- toe te schrijven aan construct irrelevante surplus
- validiteitsprobleem
2. toevalsfouten
- niet eigen aan de meting of de gestandaardiseerde context van de meting (onvoorziene omstandigheden)
- betrouwbaarheidprobleem
Wat zijn oorzaken van onbetrouwbaarheid?
- testconstructie
- testafname
- factoren eigen aan testcontext
- factoren eigen aan geteste persoon
- factoren eigen aan testleider - testscoring en testinterpretatie
Wat is de basisassumptie van de klassieke testtheorie?
Geobserveerde score = ware score + fout (𝑋𝑗 = 𝑇𝑗 + 𝐸𝑗)
Wat zijn de bijkomende assumpties van de klassieke testtheorie?
- de verwachte waarde van de fout moet 0 zijn (𝐸(𝐸𝑗) = 0)
- de fouten mogen niet met elkaar correleren (𝜌𝐸𝐸 = 0)
- de fouten mogen niet correleren met de ware score (𝜌𝑇𝐸 = 0)
- de variantie van de geobserveerde score kan gezien worden als de som van de variantie van de ware score en de variantie van de fouten (𝜎²𝑋 = 𝜎²𝑇 + 𝜎²𝐸)
- de betrouwbaarheid in de populatie is de verhouding tussen de variantie van de ware scores gedeeld door de variantie van de geobserveerde scores (𝜌𝑋𝑋= 𝜎²𝑇/𝜎²𝑋 = 1−𝜎²𝐸/𝜎²𝑋)
- de standaardmeetfout is gelijk aan de standaarddeviatie van de geobserveerde scores maal de vierkantswortel van 1-betrouwbaarheid (𝜎𝐸=𝜎𝑋 sqrt(1−𝜌))
Wat zijn de verschillende manieren om betrouwbaarheid te schatten?
- test-hertestbetrouwbaarheid
- parallele/alternatieve vormen van betrouwbaarheid
- interne consistentie
- interbeoordelaarsbetrouwbaarheid
Wat houdt test-hertesbetrouwbaarheid in?
- 2 afnames van dezelfde test
- enkel voor stabiele kenmerken
- foutbron: omstandigheden testafname
- maat: pearsoncorrelatie (stabiliteitscoëfficiënt)
Wat houden parallele/alternatieve vormen van betrouwbaarheid in?
- 1 of 2 afnames: 2 versies ofwel op 1 moment afnemen ofwel op 2 momenten
- parallelle vormen: zelfde geobserveerde gemiddelden, standaarddeviatie, correlatie met ware score
- alternatieve vormen: enkel equivalent in termen van inhoud en itemmoeilijkheid (minder strikt)
- foutbron: testconstructie en testafname
- maat: pearsoncorrelatie (correlatie tussen score op eerste versie en tweede versie)
Wat houdt interne consistentie in?
- 1 afname
- samenhang tussen items binnen een schaal: evalueren van homogeniteit
- foutbron: testconstructie
- 3 maten
- split-half reliaability (Spearman-Brown)
- Kuder-Richardson 20 (dichotome items)
- Cronbach’s alfa (Likert schalen)
Wat houdt interbeoordelaarsbetrouwbaarheid in?
- 1 afname
- overeenkomst tussen beordelaars van zelfde antwoord
- foutbron: scoring en interpretatie
- 3 maten
- Cohen’s kappa
- pearsoncorrelatie
- interklasse correlatie
Welke 2 betrouwbaarheidskwesties zijn er?
- restriction of range: een test heeft geen vaste betrouwbaarheid, maar hangt af van de populatie
- regression to the mean: hoe hoger een individu scoort op een test, hoe kleiner de kans dat het individu nog hoger zal scoren bij een volgende test
Welke 3 typen van gebruik voor de grootte van de betrouwbaarheidscoëfficiënt zijn er volgens de COTAN?
- belangrijke beslissingen op individueel niveau
- r < 0.80 -> onvoldoende
- 0.80 ≤ r < 0.90 -> voldoende
- r ≥ 0.90 -> goed - minder belangrijke beslissingen op individueel niveau
- r < 0.70 -> onvoldoende
- 0.70 ≤ r < 0.80 -> voldoende
- r ≥ 0.80 -> goed - experimenteel gebruik
- r < 0.60 -> onvoldoende
- 0.60 ≤ r < 0.70 -> voldoende
- r ≥ 0.70 -> goed
Wat houdt de generaliseerbaarheidstheorie in?
Identificeren van alle facetten die mogelijkerwijze aanleiding geven tot fouten in de meting en samen onderzoeken -> in welke mate hebben verschillende bronnen van mogelijke onbetrouwbaarheid invloed/effect op de variabiliteit in de scores
Wat is de basis van de betrouwbaarheid binnen de moderne testtheorie?
Logistische modellen op basis van 1, 2 of 3 parameters