begrippen Flashcards
Klassieke Testtheorie zegt dat iedere testscore een mix van .. en .. is.
Wat meet het?
3 nadelen
Zegt dat iedere testscore een mix van T en E is (ware scores en meetfout) Betrouwbare score T schatten met testscore X. Meet betrouwbaarheid
Nadelen:
- T en X zijn afhankelijk van de respondent en de test
- Er is geen controle op het model
- SE is voor iedereen gelijk
Item Respons Theorie (IRT)
Beschrijft de kans dat …. met … op een item ….
Wordt beschreven door …
Beschrijft wat de kans is dat een persoon met bijv. bepaalde psychologische trek (extraversie) op een item hoog scoort.
Wordt beschreven door logistische functie (IRF)
Unidimensionaliteit bij IRT
Alle items in een test meten dezelfde (persoonlijkheids)trek (dus geen twee dingen)
Lokale Onafhankelijkheid (IRT)
Antwoord op een item wordt NIET beïnvloed door antwoord op andere items.
Bijv. als je item 1 niet weet heb je weer een nieuwe kans bij item 2
Kan problematisch zijn bij IRT bij het meten van psychologische constructen
Orthogonaal
Geen correlatie (bijv. Persoonlijkheid in de BIG 5)
Standaardfout (SE)
meet de afwijking van de … Bepaald de …. van testscores. Een hoge SE betekent ……
Meet hoeveel de scores kunnen afwijken door meetfout. Afwijking van de ware score. Bepaald de nauwkeurigheid van testscores.
Geeft dus aan hoe precies een testscore de uiteindelijke ware score omschrijft.
Hogere SE betekent lagere betrouwbaarheid!!!!
SE hangt af van de betrouwbaarheid van de test
Monotoniciteit (IRT)
De IRT zal niet gaan dalen. Blijft eigenlijk redelijk stijgen.
Bijv. Je hebt een hoger IQ en daardoor ook meer antwoorden goed.
Met welke schaling houdt de mokkenschaal zich vooral mee bezig?
Houdt zich vooral bezig met ordinale schaling
Principale Componenten Analyse
reduceert … in data
Exploratief -> enkel op data gebasseerd
Reduceert dimensies in data
Gewichten worden automatisch gekozen
‘Wat is de structuur an deze test’ Je hebt nog geen hypothese en weet ook niet welke items bij elkaar horen.
Oblique
Gerelateerde constructen (bijv. IQ-test)
Multiple Group Method (MGM)
Bevestigend -> Gewichten worden door onderzoeker gekozen
‘Ik weet al welke items waar horen en weet ook al de structuur, klopt dit?’
Wat doet de factor analyse met een test?
Gaat over …. van een test
Het samenvatten van je test
Veel items samenvatten in minder factoren. Gaat over de DIMENSIONALITEIT van een test
4 stappen van de componenten analyse
- Bepaal de gewichten
- Correlaties berekenen (loading matrix)
- Interpretatie (alle items die hoog correleren worden bij elkaar gezet)
- Proportie Verklaarde Variantie (VAF): Hoeveel Variantie worden verklaard door de factoren? Vaak tussen 0.30 & 0.80
Wat schat het Groepsmodel?
Welke 2 dingen worden gebruikt?
groot of smal BHI?
Methode om de standaardmeetfout (SE) mee te schatten.
Op basis van lineaire regressie + gegevens uit populatie. HEEL NAUWKEURIG DUS SMALLER BHI
Bekend:
X: geobserveerde score
S(X): standaarddeviatie
Rxx: Betrouwbaarheid (bijv. Alfa, Test-hertest)
Xgem,: Gemiddelde score
Congruente validiteit
Samenhang met scores op een test een SOORTGELIJKE eigenschap meten
Divergente validiteit
Samenhang met scores op een test die ANDERE eigenschappen meten.
Individueel model
Eenvoudigere methode om de standaardmeetfout (SE) mee te schatten
Bekend:
X: geobserveerde score
S(X): standaarddeviatie
Rxx: Betrouwbaarheid (bijv. Alfa, Test-hertest)
Noem de aannames binnen de klassieke testtheorie (2)
- de gemiddelde meetfout bij N personen is gelijk aan 0
- De correlatie van de meetfout EN een willekeurige variabele is 0.
Discriminante validering
H1/H0
H1 verwerpen
Confirmerende validering
h1/h0
H0 accepteren
Nomologische validering
Een theorie zoals bepaalde eigenschappen die een verklaring geven voor de testscore
Trekvalidering (wordt vaakst gebruikt)
Benoem een belangrijke test waarbij dit is gebeurd
Stanford-Binet-Test voor IQ
In hoeverre kan testgedrag verklaard worden met behulp van een persoonlijkheidstrek –> GAAT DUS NIET PERSEE OVER THEORIE
Multitrek-multimethode benadering
Kijkt naar … + … door de … in een matrix om … vast te stellen
Kijkt naar betrouwbaarheid + Validiteit door de CORRELATIES IN EEN MATRIX om discriminante validiteit vast te stellen.
V-waarden moeten significant HOGER zijn dan D+M waardes
Uiteindelijkcriterium
Tussentijdscritierum
Onmiddelijkcriterium
+ 2 problemen
Conceptuele criterium
Uiteindelijkcriterium: Erg abstract en vaak niet haalbaar
Tussentijdscritierum: Bijv. in plaats van beroepsprestaties kijk je naar de eindexamencijfers
Onmiddelijkcriterium: Bijv. totaal aantal behaalde studiepunten
2 problemen: Tijd en abstractieniveau
Conceptuele criterium: Concreet! Doel voor eindresultaat en criterium maten zijn uitgesproken