begrippen Flashcards

Question

6 stappen bij opzetten van een test met predictieve validiteit OKAVCK

Answer 1

1. Operationaliseren 2. Keuze van mogelijke tests 3. Afname van test (verwijderen/toevoegen van items) 4. Validatie (proefpersonen) 5. Combineren van tests met goede testbatterij 6. Kruisvalidering Resultaten uit valideringsonderzoeken zijn vaak matig (onder de 0.4)

Answer 2

Variatiebeperking op voorspellende en criteriumvariabele Moderatorvariabele: correleert niet met een criteriumscore Y maar heeft wel invloed op andere variabele

Answer 3

Het vinden van theorie als verklaring voor testgedrag

Answer 4

Voorspellen van gedragBeg

Answer 5

Het emperisch BEWIJZEN van testgedrag Omvat 'trek- en nomologischevalidatie omdat er betekenis en structuuronderzoek is gedaan (wel letten op sociaal wenselijkheid)

Answer 6

Voorspelling over functie op basis van componenten uit de functie

Answer 7

Vergelijking met andere testen met dezelfde eigenschap

Answer 8

Indruksvaliditeit: Of een test voor 'leken' duidelijk is wat betreft de score en testbetekenis (Kleurentest) Inhoudsvaliditeit: Of een test voor deskundigen duidelijk is

Answer 9

Of de test een bestaande voorspelling kan verbeteren

Answer 10

Hoe goed een testresultaat overeenkomt met criteria die gelijktijdig verzamelt zijn tussen bijvoorbeeld alle leraren.

Answer 11

Alfa is de onderschatting van de echte betrouwbaarheid. Lambda2 is groter dan alfa en GLB is groter dan lambda 2. Niet geschikt voor speedtest wel voor een powertest

Answer 12

(2 testen) Score op dezelfde test Nadelen: - Geheugen effect: overschatting - Anders over construct gaan denken: onderschatting - Tijdsduur tussenafnames - Verstoord geheugen Als beide testen als onafhankelijke replica's gezien kunnen worden, is de r op beide testen gelijk aan de betrouwbaarheid

Answer 13

(2 testen) Score op twee paralelle tests Vaak onmogelijk omdat items gelijkwaardig maar niet hetzelfde moeten zijn - Gemiddeldes, variantie en correlaties moeten gelijk zijn.

Answer 14

(1 test) Score op alle mogelijke testhelften door bijv. alfa Gebruikt dus alle items van een test

Answer 15

(1 test) score op twee testhelften. Testen worden verdeeld dus 30 en 30 en op beide een score berekend. SPEARMAN BROWN FORMULE Aks de test parallel is, is de r van de scores in de populatie gelijk aan de betrouwbaarheid van de scores op een halve test is dus efficient!

Answer 16

In de test worden vragen moeilijker of makkelijker gemaakt afhankelijk van eerdere antwoorden Samenvatting MOET voldoen aan de IRT WEISS vuistregel: Adaptieve testen meten even nauwkeurig met ongeveer de helft van de lengte van een standaardtest

Answer 17

Leidt tot populatie onafhankelijke ordening van personen & items! - IRF mogen NIET dalen en elkaar NIET snijden - Ordinale schaal + p-waarde RASCH model

Answer 18

Staat alleen monotome niet dalende IRF's toe. Iemand wordt geordend op θ aan de hand van hun score X - Antwoord op ALLE items moet een afspiegeling zijn van de psychologische eigenschap op de θ schaal -ordinale schaal - hoge betrouwbaarheid vanwege klein verlies van items - P-waarde wordt berekend (grote P = gemakkelijk item)

Answer 19

populatie afhankelijk, moeilijkheiden (delta) bij testen kunnen NIET worden onderscheiden onder deelnemers -> met name heel makkelijk te gebruiken X= T+E of r(E,T) = o

Answer 20

Weergeven van gecalibreerde items uit verschillende testen die dezelfde psychologische eigenschap meten

Answer 21

Weergeven van items op een schaal en het daarbij toekennen van de meetwaarden

Answer 22

Combinatie van itembank en item responstheorie

Answer 23

Kijkt naar hoe goed te testvraag past bij het niveau van de persoon. Hangt dus af van de Moeilijkheidsgraad δ en kennisniveau θ - Alle items hebben HETZELFDE DISCRIMINEREND VERMOGEN van 1 - Meetwaaren zijn populatie afhankelijk - Kan niet gegeneraliseerd wordne van doelgroepen naar populatie Waarde altijd tussen 0 en 1 Geen discriminatie coëfficiënt dus ze stijgen hetzelfde, en dus kunnen ze elkaar nooit kruisen omdat ze altijd parallel lopen

Answer 24

Kijkt naar de kans dat een persoon met bijv. depressie θ een specifiek antwoord geeft op een item. Dit antwoord wordt bepaald door persoonseigenschappen parameters - Meet eigenschappen onfhankelijk van de populatie

Answer 25

Dan zal een kleine verandering in θ grotere gevolgen hebben voor de succeskans

Answer 26

IRT is minder afhankelijk van de steekproef omvang IRT kan met dichotome & Polytome items werken IRT biedt vergelijkbare resultaten over verschillende steekproeven

Answer 27

- Kan alleen als d

Answer 28

Kan ontbrekende variabele Y op basis van de score van bekende variabele X geschat worden

Answer 29

Slechts 0,27 % ligt buiten 3 SD van het gemiddelde 5e Gemiddelden en varianties (onafhankelijk van groepen)

Answer 30

Wordt mee gerekend als een aantal respondenten dezelfde ruwe score hebben

Answer 31

Vergelijkt scores met vaste standaarden, dus niet vergeleken met anderen

Answer 32

Morfologische methoden: Fysieke kenmerken onderzocht als mogelijke verklaring voor persoonlijkheidskenmerken (FRENOLOGIE) Fysiologische methoden: Bijc. EEG, MRI, bloeddruk wat ook mogelijke relaties hebben met psychologische variabelen

Answer 33

Machinale scoring - met pc Zelfscoring is met twee vellen over elkaar heen

Answer 34

Hoe een taak wordt uitgevoerd dus niet het resultaat Niveautests: gedragstesten of motorische testen Projectietests: Vage opdrachten om reactie deelnemer te zien.

Answer 35

Bij 0 Boven de 0

Answer 36

Tests voor speciale geschiktheden Creativiteit, ruimtelijk inzicht Test voor speciale intelligentie Factoren Geheugentesten, administratieve testen Test voor speciale niet intelligentie factoren Motorieke testen

Answer 37

HOOG Heeft een Hoge item rest correlatie (komt voor in klinische + persoonlijkheidsschalen)

Answer 38

LAAG Cognitieve + onderwijs testen Heeft een lage item rest correlatie

Answer 39

.65 heel hoog .20/.40 normaal Is de r tussen de score op item Xg en de restscore X-Xg Berekent alleen de de r van een item met andere items en niet met zichzelf (want anders heb je altijd een item met een r van 1) ITEM REST IS ALTIJD LAGER DAN ITEM TEST

Answer 40

Dat er WEINIG samenhang is met de scores van andere items Kan komen door slecht geformuleerde vraag in een persoonlijkheidstests

Answer 41

Onderlinge vergelijking van testscores van dezelfde persoon

Answer 42

Meet de mate van lineaire samenhang tussen 2 variabelen Geeft ALLEEN de richting van het verband aan NIET de sterkte

Answer 43

Aantrekkelijkheid van andere antwoordopties

Answer 44

Kijk je naar p waarde en naar a waarde Kijk je naar gemiddelde score en spreiding van item

Answer 45

Cohen's Kappa

Answer 46

Kendalls Tau en Spearmans Rho

Answer 47

Tests of maximum performance High stakes, prestatieniveautests (IQ, tentamens goed/fout) Tests of typical performance Low stakes, gedragstesten zoals persooblijkheidstesten of klinische onderzoeken (geen goed of fout maar voorkeuren, meningen en gedragsschalen)

Answer 48

* standaardisatie (omstandigheden voor iedereen zelfde) * Objectiviteit Testafnemer kan geen invloed hebben op resultaat -> intersubject. prin.: Maakt niet uit wie de beoordelaar is -> Interbeo. betr.: Mate van overeenstemming tussen beoordelaars * Efficientie (meet alleen bepaalde construct) * Normering (beschikbaarheid van normering) * Betrouwbaarheid (bij herhaling zelfde score) * Validiteit (meet test wat het moet meten)

Answer 49

Multiple cut-off procedure

Answer 50

Vergelijken met een absolute standaard.