H5: Afnemen en verwerken Flashcards

1
Q

Hoe moet de testafname verlopen om het mogelijk te maken om informatie uit de test goed te interpreteren en tussen respondenten te vergelijken?

A

zo gestandaardiseerd mogelijk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat zijn de voorwaarden voor een adequate meting? 3x

A
  1. afwezigheid van storende omgevingsinvloeden
  2. bereidheid tot medewerking van de onderzochte persoon
  3. Vermogen van de testleider een duidelijke uitleg te geen en een goed testklimaat te scheppen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hoe worden tests met een open-antwoordvorm gescoord?

Wat is daarbij belangrijk? 2x

A

Handmatig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Op welke 3 manieren kunnen tests met een meerkeuze-antwoordvorm worden gescoord?

A
  1. Handscoring bestaat doorgaans uit het leggen van een sjabloon over het antwoordformulier, waarna de verkregen scores op hetzelfde formulier of een apart scoreformulier worden genoteerd.
  2. Bij zelfscoring geeft de onderzochte persoon zijn antwoorden op een doordrukformulier, zodat de score van een antwoord op het onderliggende formulier direct zichtbaar is.
  3. Bij machinale scoring worden de vragen via een computer afgenomen. In het boek wordt ook de inmiddels iets verouderde vorm beschreven waarin de antwoorden in de vorm van streepjes op een optisch leesbaar formulier gegeven. Het formulier wordt door een leesapparaat gelezen en door een computer gescoord. Machinale scoring is aantrekkelijk wanneer zeer veel personen worden getest, zoals bij schoolvorderingentests, intelligentietests en multiple-choicetentamens. Bovendien is machinale scoring weinig arbeidsintensief en dus goedkoop en worden er geen scoringsfouten gemaakt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn 2 lastigheden bij het scoren van antwoorden op meerkeuzetests?

A
  1. De onderzochte kan door te raden een hogere score krijgen
  2. De weging van items: moeten alle items even zwaar meetellen voor de te meten eigenschap?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe wordt de lastigheid bij scoren van antwoorden op meerkeuzetests namelijk het gissen opgelost?

A

door toevalscorrecties toe te passen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is adaptief testen?

A

De respondent krijgt items voorgelegd die zijn toegespitst o zijn of haar (ingeschatte) niveau.
Iedere respondent krijgt dus een andere subset van vragen, namelijk vragen die voor deze respondent het meest informatief zijn om zijn of haar niveau in te schatten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is er voor nodig om adaptief te kunnen testen?

A

Voor adaptief testen is een grote itembank noodzakelijk met items die variëren in moeilijkheidsniveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is een voordeel van adaptief testen?

A

Tijdsbesparing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Waarom wordt er in de praktijk vaak met bewerkte scores gewerkt?

A

Omdat ruwe scores op tests meestal op zichzelf weinig betekenis hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welke 3 typen bewerkte scores zijn er?

A
  1. Score vergelijken met een absolute standaard
  2. Testscores delen door een andere variabele (bijv. leeftijd) en daardoor onafhankelijk gemaakt van die variabele bijv. IQ
  3. Relatieve positie in een referentiegroep
    Let erop dat pas wanneer de testscores worden vergeleken met een representatieve steekproef waarvan de kenmerken bekend zijn, er wordt gesproken over een genormeerde score.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Er zijn vele soorten genormeerde scores in gebruik. Onderscheid wordt gemaakt tussen welke 2 normscores?

A
  1. normscores die op een rangorde van de ruwe scores zijn gebaseerd, zoals percentielen (percentielscores),
  2. normscores die op het gemiddelde en de spreiding van de ruwe scores zijn gebaseerd, zoals standaardscores (onder andere z-scores en genormaliseerde standaardscores)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Bij onderzoekers die enige kennis van statistiek hebben, zijn z-scores populair. Wat geeft deze aan?

A

Een z-score geeft het aantal standaarddeviaties weer dat de ruwe score onder of boven het gemiddelde ligt. Als de scoreverdeling min of meer normaal is, is een z-score gemakkelijk te koppelen aan het percentage personen dat lager scoort dan de desbetreffende persoon; een z-score is in die gevallen even goed interpreteerbaar als een percentiel. Voor communicatie met niet-statistisch geschoolden zijn z-scores minder geschikt, onder meer vanwege het voorkomen van negatieve scores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wanneer spreekt men van een genormaliseerde standaardscore?

A

Wanneer men genormeerde scores gebruikt, waarbij de oorspronkelijke vorm van een verdeling is omgezet in een normaalverdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is het bekendste voorbeeld van een genormaliseerde score?

A

Stanines (afkorting van standard nine)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Waarom is het gebruik van een stanineschaal aantrekkelijk?

A

Zoals de naam aangeeft, lopen stanines van 1–9. Gebruik van de stanineschaal is aantrekkelijk, omdat het aantal mogelijke scores beperkt is en omdat de associatie met de schaal van rapportcijfers voor de hand ligt. Hierbij moet wel bedacht worden dat rapportcijfers lopen van 1 tot 10 en het cijfer 6 voor een ‘voldoende’ staat, terwijl op de stanineschaal 5 het gemiddelde is. Verder zijn sommigen van mening dat de stanineschaal te grof is, vooral in het midden van de verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Ten aanzien van welke ‘zaken’ kunnen zich problemen voordoen met standaardisatie?

A
  1. variatie in de testsituatie (bijvoorbeeld temperatuurverschillen, schrijfcondities, individuele of groepsgewijze afname);
  2. variatie in de situatie waarin de onderzochte verkeert (bijvoorbeeld motivatie, coöperatie, onbevangenheid);
  3. variatie in het gedrag van de proefleider (bijvoorbeeld zakelijk, belangstellend, sekse, leeftijd).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Waarom is standaardisatie van belang en wat is het gevolg van niet-gestandaardiseerde testafname?

A

Standaardisatie is van belang indien we iemands testprestatie willen kunnen vergelijken met de prestaties van anderen op dezelfde psychologische test. Indien niet getest is onder maximaal gelijke testcondities en/of er onvoldoende of geen controle is uitgeoefend op de omstandigheden waarin de proefpersoon getest is en/of benaderd wordt door de proefleider, zijn variaties in testprestaties niet puur en alleen toe te schrijven aan verschillen tussen de proefpersonen. Een deel van de variatie zal toe te schrijven zijn aan verschillen in de testafnames.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wat is volgens de auteurs het bezwaar tegen de klinisch-intuïtieve weg? Waarom of wanneer is het voorstel bezwaarlijk?

A

Volgens de klinisch-intuïtieve weg kunnen elementen van de testsituatie (aard en verloop van de interactie tussen onderzochte en proefleider) in de evaluatie (van de testresultaten) worden verwerkt. Het bezwaar van Drenth en Sijtsma tegen dit voorstel is dat hierbij subjectieve impressies en ideeën van de psycholoog een rol zullen gaan spelen. Indien men uit is op het genereren van hypothesen en/of het zoeken naar wegen voor verder onderzoek, is de methode aanvaardbaar en nuttig. Wanneer men echter voorspellende of classificerende uitspraken wil doen, is het beter om te trachten zo veel mogelijk vergelijkbaarheid en objectiviteit (bij de testafname!) te bewaren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wat wordt geadviseerd en wat wordt afgeraden ten aanzien van de score bij de open-vraagvorm?

A

Bij tests die een open-vraagvorm hebben, doen zich gevaren van subjectiviteit en lage interbeoordelaarbetrouwbaarheid voor. Ter reductie van deze gevaren is een volledig, duidelijk en ondubbelzinnig coderingssysteem vereist. Zonder een voldoende interbeoordelaarovereenstemming is het onmogelijk tot zinvolle uitspraken en predicties te komen. Ook is validiteitsonderzoek op basis van onvoldoende betrouwbare variabelen een verspilling van tijd. Van belang is bij het gebruik van de open-vraagvorm zo veel mogelijk vooraf de beslissingen omtrent de coderingen te nemen en de coderingswerkzaamheden zo veel mogelijk te delegeren aan een belangeloze medewerker. Ad-hoccodering dient om reden van contaminatie vermeden te worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welke scoringsvormen kunnen onderscheiden worden ten aanzien van reacties op geprecodeerde items? Welke voor- en/of nadelen zijn aan elke vorm verbonden?

A

De voornaamste zorg bij de scoring van meerkeuzevragen betreft accuraatheid en efficiëntie. Men kan bij de scoring een keuze maken uit drie mogelijkheden:

  1. de handscoring, de zelfscoring en de machinale scoring. De handscoring is de meest bewerkelijke scoringsmethode. Bij grotere aantallen testformulieren neemt de tijdsduur en (de correctie van) het aantal fouten toe.
  2. De methode van zelfscoring leidt tot een aanzienlijk snellere en efficiëntere verwerking dan de methode van de handscoring. Omdat iedere onderzochte echter de beschikking dient te hebben over speciale scoringsformulieren, waarvan de corrector eenvoudig de markeringen kan overnemen, is het per situatie de vraag of de grotere efficiëntie opweegt tegen de hogere kosten voor het materiaal.
  3. De snelste methode van verwerking is de machinescoring. Hoe groter de schaal waarop getest wordt en hoe routinematiger de afname (CITO-toetsen en tentamens), hoe meer machinale scoring aangewezen is. De modernste scoringsvariant is die waarbij de testafname op de computer geschiedt en de onderzochte de antwoorden rechtstreeks in de computer invoert. Moderne computerprogrammatuur maakt het bovendien mogelijk de antwoorden onmiddellijk te coderen, een testscore te berekenen en de onderzochte feedback te verschaffen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welke kanttekeningen kunnen gemaakt worden bij het gebruik van formules voor toevalscorrectie?

A
  1. De formules houden geen rekening met het feit dat er vaak een vloeiende overgang bestaat tussen het wel en niet weten van het juiste antwoord op een vraag. Door partiële kennis kan dan ook een reële giskans groter of kleiner zijn dan de theoretische, blinde giskans.
  2. De formules houden ook geen rekening met het feit dat men een fout antwoord kan geven op basis van een verkeerd inzicht of onjuiste informatie, gevallen die niet gelijk zijn aan blind gissen.
  3. Voor toeval gecorrigeerde scores geven een grotere spreiding in scores te zien, waardoor ten onrechte zou kunnen worden geconcludeerd dat de effectiviteit van meten is toegenomen. De formules maken de scoring (onnodig) complex, waardoor de kans op fouten toeneemt.
  4. En, tot slot, de formules verbeteren de predictieve waarde van de testscore niet door de bijzondere relatie die bestaat tussen de ongecorrigeerde en de gecorrigeerde testscore.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Op welke vlakken doen zich mogelijkheden en problemen voor als gevolg van het gebruik van computers voor testafname en scoring?

A

De computer levert zowel op het technologische als het wetenschappelijke vlak een bijdrage aan de testpraktijk.

Technologische bijdragen liggen voornamelijk in de administratieve sfeer (afneming, opslag en administratie van items; administratie van testgegevens; rapportage).

Wetenschappelijke bijdragen liggen bijvoorbeeld in de facilitatie van het onderzoek naar individuele verschillen en de mogelijkheid tot adaptief testen (inhoudelijk-psychologische veranderingen; psychometrische veranderingen).

Problemen van computergebruik houden verband met het feit dat personen anders kunnen reageren op een conventionele schriftelijke testafname dan op een afname per computer. Normen behorend bij een conventionele test kunnen dus niet zonder meer worden overgenomen voor de computergestuurde testversie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wat zijn de voordelen van en de voorwaarden bij adaptief testen?

A

De voordelen van adaptief testen bestaan daarin dat
1. iedere respondent een test krijgt voorgelegd die op zijn of haar niveau is toegesneden;
2. de meting van de eigenschap van een persoon met grotere nauwkeurigheid plaatsvindt dan bij de klassieke wijze van testen;
3. de meetwaarden van verschillende personen met elkaar vergeleken kunnen worden ondanks dat zij tests van verschillend moeilijkheidsniveau hebben gemaakt.

Adaptief testen kan niet (efficiënt) plaatsvinden zonder een itembank waaruit de computer items kan selecteren van gevarieerde moeilijkheid. Een dergelijke itembank dient geheel te voldoen aan de eisen van de item-responstheorie. (Of voldaan wordt aan deze eisen dient dus eerst langs empirische weg vastgesteld te worden!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wat wordt bedoeld met ‘de ruwe score’?

A

De basisscore waarin in eerste instantie de testuitslag wordt uitgedrukt, noemen we de ruwe score (bijvoorbeeld aantal goed, aantal fout, aantal pogingen). De ruwe score is dus in ieder geval een eerste score die geen verdere bewerking heeft ondergaan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Welke 3 typen bewerkte scores kunnen onderscheiden worden?

A

Het eerste type bewerkte scores is gebaseerd op een vergelijking met een absolute standaard;

het tweede type is gebaseerd op een deling door leeftijd, schoolklas en dergelijke;

het derde type is gebaseerd op de relatieve positie in een vergelijkingsgroep.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Wat wordt onder een norm verstaan?

A

Onder een norm verstaan we een referentiekader voor de evaluatie van de ruwe scores, dat is gebaseerd op de kenmerken van de distributie van de ruwe scores in een populatie. Deze kenmerken worden geschat op basis van een representatieve steekproef.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Wanneer is het gewenst en wanneer onnodig om normen te berekenen?

A

Met het gebruik van normen worden de grenzen van de groep die men onderzoekt, doorbroken; de toevalligheden van de groep (qua niveau, qua spreiding) hebben geen invloed op de beoordeling van het individu, omdat in feite een vergelijking wordt getrokken van deze score met de scoreverdeling binnen de referentiegroep.

Het is onnodig normen te berekenen of te gebruiken indien men geïnteresseerd is in bijvoorbeeld de rangschikking van een persoon binnen de onderzochte groep of het percentage goede antwoorden dat men moet halen om zelfstandig te mogen werken. Is men voor onderzoeksdoeleinden geïnteresseerd in de samenhang tussen test- en criteriumscore, dan kan men zich beperken tot ruwe scores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Wanneer is vergelijking met een absolute standaard een minder aangewezen benadering?

A

Indien het de onderzoeker primair gaat om een vergelijking tussen onderzochten (oftewel het constateren van verschillen), dan is normering waarbij deze onderlinge verschillen worden gemaximaliseerd, meer aangewezen dan een vorm van absoluut meten.

30
Q

Welke kenmerken van IQ-scores zijn niet in overeenstemming met de eigenschappen van een verhoudingsnorm?

A

Bij verhoudingsnormen worden testscores gedeeld door een andere variabele (leeftijd, klasse) om de testscore als zodanig onafhankelijk te maken van de betreffende variabele. Dit is ook de bedoeling achter de IQ-scores. Bij het IQ blijkt het in de teller (ML) echter om het aantal goed gemaakte opgaven en niet om de mentale leeftijd te gaan; de noemer (CL) blijkt bij nadere beschouwing een normscore in plaats van de leeftijd van de proefpersoon; het IQ vertoont schommelingen omdat andere factoren dan intelligentie van invloed zijn op de relatieve positie die bijvoorbeeld kinderen innemen ten opzichte van leeftijdgenoten (niet constant). Wanneer de leeftijd hoger is dan de hoogste leeftijd waar beneden de test nog discrimineert, dan wordt bij de berekening van het IQ normaliter gedeeld door de topleeftijd (i.e. 15, 16 of 17 jaar). Tot slot wordt niet voldaan aan de eis van evenredig toenemende spreiding in scores met leeftijd.

31
Q

Beredeneer op p. 179 van het handboek, laatste alinea, de berekening van de percentielscores.

A

In eerste instantie lijkt het erop alsof er gegevens ontbreken. Dat is niet zo. De auteurs veronderstellen wel enige statistische voorkennis.

Een score van 62 of lager, is door 34% van de mensen behaald. Een score van 61 of lager heeft 28% van de mensen. Dat betekent dat 6% een score van 62 heeft (34% - 28% = 6%). 62 loopt eigenlijk van 61.5 tot 62.5, dus die 6% is verdeeld over deze range. Precies op de helft van die range ligt 62, dus op de helft van 6%. Het precieze percentiel dat dan bij 62 hoort, is gelijk aan 28 + 0.5 (34 - 28) = 31.

32
Q

Welke typen standaardscores worden besproken?

A

Er worden twee typen standaardscores besproken: standaardscores (z-scores) en genormaliseerde standaardscores (bijvoorbeeld t-scores, stanines, deviatie-IQ).

33
Q

Beredeneer het verschil tussen standaardscores en genormaliseerde standaardscores.

A

Standaardscores of z-scores zijn scores als gevolg van een lineaire transformatie van X. Een lineaire transformatie is er een van het soort
Y = aX + b).
z = X - Xgem / s –> X - Xgem = z maal s –> X = zs + Xgem.
Bij een lineaire transformatie blijft de scoreverdeling hetzelfde, dat wil zeggen: als X links-scheef was (veel hoge scores, weinig lage scores) dan is z dat ook.
Bij genormaliseerde standaardscores is er ook een transformatie van X naar z. De verdeling van de z-scores levert een normale verdeling op (de bekende klokvormige verdeling). Er zijn evenveel scores links als rechts van het gemiddelde.

34
Q

Wat is een voorbeeld van een nuttig coderingssysteem bij het scoren van reacties op items met open-vraagvorm?

A

Checklist, eventueel met een aanduiding van de frequentie

35
Q

In werkelijkheid gist iemand een geheel aantal keren goed, met kansen gegeven door de binomiale verdeling. Wat zegt deze verdeling?

A

Dit is de verdeling van het aantal successen in een reeks van onafhankelijke alterntaieven

36
Q

Hoeveel invloed heeft weging van items op de betrouwbaarheid en validiteit van items?

Wat zijn betere strategieën om de betrouwbaarheid en validiteit te vergroten? 2x

A

Weinig invloed.
Het differentieel wegen van items leidt dus niet of nauwelijks tot meer informatie over iemands niveau of een betere representatie van de te meten eigenschap.

Betrouwbaarheid: meer items in de test opnemen
Validiteit: beter nadenken over de inhoud van de items

37
Q

Wat is een belangrijke bijdrage van de computer aan de psychometrie ?

A

Adaptief testen, oftewel testen op maat

38
Q

Zijn adaptieve tests superieur aan standaardtests?

A

Ja

39
Q

Wat is een belangrijke eigenschap van metingen in de context van de item-responstheorie?

A

Dat zij gecorrigeerd kunnen worden voor het moeilijkheidsniveau van de test. Dat is de reden waarom de meetwaarden van verschillende personen kunnen worden vergeleken, ondanks het feit dat zij tests van uiteenlopend niveau hebben gemaakt.

40
Q

Wat is een voorwaarde om te kunnen spreken van testnormen?

A

Afhankelijkheid van de scores van anderen.
Sommige afhankelijke bewerkingen blijven beperkt to de toevallige groep waartoe de onderzochte behoort en ook dan is er nog geen sprake van normen.

41
Q

Wat houdt het gebruik van normen voor de beoordeling van een concrete testscore in?

A

Vergelijking van deze score met de scoreverdeling van de referentiepopulatie. De beoordeling van het individu vindt plaats tegen de populatie waartoe hij behoort, en niet van de groep die men toevallig onderzoekt en waarvan hij deel uitmaarkt.

42
Q

Wanneer is omzetting in bewerkte scores niet noodzakelijk?

A

Als men voor onderzoeksdoeleinden geïnteresseerd is in de samenhang tussen testscores en criteriumscores.

43
Q

De overgang van een vergelijking binnen een onderzochte groep naar het gebruik van normen is vloeiend. Naarmate de onderzochte groep groter is en meer de kenmerken van een relevante populatie weerspiegelt, krijgen de vergelijkingen meer het karakter van vergelijkingen
met een norm. Twee zaken zijn hier belangrijk. Welke 2?

A

Ten eerste is het van belang bij normeringsonderzoek de kenmerken van de onderzochte normgroep te vermelden, zodat afgeleid kan
worden of men te maken heeft met een geschikte normsteekproef.

Ten tweede dient men normen niet al te absoluut te zien. Met een verandering in de populatie veranderen ook de daarop gebaseerde normen, reden waarom een geregelde normrevisie vereist is.

44
Q

Wat houdt een vergelijking met een absolute standaard in?

A

Bij de vergelijking van een testscore met een absolute standaard wordt de prestatie beoordeeld zonder die van anderen hierbij te betrekken

45
Q

Wat is de maatstaaf bij een vergelijking met een absolute waarde?

A

De maatstaaf kan subjectief en arbitrair zijn, maar kan ook gebaseerd zijn op een grondige analyse van het te meten domein.

46
Q

Wat is de Nederlandse vertaling van criterion-referenced measurement?

A

Absoluut meten

47
Q

Wat is de Nederlandse vertaling van norm-referenced measurement?

A

Normatief meten

48
Q

In welk onderzoeksgebied heeft de absolute normering veel aandacht gekregen?

A

Onderwijskunde

In de onderwijskundige context wil men meestal beoordelen in welke mate leerlingen een bepaald doel hebben bereikt. Bij absolute normering is een analyse van de doelen van het proces dat men wil evalueren essentieel, evenals de vraag of de mate waarin die doelen zijn verwezenlijkt op een betrouwbare manier te meten valt. Is dit niet het geval, dan krijgt absoluut meten een sterk arbitrair karakter

Dit verschilt van: Van oudsher is het meten in de psychologie gericht geweest op het maximaliseren van verschillen tussen onderzochten, om zo een betrouwbare vergelijking mogelijk te maken.

49
Q

Wat zijn verhoudingsnormen?

Wat is een voorbeeld hiervan?

A

Ze hebben vooral een historische betekenis. Bij deze vorm van scorebewerking worden testscores gedeeld door een andere variabele en daardoor onafhankelijk gemaakt van
die variabele.

Het bekendste voorbeeld is het intelligentiequotiënt. Het IQ wordt berekend als het quotiënt van de door de test bepaalde ▌mentale leeftijd ML en de ▌chronologische leeftijd CL, en door vervolgens met 100 te vermenigvuldigen.

50
Q

Wat is de laatste leeftijd waarom nog geen fouten worden gemaakt bij de IQ test?

A

De basale leeftijd

51
Q

Hoe bereken je de mentale leeftijd bij de IQ est?

A

basale leeftijd + aantal goed beantwoorde opgaven/n.
n= aantal item

52
Q

Bij het IQ-begrip zijn enkele kritische kanttekeningen te maken. Welke 4?

A
  1. Formule om de IQ score te berekenen suggereert dat ML en CL vergelijkbare grootheden zijn. ML is strikt genomen geen leeftijdsmaat, maar een testscore op basis van het aantal goede antwoorden, terwijl CL de verwachte testprestatie is op basis van de gemiddelde score van leeftijdgenoten. Het gaat dus bij het IQ om een vergelijking met prestaties van anderen.
  2. Het IQ vertoont bij de ontwikkeling van de intelligentie nogal wat schommelingen. Testvragen zijn niet alleen van intelligentie, maar ook van vorming en scholing afhankelijk. Ook wordt de psychologische groei beïnvloed door allerlei factoren. Verder zijn wijzigingen in
    leermogelijkheden en motivatie verantwoordelijk voor belangrijke schommelingen.
  3. In normale gevallen blijft men bij het berekenen van het IQ, boven de hoogste leeftijd waar beneden de test nog discrimineert, steeds delen door de topleeftijd. Oudere mensen zijn daardoor in het nadeel, doordat in hun IQ-ratio de noemer gelijk en maximaal blijft.
  4. Niet veel tests voldoen aan de eis van een evenredig toenemende spreiding bij hogere leeftijden. Wanneer men deelt door een steeds grotere noemer (toenemende leeftijd), moet spreiding van de prestaties op hogere leeftijden steeds groter worden om de breuk constant te houden.

Aan het klassieke IQ-begrip kleven dus nogal wat bezwaren. In de moderne intelligentietests worden meestal andere bewerkte scores gebruikt.

53
Q

Wat is de eenvoudigste vorm van vergelijking van testprestaties tussen individuen?

Wat is hierbij de bewerkte score?

Leidt dit tot een norm?

A

Rangordening

Rangnummer.

Nee. Rangscores hebben, zonder kennis van de groepsgrootte en buiten de bewuste groep, geen betekenis.

54
Q

Wat is een percentiel bij rangorde?

A

Een percentiel is een van de 99 punten die een frequentieverdeling verdelen in 100 groepen van gelijke grootte. Een percentiel P is dat punt op de schaal waar beneden evenzoveel procent van de verdeling ligt.

55
Q

Wanneer wordt de percentielscore berekend dmv lineaire interpolatie bij rangorde?

A

Als een relatief grote groep van respondenten dezelfde ruwe score heeft en dus diverse percentielen beslaat.

56
Q

Waar zijn percentielscores van afhankelijk?

Waarvan zijn ze niet afhankelijk?

A

Het niveau, de spreiding en andere kenmerken van de groep.

Groepsgrootte.

57
Q

Wat is een percentiele norm?

A

Hierbij wordt een schatting gemaakt van de verdeling in de populatie. Hierbij staan de resultaten los van de groep.

58
Q

Waarom worden percentielscores veel gebruikt? 3x

A
  1. Eenvoudige berekening
  2. Makkelijk toepasbaar
  3. Inzichtelijk
59
Q

Wat zijn nadelen van percentielscores? 2x

A

De schaal is ordinaal, waardoor:
1. je geen gemiddelden en varianties kan berekenen. De relatie met andere variabelen dien je in een rangcorrelatie uit te drukken.
2. Het heeft geen zin om frequentieverdelingen van percentiele en ruwe scores te vergelijken.

60
Q

Wat zijn decielen?

A

Frequentieverdelingen in tien gelijke groepen.
Is verwant aan percentielen.

61
Q

Wat zijn vigintielen?

A

Frequentieverdelingen in twintig gelijke groepen.
Is verwant aan percentielen.

62
Q

Normaalverdeling.
De afstand tussen twee percentielen verder van het midden is, in ruwe scoreeenheden uitgedrukt, groter dan die van
twee percentielen dichter bij het midden. Waar is dit het gevolg van?

A

Dit is het gevolg van de minder sterkte concentratie van scores die ver van het midden van een normaalverdeling afliggen, in vergelijking tot de scores in de buurt van dit midden.

63
Q

Wat zijn standaardscores?

Wanneer gaat het om standaardnormen?

A

Ruwe scores die zijn omgerekend in standaarscore-eenheden.

Als het om een representatie van een populatie gaat.

64
Q

Welke bezwaren kennen standaardscores en -normen niet?

A
  • Ordinale schaal
  • Onverelijkbaarheid ruwe score-eenheden
  • Bezare nvan percentiele normen
65
Q

Wat wordt er gedaan om standaardscores of z-scores te krijgen?

A

Ruwe scores X worden uitgedrukt in het aantal standaarddeviaties S dat zij van het gemiddelde verwijderd liggen.

66
Q

Zijn z-scores automatisch normaal verdeeld?

A

Nee

67
Q

Omzetten in z-scores betekent 2 dingen. Welke?

A
  1. De verdeling van X wordt verschoven
  2. De afstand tussen de scores wordt met een constante factor veranderd.
68
Q

Wat zijn genormaliseerde standaardscores?

A

Genormaliseerde standaardscores worden verkregen uit niet-lineaire transformaties, die de
verdeling van X zodanig vervormen dat wel een normaalverdeling ontstaat. Bij genormaliseerde standaardscores vindt dus ook een transformatie van X naar z plaats. De constructie
van genormaliseerde standaardscores vindt plaats door uit te zoeken welke ruwe scores juist
die percentages markeren, die behoren bij de standaardscore-eenheden in een normaalverdeling. Deze ruwe scores worden dan omgezet in genormaliseerde standaardscores.

69
Q

Tot de categorie van genormaliseerde standaardscores behoren welke meest voorkomende vormen? 3x

A

▌T-scores: bij omzetting van ruwe scores X naar T-scores wordt een gemiddelde aangenomen van 50 en een spreiding van 10. De verdeling ligt praktisch tussen de 20 en 80, omdat in een
normaalverdeling maar 0.27% buiten de grenzen van drie standaarddeviaties valt. Veel tests zijn op deze wijze genormeerd.

▌Stanines: deze scorevorm gaat terug op het gebruik van papieren informatiedragers. Het woord is gevormd van ‘standard nine’. De stanines komen niet exact overeen met een bepaalde ruwe score, maar vertegenwoordigen een breedte van een halve standaarddeviatie. Het midden van de vijfde stanine komt overeen met het gemiddelde van de verdeling.

▌Deviatie-IQ: het gaat hier om standaardnormen met een gemiddelde van 100. In plaats van de oorspronkelijke vergelijking van ML en CL worden de testprestaties per leeftijdsklasse verwerkt tot genormaliseerde standaardscores. In diagnostisch onderzoek wordt dan de testprestatie van de proefpersoon geplaatst tegen de achtergrond van de tot diens leeftijd
behorende normaalverdeling.

70
Q

Bestudeer figuur pagina 42 van samenvatting!!

A

x

71
Q

Wat is test wiseness?

A

Test wiseness (TW) has been defined as the ability to respond advantageously to multiple-choice items containing extraneous clues and, therefore, to obtain credit without knowledge of the subject matter being tested