TT5 Flashcards by Melissa Simson

Afnemen
Het doel van het afnemen van een test (waaronder ook een vragenlijst of een systematische observatie wordt verstaan) is een zo nauwkeurig mogelijke meting van een eigenschap van de
onderzochte persoon. Om dit doel te bereiken, is het noodzakelijk dat de test qua inhoud en
meettechnische eigenschappen aan hoge eisen voldoet. Op deze vereisten wordt in andere hoofdstukken ingegaan.
In dit hoofdstuk wordt de test als een gegeven geaccepteerd; voorwaarden voor een adequate
meting zijn:

de bereidheid tot medewerking van de onderzochte persoon en
het vermogen van de testleider, een duidelijke uitleg te geven en een goed ‘testklimaat’ te
scheppen.

How well did you know this?

Not at all

Perfectly

amenvattend: de testleider dient te zorgen voor een gestandaardiseerde testsituatie

How well did you know this?

Not at all

Perfectly

Tests met een vrije-antwoordenvorm worden handmatig gescoord.
De scoringscategorieën moeten:
- zo duidelijk mogelijk zijn gedefinieerd en
- door verschillende beoordelaars op dezelfde wijze worden geïnterpreteerd

How well did you know this?

Not at all

Perfectly

Tests met een meerkeuze-antwoordenvorm kunnen op drie manieren worden gescoord.
* In de eerste plaats wordt ook voor deze tests de handscoring genoemd. Deze scoringsvorm
bestaat doorgaans in het leggen van een sjabloon over het antwoordformulier, waarna de
verkregen scores op hetzelfde formulier of een apart scoreformulier worden genoteerd.
* Bij zelfscoring geeft de onderzochte persoon zijn antwoorden op een doordrukformulier, zodat de score van een antwoord op het onderliggende formulier direct zichtbaar is.
* Bij machinale scoring worden de antwoorden in de vorm van streepjes op een optisch leesbaar formulier gegeven. Het formulier wordt door een leesapparaat gelezen en door een
hieraan gekoppelde computer gescoord. Deze scoringsvorm is aantrekkelijk wanneer zeer
veel personen worden getest, zoals bij schoolvorderingentests,intelligentietests en multiplechoice-tentamens vaak het geval is

Bovendien is machinale scoring (voordelen):
- weinig arbeidsintensief en dus goedkoop en
- worden er geen scoringsfouten gemaakt.
Een nadeel is dat de formulieren: gevoelig zijn voor kleine afwijkingen van de gebruiksaanwijzing; hierdoor zijn zij minder geschikt voor jonge kinderen.

How well did you know this?

Not at all

Perfectly

Testen per computer
Behalve bij de scoring kan de computer ook een rol spelen bij de afname van de test. Wanneer
een zogenoemde itembank aanwezig is, kan de computer volgens een bepaald programma een
test samenstellen. In het geval van capaciteitentests kan men op basis van de gegeven antwoorden op enkele items beslissen op welk niveau de rest van de test wordt afgenomen (zogenoemd
adaptief testen). Vergeleken met een traditionele afname levert adaptief testen een aanzienlijke tijdsbesparing op

How well did you know this?

Not at all

Perfectly

Bewerkte scores en normen
In sommige gevallen beoogt men met een test een absolute meting te realiseren, dat wil zeggen
dat men het testresultaat alleen interpreteert als wel of niet voldoend aan een minimumnorm. Voorbeelden van een absolute meting zijn:
- vlot lezen en
- leesbaar schrijven.

How well did you know this?

Not at all

Perfectly

n de meeste onderzoeken wordt gewerkt met een normatieve meting (ook wel vergelijkende
meting genoemd); in deze onderzoeken is men geïnteresseerd in de plaats die een persoon inneemt in de scoreverdeling van de groep waarvan hij deel uitmaakt. Een gegeven antwoord
wordt gescoord als goed of fout of behorend tot een bepaalde scoringscategorie. Doorgaans
worden bij elkaar passende scores bij elkaar opgeteld tot een ruwe totaalscore.(Gewoonlijk wordt
met de score van een persoon de ruwe totaalscore bedoeld.) De (ruwe) score moet worden omgezet in een zogenoemde genormeerde score.
Er zijn vele soorten genormeerde scores in gebruik. Onderscheid wordt gemaakt tussen
* normscores die op een rangorde van de ruwe scores zijn gebaseerd, zoals percentielen
(percentiele scores)
* normscores die op het gemiddelde en de spreiding van de ruwe scores zijn gebaseerd,
zoals lineaire standaardscores (z-scores).

How well did you know this?

Not at all

Perfectly

persoon.
Percentielen zijn voor zowel leken als psychologen bruikbaar vanwege de ondubbelzinnige
interpretatie. Bij onderzoekers die enige kennis van statistiek hebben, zijn z-scores populair.
Een z-score geeft het aantal standaarddeviaties weer dat de oorspronkelijke score onder of
boven het gemiddelde ligt. Omdat veel scoreverdelingen min of meer normaal zijn, is een zscore gemakkelijk te koppelen aan het percentage personen dat lager scoort dan de betreffende
persoon; een z-score is in die gevallen even goed interpreteerbaar als een percentiel. Voor
communicatie met niet-statistisch geschoolden zijn z-scores minder geschikt, onder meer vanwege
het voorkomen van negatieve scores.

How well did you know this?

Not at all

Perfectly

Wanneer men genormeerde scores gebruikt, die de oorspronkelijke vorm van een verdeling veranderen in een normale vorm, spreekt men van genormaliseerde standaardscores. Een bekend
voorbeeld zijn IQ-scores (doorgaans worden WAIS-deviatie-IQ-scores bedoeld), die genormeerd
zijn op een gemiddelde van 100 en een standaarddeviatie van 15.

How well did you know this?

Not at all

Perfectly

Het bekendste voorbeeld van genormaliseerde percentielscores zijn stanines, een afkorting van
standard nine. Zoals de naam aangeeft, lopen stanines van1-9.
Gebruik van de stanine-schaal is aantrekkelijk, omdat;
- het aantal mogelijke scores beperkt is en
- omdat de associatie met de schaal van rapportcijfers voor de hand ligt.
Bedacht moet worden dat bij rapportcijfers het cijfer 6 voor een ‘voldoende’ en het gemiddelde staat, terwijl op de stanine-schaal 5 het gemiddelde is. Sommigen zijn van mening dat de
stanine-schaal te grof is, vooral in het midden van de verdeling.

How well did you know this?

Not at all

Perfectly

Open vragen
1.Met de standaardisatie kunnen zich de volgende 3 problemen voordoen:
** variatie in de testsituatie ( bv temperatuursverschillen, lawaai)
** variatie in de situatie waarin de onderzochte zich bevindt (motivatie, onbevangenheid)
** variatie in het gedrag van de proefleider (zakelijk, belangstellend, sekse, leeftijd)

How well did you know this?

Not at all

Perfectly

2.Standaardisatie is van belang als we iemands testprestatie kunnen en willen vergelijken met de
prestaties van anderen op dezelfde psychologische test. Indien niet is getest onder maximaal dezelfde testcondities en / of er voldoende of geen controle is uitgeoefend op de omstandigheden
waarin de proefpersoon getest is en / of benaderd wordt door de proefleider, zijn variaties in
testsituaties niet puur en alleen toe te schrijven aan de verschillen tussen de proefpersonen. Een
deel van de variatie zal toe te schrijven zijn aan de verschillen in testafname

How well did you know this?

Not at all

Perfectly

3.Schafer stelde voor om langs klinisch-intuïtieve weg de testsituatie (aard en verloop van de interactie tussen proefpersoon en proefleider) in de evaluatie (van de testresultaten) te verwerken.
Bezwaar van Drenth en Sijtsma tegen dit voorstel is dat hierbij subjectieve impressies en ideeën
van de psycholoog een rol zullen gaan spelen.
Indien men uit is op het genereren van hypothesen en / of het zoeken naar wegen voor verder onderzoek , is de methode aanvaardbaar en nuttig.
Wanneer men voorspellende of classificerende uitspraken wil doen, is het beter om te proberen
zoveel mogelijk vergelijkbaarheid en objectiviteit (bij de testafname) te bewaren.

How well did you know this?

Not at all

Perfectly

5.De voornaamste zorg bij de scoring van de keuze antwoordvorm betreft accuraatheid en efficientie.
3 mogelijkheden → handscoring, zelfscoring en machinale scoring.
Handscoring → meest bewerkelijke vorm, kost veel tijd en bij grote aantallen neemt het aantal
fouten bij de scoring toe.
Zelfscoring → hoge kosten i.v.m. de speciale scoringsformulieren
Machinale verwerking → snelste methode, de meest moderne variant is dat de proefpersoon de
antwoorden direct op de pc invult, moderne computerprogramma’s kunnen de antwoorden onmiddellijk coderen, een testscore berekenen en de onderzochte feedback geven.

How well did you know this?

Not at all

Perfectly

6.Kanttekeningen bij de correctieformules:
** de formules houden geen rekening met het feit dat er vaak een vloeiende overgang bestaat tussen het wel en niet weten van een antwoord op de vraag.
** door partiële kennis kan dan ook geen reële giskans kleiner of groter zijn dan de theoretisch
blinde gokkans
** de formules houden ook geen rekening met het feit dat men een fout antwoord kan geven op basis van een verkeerd inzicht of onjuiste informatie, gevallen die niet gelijk zijn aan blind gokken.
** voor toeval gecorrigeerde scores geven een grotere spreiding in scores te zien, waardoor ten
onrechte zou kunnen worden geconcludeerd dat de effectiviteit van meten is toegenomen.
** de formules maken de scoring onnodig complex, waardoor de kans op fouten toeneemt.
** de formules verbeteren de predictieve (voorspellende)waarde van de testscore niet door de
bijzondere relatie die bestaat tussen de ongecorrigeerde en de gecorrigeerde testscore.

How well did you know this?

Not at all

Perfectly

7.Technologische bijdragen m.b.t. computergebruik liggen voornamelijk in de administratieve
sfeer → afneming, opslag, administratie van items, administratie van testgegevens, rapportage.
Wetenschappelijke bijdragen liggen bijvoorbeeld in:
- de facilitatie (voorziening) van het onderzoek naar individuele verschillen en
- de mogelijkheid tot adaptief testen (inhoudelijk psychologische veranderingen; psychometrische veranderingen).
Normen van de conventionele tests kunnen niet zonder meer worden overgenomen voor de computergestuurde tests, mensen reageren anders op een pc dan op een schriftelijke test

How well did you know this?

Not at all

Perfectly

8.Voordelen adaptief testen:
** iedere respondent krijgt een test die op haar zijn niveau is toegesneden.
** de meting van de eigenschap van een persoon vindt met grotere nauwkeurigheid plaats
** de meetwaarden van verschillende personen kunnen met elkaar vergeleken worden ook al
maken zij tests van een verschillende moeilijkheidsniveau.

How well did you know this?

Not at all

Perfectly

8.Adaptief testen kan niet efficiënt plaatsvinden zonder een itembank waaruit de computer
items kan selecteren van gevarieerde moeilijkheid. Een dergelijke itembank dient geheel te voldoen aan de eisen van de item-respons theorie

How well did you know this?

Not at all

Perfectly

9.Ruwe score → de basis score die nog geen verdere bewerking heeft ondergaan.

How well did you know this?

Not at all

Perfectly

10.Bewerkte scores:
Type 1 is gebaseerd op een vergelijking met een absolute standaard.
Type 2 is gebaseerd op een deling door leeftijd, schoolklas e.d.
Type 3 is gebaseerd op de relatieve positie in een vergelijkingsgroep.

How well did you know this?

Not at all

Perfectly

11.Norm → referentiekader voor de evaluatie van ruwe scores, dat is gebaseerd op de kenmerken
van verdeling van de ruwe scores in de populatie. Deze kenmerken worden geschat op basis
van een representatieve steekproef.

How well did you know this?

Not at all

Perfectly

12.Met het gebruik van normen worden de grenzen van de groep die men onderzoekt, doorbroken;
de toevalligheden van de groep (qua niveau, spreiding) hebben geen invloed op de beoordeling
van het individu, omdat in feite een vergelijking wordt getrokken van deze score met de scoreverdeling binnen de referentiegroep.

13.Indien het de onderzoeker primair gaat om een vergelijking tussen onderzochten (constateren van verschillen) dan is normering waarbij deze onderlinge verschillen worden gemaximaliseerd, meer aangewezen dan een vorm van het absoluut meten.
Gaat het de onderzoeker om de samenhang tussen test en criteriumscore dan kan hij zich
beter beperken tot de ruwe scores.

14.Verhoudingsnormen → hierbij worden de testscores gedeeld door een andere variabele (leeftijd, klasse) om de testscore als zodanig onafhankelijk te maken van de betreffende variabele, bijv.
IQ.
- Bij het IQ blijkt het in de teller (ml) echter om een aantal goed gemaakte opgaven en niet
om de mentale leeftijd te gaan;
- de noemer (cl) blijkt bij nadere beschouwing een normscore i.p.v. de leeftijd van de proefpersoon;
- het IQ vertoont schommelingen omdat andere factoren dan intelligentie van invloed zijn op
de relatieve positie, die b.v. kinderen innemen t.o.v. leeftijdgenoten (niet constant);
- vanaf 15 jaar wordt niet meer gedeeld door de chronologische leeftijd van de respondent,
maar door de leeftijd van de hoogste normgroep (15 jarige)
- tot slot wordt niet voldaan aan de eis van evenredig toenemende spreiding in scores met
leeftij

15.Beredeneer op p.179 van het handboek, laatste alinea, de berekening van de percentielscores.
In eerste instantie lijkt het erop alsof er gegevens ontbreken. Dat is niet zo. De auteurs veronderstellen wel enige statistische voorkennis.
Score: 61, Cumulatief percentage = 28%; Score: 62, Cumulatief percentage = 34%
Een score van 62 of lager, is door 34% van de mensen behaald. Een score van 61 of lager heeft
28% van de mensen. Dat betekent dat 6% een score van 62 heeft (34% - 28% = 6%). 62 loopt eigenlijk van 61.5 tot 62.5, dus die 6% is verdeeld over deze range. Precies op de helft van die
range ligt 62, dus op de helft van 6%. Het precieze percentiel dat dan bij 62 hoort, is gelijk aan 28
+ 0.5(34-28) = 31

16.2 typen standaardscores: * lineaire standaardscores (z-scores) * genormaliseerde standaardscores (t-scores, stanines deviatie-IQ

Bij een lineaire transformatie blijft de scoreverdeling hetzelfde. D.w.z. als X links scheef was (veel hoge scores, weinig lage scores) dan is Z dat ook. Bij genormaliseerde standaardscores is er ook transformatie van X naar Z. De verdeling van de zscores levert een normale verdeling op (bekende klokvorm) (antwoord correctie; k= aantal vragen; A=antwoord alternatieven) (z-score)

Bij tests met vrije antwoordvorm doen zich gevaren van subjectiviteit en interbeoordelaar- betrouwbaarheid voor → daarom is een volledig, duidelijk en ondubbelzinnig coderingssysteem vereist.

Gaat het de onderzoeker om de samenhang tussen test en criteriumscore dan kan hij zich beter beperken tot de ruwe scores

Wat was het doel van testen bij de klassieke testtheorie? **Onderlinge verschillen tussen de onderzochten maximaliseren

Wat zijn de bezwaren bij IQ gebruik bij ouderen? **Op hogere leeftijden lopen de prestaties in vele intellectuele functies terug, oudere mensen zijn dus in het nadeel doordat in hun IQ ratio de noemer gelijk en maximaal blijft

Nadelen van percentiele scores ** we hebben te maken met een ordinale schaal dus men mag met percentiele scores geen deelbewerkingen uitvoeren. ** het heeft geen zin om de frequentieverdelingen en ruwe scores te vergelijken, want de frequentieverdelingen zijn gelijk en rechthoekig van vorm. ** de verschillen tussen percentielscores in relatie tot de ruwe scores worden rond de mediaan overschat en aan de uiteinden onderschat.

Gemiddelde en spreiding van T-score *Bij deze scores wordt een gemiddelde aangenomen van 50 en een spreiding van 10.

Wat is de meest eenvoudige vorm van normering? **Rangorde snelle beoordeling van prestatie? **Rangordescores en normen goed bruikbaar (niet ruwe scores

Itemresponstheorie **Niet dat met één item de meetwaarde van een persoon is vast te stellen, maar dat de mogelijkheid daarbij ontstaat dat er per computer adaptief getoetst kan worden. Beoordelaar weet testuitslag: er is sprake van contaminatie van het criterium

Welke interpretatie kan men geven aan een z-score **Een score die tot stand komt via lineaire transformatie waarbij het gemiddelde van de verdeling 50 wordt en de spreiding 10

Iets heeft een normale verdeling maar dat willen ze omzetten in een gelijke verdeling wat moet er dan gebeuren **naar percentielen

Met welke gegevens kun je percentielen berekenen? - Een tweestellingenvraag over het gemiddelde en standaarddeviatie van het WAIS-deviatie IQ (ligt niet op 50 en bedraagt ook geen 10 > dat zijn nl. T-scores) en - als tweede: bij een normaalverdeling liggen de meeste scores tussen 20 en 80 (is ook niet zo).

De scores in de WAIS zijn per leeftijd genormeerd met een gemiddelde van 100 en een spreiding van 15.

bij T scores vallen zijn de meeste mensen tussen 1 en 5, 10 en 20 of 40 en 50 **antw. is tussen 40 en 50 want daar is de normaalkromme het hoogst.

is intelligentie volgens Drenth altijd normaal verdeeld.

Decielen verdeeld in hoeveel gelijke groepen en vorm?* a 3 b 10 *

10 gelijke groepen en rechthoekig

stanines: ordinaal, interval of ratio? **

interval

Wat betekenen normtabellen; **dat iedereen afgezet wordt tegen de normgroep o.i.d

Wat is standaardisatie **testen in gelijke omstandigheden

Of normering bij experimenteel onderzoek noodzakelijk is

**nee

Wat is het principe van objectiviteit **onafhankelijk zijn van storende invloeden vanuit de persoon van de waarnemer, beoordelaar of interpretator

Twee stellingen. I. objectiviteit betekent dat de constructeur geen invloed heeft op de testscore. II bij een hoge interbeoordelaars correlatie zegt iets over de predictieve validiteit. **Beide stellingen zijn onjuist

Wanneer een testscore betrekking heeft op een zogenoemde absolute meting, wordt de score a genormeerd b niet genormeerd

niet genormeerd

Een aantal scores is normaal-verdeeld. Men wil deze scores zodanig transformeren dat het aantal personen tussen twee opeenvolgende getransformeerde scores over de gehele meetschaal gelijk is. De volgende getransformeerde scores voldoen aan deze eis: percentiele scores

Tussen welk paar z-scores is het percentage het grootst als de oorspronkelijk scores ongeveer normaal verdeeld zijn? -0.50 en 0.50

Een scoreverdeling is negatief-scheef. Wanneer de scores worden omgezet in percentielen, is het verschil tussen de scores die corresponderen met het 10e en 20e percentiel groter dan het verschil tussen de scores die corresponderen met het 80e en 90e percentie

Een proficiency test is gericht op vaardigheden buiten de directe cognitieve sfeer en kennis.

De waarde van het IQ-begrip werd lange tijd geacht te liggen in het constante karakter van het IQ. Het IQ vertoont bij de ontwikkeling van de intelligentie echter vele schommelingen. Waardoor worden deze schommelingen bepaald? Door wijzigingen in leermogelijkheden en motivatie en emotionele bereidheid om te leren en Psychologische groei wordt beinvloed door allerlei lichamelijke en fysiologische groeifactoren, die nogal wat variatie in sterkte en periodiciteit tussen kinderen kent