H9: Besliskunde Flashcards

Question 1

Q

De toegevoegde waarde van testresultaten op basis waarvan beslissingen worden genomen, is nauw verwant met het begrip….

Answer

A

incrementele validiteit

Question 2

Q

Door welke 3 kenmerken wordt een beslissing gekenmerkt?

Answer

A

het individu of de groep individuen waarop de beslissing betrekking heeft
de informatie waarop de beslissing wordt gebaseerd
antal ‘behandelingen’ (therapie, training, volgen van opleiding enzovoorts) waaraan men een individu kan toewijzen

Question 3

Q

Beslissingen worden veelal genomen op basis van bepaalde….

Answer

A

beslisregels

Question 4

Q

Het totaal aan beslissingsregels vormt een…

Answer

A

beslissingsstrategie

Question 5

Q

Welke taxonomieën van beslissingsstrategieën zijn er?

Answer

A

Enkelvoudige selectie - c.q. afwijzingsmodel
2.

Question 6

Q

Wat houdt de taxonomie “enkelvoudige selectie - c.q. afwijzingsmodel” in?

Answer

A

Dichotome beslissingen kunnen onderverdeeld worden in 4 categorieën op basis van:
1. Prestatie op de test (bijv. IQ score)
2. De daarop gebaseerde beslissing (bijv. wel/niet toewijzen huiswerkbegeleiding)
3. De werkelijke prestatie p het criterium (=criteriumprestatie; bijv. werkelijke intelligentie)

Categorie A positieve missers: dit zijn personen die laag scoren op de test, terwijl ze in werkelijkheid voldoende scoren op het criterium. De personen worden op basis van de test ten onrechte afgewezen/niet geselecteerd voor een baan, studie of een andere ‘behandeling’.
Categorie B positieve treffers: dit zijn personen die voldoende scoren op de test en ook in werkelijkheid een voldoende criteriumwaarde laten zien. Deze personen worden op basis van de testresultaten terecht geselecteerd voor een behandeling.
Categorie C negatieve treffers: dit zijn personen die onvoldoende scoren op de test en ook in werkelijkheid onvoldoende presteren op het criterium. De personen worden terecht afgewezen.
Categorie D negatieve missers: dit zijn personen die voldoende scoren op de test, maar in werkelijkheid onvoldoende presteren op het criterium. Ze worden ten onrechte geselecteerd voor een behandeling.

Question 7

Q

Wat is de criteriumprestatie?

Answer

A

Werkelijke prestatie op het criterium.

Question 8

Q

Wat is een kanttekening bij criteriumprestatie?

Answer

A

Het is goed te beseffen dat we soms geen echte scores hebben voor een criterium maar alleen een vaag beeld dat we kunnen beschrijven in termen van minder of meer, weinig of veel, slechter of beter. Denk bijvoorbeeld aan klachten, intelligentie, vaardigheden, stemming en diverse andere constructen die we met een test in kaart proberen te brengen maar niet direct kunnen meten.

Question 9

Q

Bij de 4 categorieen van “Enkelvoudig selectie- c.q. afwijzingsmodel” moeten welke 3 kanttekeningen worden geplaatst?

Answer

A

In de eerste plaats is er meettechnisch gesproken niet langer sprake van intervalschalen voor test en criterium, maar van nominale schalen.
In de praktijk zullen de categorieën A en C niet zichtbaar zijn. Individuen die tot deze categorieën behoren, worden op basis van de testscore namelijk afgewezen en voor hen zal informatie over het criterium veelal niet beschikbaar zijn.
De naamgeving voor de kwadranten kan anders zijn in de Engelstalige literatuur. De auteurs van het tekstboek schrijven dat positieve missers die bij de categorie A horen in de Engelstalige literatuur als false positives aangeduid worden. Dit is echter een typefout. In de medische testliteratuur en diverse psychometrische publicaties worden namelijk de volgende termen gebruikt voor de vier bovengenoemde situaties:

A (in het boek aangeduid als positieve missers): false negatives of onterecht negatieven. Iemand heeft, bijvoorbeeld, een bepaalde ziekte maar wordt niet als ziek herkend op basis van de test.
B (positieve treffers): true positives of terecht positieven. Iemand wordt op basis van de test terecht als ziek aangemerkt.
C (negatieve treffers): true negatives of terecht negatieven. Iemand wordt op basis van de test terecht als niet ziek aangemerkt.
D (negatieve missers): false positives of onterecht positieven. Iemand wordt op basis van de test onterecht als ziek aangemerkt (in werkelijkheid heeft hij/zij de ziekte niet).

Question 10

Q

In de medische testliteratuur en diverse psychometrische publicaties worden welke termen gebruikt voor de 4 kwadranten van “Enkelvoudig selectie- c.q. afwijzingsmodel”?

Answer

A

A (in het boek aangeduid als positieve missers): false negatives of onterecht negatieven. Iemand heeft, bijvoorbeeld, een bepaalde ziekte maar wordt niet als ziek herkend op basis van de test.
B (positieve treffers): true positives of terecht positieven. Iemand wordt op basis van de test terecht als ziek aangemerkt.
C (negatieve treffers): true negatives of terecht negatieven. Iemand wordt op basis van de test terecht als niet ziek aangemerkt.
D (negatieve missers): false positives of onterecht positieven. Iemand wordt op basis van de test onterecht als ziek aangemerkt (in werkelijkheid heeft hij/zij de ziekte niet).

Merk op dat in de medische testliteratuur de termen ‘positief’ en ‘negatief’ naar de testscores verwijzen (een positieve en negatieve testuitslag betekent dat iemand volgens de test de ziekte wel of niet heeft). Een false positive verwijst dus naar een positieve testuitslag terwijl de persoon in werkelijkheid niet ziek is. In het tekstboek verwijzen de termen ‘positief’ en ‘negatief’ daarentegen naar de criteriumprestatie (iemands conditie). Tot positieve missers behoren personen die wel ziek zijn maar door de test worden gemist.

Question 11

Q

Wat zijn kengetallen? 7x

Answer

A

Selectieratio
Succesratio
Sensitiviteit
Specificiteit
Positief predictieve waarde (PPW)
Negatief predictieve waarde (NPW)
Toevalskans

Question 12

Q

Wat is selectieratio?

Answer

A

het percentage aangenomen kandidaten: (B + D) / (A + B + C + D)

Question 13

Q

Wat is de toevalskans?

Answer

A

percentage van aangenomen kandidaten wanneer dit op toeval is gebaseerd: (A + B) / (A + B + C + D)

Question 14

Q

Wat is het succesratio?

Answer

A

het percentage toegelaten kandidaten met een voldoende score op het criterium, B / (B + D).

Question 15

Q

Wat is sensitiviteit?

Answer

A

De proportie van mensen met de ziekte/conditie die ook als zodanig zijn geïdentificeerd. In formulevorm gebaseerd op de kwadranten uit figuur 9.3 is dit gelijk aan B / (A + B).

Question 16

Q

Wat is specificiteit?

Answer

A

de proportie van mensen die niet de ziekte/conditie hebben en die ook als zodanig zijn geïdentificeerd. In de formulevorm is dit gelijk aan C / (C + D).

Question 17

Q

Wat is de positief predictieve waarde (PPW)?

Answer

A

De proportie van mensen met een positief testresultaat die daadwerkelijk de ziekte/conditie hebben. Dit is gelijk aan B / (B + D) ofwel de succesratio waar de auteurs van het tekstboek over spreken.

Question 18

Q

Wat is de negatief predictieve waarde?

Answer

A

de proportie van mensen met een negatief testresultaat die daadwerkelijk niet de ziekte/conditie hebben, C / (A + C).

Question 19

Q

Wat is een afkappunt?

Answer

A

Een afkappunt is de testscore die als grenswaarde wordt gehanteerd om te bepalen of de geteste persoon wel of niet behandeld moet worden.

Voor het bepalen van het optimale afkappunt kunnen bovengenoemde kengetallen helpen. Idealiter zou een test ten minste één optimaal afkappunt moeten hebben waarbij alle mensen met een testscore boven het afkappunt de conditie wel laten zien en alle mensen met een testscore lager dan of gelijk aan het afkappunt de conditie niet laten zien. Als we een meetschaal nemen voor het meten van depressieve symptomen dan zou dit optimale afkappunt alle depressieve en alle niet depressieve mensen van elkaar helpen te onderscheiden. Een dergelijk afkappunt zou de maximale sensitiviteit, specificiteit, PPW en NPW hebben.

Question 20

Q

Wat is de waarde van false negatives (A) bij het optimale afkappunt?

En van false positives (D)?

Question 21

Q

Omdat bij het meest optimale afkappunt, het aantal false negatives (A) en false positives (D) gelijk is aan 0, zullen de vier kengetallen steeds gelijk zijn aan….

Answer

A

1 (of 100 als dit in percentages wordt berekend).

In de formule van sensitiviteit staat bijvoorbeeld dat die gelijk is aan B / (A+B). Als A = 0, dan krijgen we B / (0 + B) = B / B = 1. Ook bij de specificiteit, de PPW en de NPW is makkelijk na te gaan dat ze 1 worden als D en A gelijk aan 0 zijn.

Question 22

Q

Voor de meeste tests of meetschalen bestaat een dergelijk optimaal afkappunt niet. Men zou dan een afkappunt moeten kiezen afhankelijk van het doel. Welke 3 doelen kunnen er zijn?

Answer

A

(1) uitsluiten van de conditie

(2) screenen voor de conditie

(3) insluiten van de conditie.

Question 23

Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: uitsluiten van conditie?

Answer

A

Afkappunt met de hoogste waarden van sensitiviteit + NPW.

Wanneer de conditie wordt uitgesloten wil de diagnosticus zeker weten dat de geteste persoon niet afwijkend scoort op het criterium, bijvoorbeeld niet depressief is. Dit kan bijvoorbeeld spelen als je zeker wilt weten dat iemand geen behandeling nodig heeft. Of als men een groep mensen wil selecteren waarvan met zekerheid gezegd kan worden dat ze gezond zijn. In dit geval is het aantal false negatives (A) extreem laag of gelijk aan 0, dus hebben sensitiviteit, B / (A + B), en de NPW, C / (A + C), de hoogste waarden. Hun som is daarbij maximaal. In werkelijkheid is het mogelijk dat A niet precies gelijk is aan 0. Men zoekt dan alsnog naar een afkappunt met een maximale som van sensitiviteit en de NPW..

Question 24

Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: screen voor de conditie?

Answer

A

Optimaal afkappunt afhankelijk van nadelen van foutieve beslissing.

Als het doel screenen voor de conditie is, dan probeert men het maximale uit de test te halen waarbij rekening wordt gehouden met de kosten van mogelijke fouten, zowel die van het missen van diegenen die wel de conditie hebben (positieve missers of false negatives) als die van het onterecht aanmerken van diegenen die de conditie niet hebben (negatieve missers of false positives). Met kosten worden zowel diverse voor- en nadelen voor de persoon zelf als financiële en maatschappelijke kosten bedoeld. Bij sommige ziektes is het bijvoorbeeld heel belangrijk dat zo veel mogelijk mensen gevonden worden die ziek zijn ongeacht de kosten van de screening. Denk bijvoorbeeld aan ziektes die zich snel kunnen verspreiden en tot dood of ernstige verminkingen kunnen leiden. Bij andere ziektes is het juist heel belangrijk om geen verkeerde diagnose te stellen vanwege ernstige bijwerkingen van de behandeling. Als een verkeerde diagnose tot amputatie van een been of arm zal leiden, is het natuurlijk heel belangrijk om een false positive te voorkomen.

Question 25

Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: insluiten van conditie?

Answer

A

Afkappunt met de hoogste waarden van specificiteit + PPW.

Bij het insluiten van de conditie wil de diagnosticus de eerder gestelde diagnose of een zeer sterk vermoeden dat iemand ziek is bevestigen. Als de score op een depressieschaal heel hoog is, dan is het vrij zeker dat er sprake is van een depressie. In dit geval is het aantal false positives (D) extreem laag of gelijk aan 0, dus hebben specificiteit, C / (C + D), en de PPW, B / (B + D) de hoogste waarden. Ook in dit geval zoekt men naar een afkappunt met een maximale som maar nu van specificiteit en de PPW.

Question 26

Q

Vaak heeft een bepaald afkappunt alleen een hoge sensitiviteit terwijl de specificiteit niet optimaal is. Of het is andersom: de specificiteit is hoog maar de sensitiviteit is niet optimaal.

Als het vooral belangrijk is om zo veel mogelijk terecht positieven (true positives) te selecteren (de kosten van false negatives zijn hoger dan de kosten van false positives) dan moet de sensitiviteit zo [laag/hoog] mogelijk zijn.

Men beweegt dan bij het kiezen van een afkappunt voor screeningsdoeleinden richting het ideale afkappunt voor het uitsluiten van de conditie met een maximale som van sensitiviteit en de NPW (figuur 1).

Question 27

Q

Als het vooral belangrijk is om zo veel mogelijk mensen te selecteren die terecht negatieven (true negatives) zijn dan moet vooral de XXX hoog zijn.

Answer

A

specificiteit

Dit is belangrijk wanneer de kosten van false positives hoger zijn dan van false negatives. Men kiest dan een afkappunt dat dichter ligt bij het ideale afkappunt voor het insluiten van de conditie waarbij de som van de specificiteit en PPW maximaal zijn.

Question 28

Q

Vaak wordt in de literatuur een afkappunt van een test geselecteerd waarbij de som van sensitiviteit en specificiteit maximaal zijn. Wanneer is dit afkappunt relevant?

Answer

A

Dit afkappunt is echter alleen relevant als de kosten van onterechte negatieven en de kosten van onterechte positieven gelijk zijn. In alle andere gevallen is het belangrijk om een ander afkappunt te kiezen. Het optimale afkappunt is dus afhankelijk van het gekozen doel en van de kosten die onjuiste beslissingen met zich meebrengen.

Question 29

Q

Om het optimale afkappunt te bepalen gegeven een bepaald doel is wat nodig?

Answer

A

Om voor alle mogelijke afkappunten de verschillende kengetallen, zoals sensitiviteit (SE), specificiteit (SP), NPW, PPW en likelihoodratios (LR’s; zie uitleg hieronder) te berekenen.

Bijv. De hoogste som van sensitiviteit en specificiteit in dit voorbeeld is bij score 7. Het afkappunt 6/7 of 7/8 (de keuze is afhankelijk van het doel, wel de conditie bevestigen of juist uitsluiten) zou derhalve gekozen kunnen worden als de kosten van false positives en van false negatives gelijk zijn. Mensen die 7 of hoger scoren, kunnen aangemerkt worden als diegenen met de conditie (ziekte of een ander criterium). Mensen die 7 of lager scoren, kunnen aangemerkt worden als diegenen die de conditie niet hebben.

Question 30

Q

In het boek wordt besproken waarom het belangrijk is om de grootte van de toevalskans zo nauwkeurig mogelijk te kennen. De toevalskans wordt bepaald door A + B te delen door het totale aantal geteste personen. Wat zijn 2 redenen?

Answer

A

Bij een hoge toevalskans kan zelfs een test met een hoge validiteit weinig bijdragen aan een verhoging van de succesratio, terwijl bij een lagere prevalentiewaarde ook een test met een betrekkelijk lage validiteit een zinvolle verbetering kan opleveren. Daarentegen is het ook belangrijk te beseffen dat bij zeer lage prevalentiecijfers het testen ook tot foutieve beslissingen kan leiden als validiteit niet perfect is (zie p. 411).
Daarnaast is het kennen van de toevalskans belangrijk voor het bepalen van het optimale afkappunt omdat de PPW en NPW van de toevalskans afhankelijk zijn.

Question 31

Q

Als we de NPW en de PPW bepaald hebben in een aselecte groep mensen die vrij goed de totale populatie vertegenwoordigt dan hopen we dat de toevalskans in deze groep gelijk is aan de toevalskans in de totale populatie. De toevalskans in de populatie wordt binnen de epidemiologie ook wel hoe genoemd?

Answer

A

prevalentie : het percentage van de bevolking dat op een specifiek moment een bepaalde ziekte (of een andere conditie) heeft.

Question 32

Q

Als de toevalskans of de prevalentie voor een specifieke studie onbekend is of als de PPW en de NPW onbekend of niet bruikbaar zijn, moeten we kijken naar andere kengetallen voor het bepalen van het optimale afkappunten. Welke twee likelihoodratio’s zijn niet afhankelijk van de prevalentie of de toevalskans?

Answer

A

positive Likelihood Ratio (LR+, de positieve aannemelijkheidsverhouding). Dit is de verhouding tussen de kans dat een persoon met een conditie (ziekte, een bepaalde criteriumscore) een positief testresultaat heeft en de kans dat een persoon zonder deze conditie (geen ziekte, een andere criteriumscore) een positief testresultaat heeft. In medische termen is de LR+ een maat voor de kracht waarmee de test bij positief resultaat de waarschijnlijkheid van de ziekte verhoogt. Dit wordt berekend als sensitiviteit / (1-specificiteit).
negative Likelihood Ratio (LR-, de negatieve aannemelijkheidsverhouding). Dit is de verhouding tussen de kans dat een persoon zonder een conditie een negatief testresultaat heeft en de kans dat een persoon met deze conditie een negatief testresultaat heeft. In het onderwijs kan de LR- bijv. als een maat gezien worden voor de kracht waarmee een test bij negatief resultaat de waarschijnlijkheid van de geschiktheid van de persoon voor een concrete studierichting vermindert. Dit wordt berekend als (1 - sensitiviteit) / specificiteit.

Question 33

Q

LR+ waarden hoger dan 10 worden als wat gezien?

Answer

A

Om een test te hebben die zo veel mogelijk mensen met een bepaalde conditie (bijvoorbeeld depressief) selecteert, zou de LR+ zo hoog mogelijk moeten zijn. Waarden hoger dan 10 worden als aanwijzing gezien van de conditie.

Question 34

Q

Waar wijst een LR- lager dan 0.1 op?

Answer

A

Om er zeker van te zijn dat de test accuraat is in het herkennen van diegenen die de conditie niet hebben (bijvoorbeeld niet depressief zijn) wil men een zo laag mogelijk LR- hebben. Een LR- lager dan 0.1 wijst sterk op afwezigheid van de conditie

Question 35

Q

Wanneer spreekt men van een intuïtieve of klinische voorspelling?

Answer

A

Wanneer testgegevens van diverse soort in het geding zijn (bijvoorbeeld scores op capaciteitentests en vragenlijsten naast meer of minder subjectieve indrukken op basis van interview en gedragsobservatie) en het criterium moeilijk operationaliseerbaar is (bijvoorbeeld het succes van psychotherapie), is de verleiding groot om te vertrouwen op de persoonlijke ervaring. Men combineert ‘in het hoofd’ de diverse soorten informatie tot een gewogen totaalscore en maakt op basis hiervan een schatting van de te verwachten criteriumuitkomst.

e gewichten kunnen per gediagnosticeerde persoon worden aangepast en zodoende zou men meer recht kunnen doen aan de uniciteit van het individu.

Question 36

Q

Wanneer is er sprake van een actuariële of statische voorspelling?

Answer

A

Een alternatieve benadering tov klinische voorspelling. komt neer op het negeren van de uniciteit van de onderzochte persoon door het gebruik van dezelfde gewichten voor alle personen. Deze gewichten dienen bij voorkeur op empirisch onderzoek te zijn gebaseerd en in een statistisch model (doorgaans het lineaire meervoudige regressiemodel) te passen; de gewichten zullen per test verschillen.

Question 37

Q

Wat heeft onderzoek aangetoond over statistische vs klinische voorspellingen?

Answer

A

itgebreid onderzoek heeft aangetoond dat klinische voorspellingen vrijwel altijd inferieur zijn aan statistische voorspellingen. Hiermee is uiteraard niet aangetoond dat het geen zin zou hebben rekening te houden met unieke kenmerken van de persoon, laat staan dat deze kenmerken niet zouden bestaan. Wel komt duidelijk naar voren dat het in het algemeen niet goed lukt met deze unieke eigenschappen rekening te houden bij het opstellen van een voorspelling.

Question 38

Q

Waarmee houdt de toegevoegde waarde van de test verband?

Answer

A

De vraag naar de toegevoegde waarde van de test kan niet los worden gezien van de vraag naar de waarde van de doelstelling van de beslissing die in een bepaalde context totstandkomt.

Question 39

Q

Welke externe factoren zijn van belang bij testgebruik?

Answer

A

Persoonlijkheidseigenschappen
Leefomstandigheden van de onderzochte persooN
Eisen van de werkgever
Aantal beschikbare sollicitanten

Question 40

Q

Als gevolg waarvan kunnen identieke testresultaten tot verschillende beslissingen leiden?

Answer

A

Als gevolg van verschillen in externe factoren kunnen identieke testresultaten tot verschillende beslissingen leiden.

Question 41

Q

Kan de waarde van een test die gebruikt wordt om beslissingen te nemen, uitgedrukt worden in een kwantitatieve maat?

Answer

A

Het is moeilijk zo niet onmogelijk de waarde van een test bij het totstandkomen van beslissingen in een kwantitatieve maat uit te drukken.

Question 42

Q

Noem drie aspecten die kenmerkend zijn voor een beslissing.

Answer

A

Een beslissing wordt gekenmerkt door drie aspecten, te weten:
1) het individu of de groep individuen waarop de beslissing betrekking heeft
2) de informatie waarop de beslissing wordt gebaseerd, en
3) het aantal ‘behandelingen’ waaraan men een individu kan toewijzen.

Question 43

Q

Wat kan onder behandeling worden verstaan?

Answer

A

Onder behandeling kan een vorm van psychotherapie of training worden verstaan, maar ook een schooltype of een bepaald soort werkzaamheden.

Question 44

Q

Waardoor kan toewijzing gekenmerkt worden?

Answer

A

Toewijzing kan een min of meer dwingend karakter hebben, maar ook de vrije keus van een individu zijn.

Question 45

Q

Op basis waarvan worden beslissingen genomen?

Answer

A

Beslissingen worden veelal genomen op basis van bepaalde beslisregels; het totaal aantal beslisregels vormt een beslissingsstrategie.

Question 46

Q

Welke aspecten staan centraal bij individuele beslissingen?

Answer

A

Bij individuele beslissingen staan wensen, capaciteiten en normen en waarden van het individu centraal bij het streven naar het nemen van een voor het individu zo bevredigend mogelijke beslissing. Uiteraard moet hierbij rekening worden gehouden met allerlei externe beperkingen van institutionele en maatschappelijke aard.

Question 47

Q

Wat staat centraal bij institutionele beslissingen?

Answer

A

Bij institutionele beslissingen wordt voor alle individuen een uniform patroon van eisen met betrekking tot capaciteiten en dergelijke aangehouden.

Question 48

Q

Waar wordt op gelet bij een tweede onderscheid tussen beslissingen?

Answer

A

Een tweede onderscheid tussen beslissingen heeft betrekking op de soort informatie waarop een beslissing is gebaseerd; deze kan univariaat of multivariaat zijn.

Question 49

Q

Geef een voorbeeld van univariate informatie.

Answer

A

Een voorbeeld van univariate informatie is intelligentie, geoperationaliseerd in het IQ. Een hoger IQ leidt tot een grotere kans op toelating tot een van de schooltypen in de volgorde mavo - havo - vwo. Impliciet wordt er dus van uitgegaan dat ook het criterium univariaat is.

Question 50

Q

Wanneer is sprake van multivariate informatie?

Answer

A

Van multivariate informatie is sprake wanneer verschillende soorten gegevens worden gebruikt voor het nemen van een beslissing. Gewoonlijk is ook het criterium multivariaat en heeft men te maken met differentiële predictie.

Question 51

Q

Geef een beschrijving van het enkelvoudige selectie- c.q. afwijzingsmodel.

Answer

A

Binnen het enkelvoudige selectie- c.q. afwijzingsmodel worden zowel de test- als de criteriumscores onderscheiden in voldoende en onvoldoende. Een juist inzicht in de waarde van een test voor het nemen van een beslissing kan alleen worden verkregen als duidelijk is wat de consequenties zijn als alle personen worden aangenomen.
De vier combinaties die binnen het model gemaakt kunnen worden, zijn: positieve missers, positieve treffers, negatieve treffers, negatieve missers.
a positieve missers; beslissingen waardoor personen die ondanks een onvoldoende testprestatie toch een voldoende criteriumscore behalen (onterecht afwijzen)
b positieve treffers; beslissingen waardoor personen zowel op de test als het criterium een voldoende resultaat behalen (terecht aannemen)
c negatieve treffers; beslissingen waardoor personen zowel op de test als het criterium een onvoldoende resultaat behalen (terecht afwijzen)
d negatieve missers; beslissingen waarbij personen een voldoende testresultaat combineren met een onvoldoende criteriumresultaat (onterecht aannemen).
De termen ‘positief’ en ‘negatief’ hebben betrekking op het criterium; de termen ‘missers’ en ‘treffers’ hebben betrekking op het al dan niet overeenstemmen van testprestatie en criteriumscore. Gedichotomiseerde test- en criteriumscores: een score uitgedrukt op een 10-puntsschaal, zoals een rapportcijfer, wordt bijvoorbeeld gedichotomiseerd door alles onder de 5.5 als onvoldoende te classificeren en alles vanaf 5.5 als voldoende. Bij een IQ-score worden bijvoorbeeld alle scores onder de 110 als onvoldoende en alle scores vanaf 110 als voldoende geclassificeerd.

Question 52

Q

Welke categorieën van vraag 14 zullen in de praktijk niet zichtbaar zijn?

Answer

A

In de praktijk zullen de categorieën A en C niet zichtbaar zijn, omdat men door de afwijzing op basis van de testprestatie geen criteriumscore meer kan leveren. Er kan wel onderzocht worden wat de uitkomsten – in termen van het testcriterium; bijvoorbeeld in een keer geslaagd voor het tentamen Testtheorie vs. niet in een keer geslaagd voor het tentamen Testtheorie – van een model zouden zijn geweest indien men personen met een bepaalde testscore (als ingangscriterium bijvoorbeeld een 8 of hoger voor Statistiek vs. lager dan een 8 voor Statistiek) had afgewezen en daarboven had aangenomen..

Question 53

Q

Wat houdt verantwoord testgebruik in?

Answer

A

Verantwoord testgebruik houdt onder meer in dat men zo nauwkeurig mogelijk weet welke grootte de categorieën A en C hebben. De ideale situatie is uiteraard dat de categorieën A en D niet voorkomen.

Question 54

Q

Wat zijn belangrijke begrippen binnen het selectiemodel/afwijzingsmodel??

Answer

A

Belangrijke begrippen binnen het selectiemodel/afwijzingsmodel zijn:
a de selectieratio; het percentage aangenomen kandidaten (B + D) / (A + B + C + D)
b de succesratio; het percentage toegelaten kandidaten met een voldoende score op het criterium (B / B + D). De grootte van de succesratio wordt bepaald door de validiteit van de test, de selectieratio en de toevalskans.
c de toevalskans is het percentage geschikte kandidaten dat verkregen zou worden als men geen test zou gebruiken, maar de kandidaten op basis van toevallige gronden zou selecteren.

Question 55

Q

Bij een selectie kunnen positieve missers (of false negatives/onterecht negatieven) veel schadelijker zijn dan negatieve missers (false positives/onterecht positieven). Geef een voorbeeld van een situatie waarin dit het geval is. Geef ook een voorbeeld van een situatie waarin het omgekeerde geldt.

Answer

A

Positieve missers zijn personen die ondanks een onvoldoende testscore een voldoende criteriumscore behalen. Gewoonlijk zijn deze personen niet zichtbaar, omdat zij worden afgewezen en dus niet in de gelegenheid zijn aan te tonen dat in hun geval een fout is gemaakt. Positieve missers zijn vooral schadelijk bij beslissingen waarin het belang van het individu vooropstaat. Ook bij institutionele beslissingen kan het van groot belang zijn, positieve missers te voorkomen, bijvoorbeeld wanneer het moeilijk is bepaalde vacatures te vervullen. Het voorkomen van negatieve missers (personen die een voldoende testscore koppelen aan een onvoldoende criteriumscore) is vooral van belang in gevallen waarin het institutionele belang vooropstaat. Een aansprekend voorbeeld is de selectie van F-16-piloten. De opleiding is zo kostbaar dat iedere negatieve misser een grote schadepost oplevert.

Question 56

Q

Noem enkele manieren waarop het aantal positieve missers (false negatives) kan worden verkleind. Idem: het aantal negatieve missers (false positives).

Answer

A

De beste remedie is het zodanig wijzigen van de testbatterij dat de validiteit verhoogd wordt. Wanneer dit niet mogelijk is, kan men de consequenties bestuderen van het verschuiven van de grens van de testscore. Uit figuur 9.3 is af te lezen dat het aantal positieve missers kleiner wordt als de grensscore lager is; bovendien neemt het aantal positieve treffers toe. De schaduwzijde bestaat uit een afname van het aantal negatieve treffers en een toename van het aantal negatieve missers. Een verhoging van de grensscore heeft het omgekeerde effect: meer positieve missers en minder positieve treffers. Daarnaast: meer negatieve treffers en minder negatieve missers. Het is duidelijk dat het schuiven met testgrenzen gecompliceerde gevolgen heeft. In hoofdstuk 10 wordt erop gewezen dat de psycholoog de rol van intermediair tussen instituties en individuen vervult. Hier blijkt voor welke dilemma’s de psycholoog kan komen te staan. De situatie kan verder worden gecompliceerd wanneer als gevolg van een veranderd toelatingsbeleid ook de grensscore voor het criterium gaat veranderen.

Question 57

Q

Waarom is het belangrijk de grootte van de toevalskans zo nauwkeurig mogelijk te kennen?

Answer

A

Het is belangrijk om de grootte van de toevalskans zo nauwkeurig mogelijk te kennen, omdat bij een hoge waarde ervan zelfs een test met een hoge validiteit weinig bijdraagt tot een verhoging van de succesratio. Bij een lage waarde van de toevalskans kan ook een test met een betrekkelijke lage validiteit een zinvolle verbetering opleveren.

Question 58

Q

Worden in de praktijk beslissingen genomen op grond van uitsluitend één test?

Answer

A

In de praktijk worden beslissingen gewoonlijk genomen op basis van scores op meerdere tests in plaats van op één test. De categorieën A tot en met D kunnen dan ook bepaald worden, hoewel dit al bij twee tests tamelijk ingewikkeld is. De vraag is ook hoe de scores van (meer dan) twee tests moeten worden gecombineerd. Wanneer de scores bij elkaar worden opgeteld tot een totaalscore die als basis voor beslissingen dient, is doorgaans een weging van scores wenselijk.

Question 59

Q

Wanneer spreekt men van een intuïtieve of klinische voorspelling?

Answer

A

Wanneer testgegevens van diverse soorten in het geding zijn en het criterium moeilijk operationaliseerbaar is, is de verleiding groot om te vertrouwen op de persoonlijke ervaring. Men combineert ‘in het hoofd’ de diverse soorten informatie tot een gewogen totaalscore en maakt op basis hiervan een schatting van de te verwachten criteriumuitkomst. Men spreekt in zo’n geval van een intuïtieve of klinische voorspelling.

Question 60

Q

Wat is het idee achter een intuïtieve of klinische voorspelling?

Answer

A

Het idee is dat in het geval van een intuïtieve of klinische voorspelling de gewichten per gediagnosticeerde persoon kunnen worden aangepast, waardoor meer recht gedaan zou worden aan de uniciteit van het individu.

Question 61

Q

Waar komt de alternatieve benadering op neer?

Answer

A

Een alternatieve benadering komt neer op het negeren van de uniciteit van de onderzochte persoon door het gebruik van dezelfde gewichten voor alle personen. Deze gewichten dienen bij voorkeur op empirisch onderzoek te zijn gebaseerd en in een statistisch model te passen (doorgaans het lineaire meervoudige regressiemodel). De gewichten zullen per test verschillen. In deze gevallen is sprake van een actuariële of statistische voorspelling.

Question 62

Q

Welke voorspelling geniet de voorkeur volgens onderzoek, de klinische of de statistische?

Answer

A

Uitgebreid onderzoek heeft aangetoond dat klinische voorspellingen altijd inferieur zijn aan statistische voorspellingen. Uiteraard is hiermee niet aangetoond dat het geen zin zou hebben rekening te houden met unieke kenmerken van de persoon, noch dat er geen sprake zou zijn van individuele kenmerken. In het algemeen lukt het niet goed om rekening te houden met unieke eigenschappen van een persoon bij het opstellen van een voorspelling.

Question 63

Q

Geef een voorbeeld van een compensatorisch model.

Answer

A

Het regressiemodel is een voorbeeld van een compensatorisch model. Lage scores op een bepaalde test kunnen worden gecompenseerd door hoge scores op een andere test. Alleen de hoogte van de gewogen totaalscore is van belang.

Question 64

Q

Wat verstaat men onder het conjunctieve model?

Answer

A

Behalve het compensatorisch model bestaat ook het conjunctieve model dat gekenmerkt wordt door het hanteren van een minimumscore alvorens de overige scores te gebruiken. In het conjunctieve model wordt een absolute meting gebruikt. Wanneer voor verscheidene tests een minimumscore wordt gebruikt, spreekt men van een veelvoudige minimumscore. Voor de selectie wordt de multiple cut-offprocedure gehanteerd.

Answer 63

A

Bij plaatsingsbeslissingen worden geen kandidaten afgewezen, maar wordt bijvoorbeeld bepaald in welk type brugklas iemand geplaatst wordt na het verlaten van de basisschool. Een ander voorbeeld is in welk onderdeel van de krijgsmacht een aankomend militair geplaatst wordt.

Answer 64

A

Omdat een kandidaat slechts een beperkte keuzevrijheid heeft, is het verschil tussen plaatsingsbeslissingen en selectiebeslissingen in sommige gevallen meer schijn dan werkelijkheid.

Answer 65

A

Bij kwantitatieve verschillen heeft de diagnostische informatie betrekking op een of meer variabelen die in een bepaalde sterkte aanwezig zijn (bijvoorbeeld intelligentie of neuroticisme).

Answer 66

A

Kwalitatieve verschillen hebben betrekking op de aard en niet de hoeveelheid (bijvoorbeeld de belangstelling voor een bepaalde studierichting).

Answer 67

A

Bij kwalitatieve verschillen is de differentiële predictie in het geding. De testinformatie is doorgaans multivariaat. Beslissingen worden doorgaans genomen op grond van profielen van testscores.

Answer 68

A

Centrale kenmerken van individuele beslissingen zijn de grote vrijheid van het individu bij het nemen van een beslissing en de per individu variërende interpretatie van verschillende soorten diagnostische informatie.

Answer 69

A

Het is mogelijk dat bij individuele beslissingen in zekere zin een groter beroep gedaan moet worden op de psycholoog dan bij institutionele beslissingen, omdat beslissingen niet volgens een min of meer vastliggende procedure totstandkomen. De taak van de psycholoog bestaat er vooral in, een cliënt zo veel mogelijk bewust te maken van diens capaciteiten, sterke en zwakke persoonlijkheidseigenschappen, normen- en waardepatroon, enzovoorts, zodat de cliënt in staat is een verantwoorde keuze uit de beschikbare mogelijkheden te maken.

Answer 70

A

Bij een vage vraagstelling (‘Karel gedraagt zich zo raar in de klas. Wat is er met hem aan de hand?’) zal de psycholoog een onderzoek met een grote ‘bandwijdte’ (bandwidth) instellen, waarin bijvoorbeeld een algemene intelligentietest, een persoonlijkheidsvragenlijst en een interview met Karel, zijn leerkracht en zijn ouders is opgenomen.

Answer 71

A

Bij een specifieke vraag (‘Is mevrouw Bell in staat telefoontjes van ontevreden klanten naar behoren te beantwoorden?’) zal de psycholoog tests gebruiken met een hoge zuiverheid (fidelity) voor bijvoorbeeld de persoonlijkheidseigenschappen stressbestendigheid, eerlijkheid en extraversie, en de capaciteiten luistervaardigheid en spreekvaardigheid.

Answer 72

A

door het wetenschappelijke belang
van de eigenschap die door de test wordt gemeten.

Answer 73

A

de verbetering in vergelijking met de situatie zonder test.

Answer 74

A

de correlatie in vergelijking met
het a-prioriniveau wordt verhoogd door toevoeging van testinformatie (er is dan sprake van
incremental validity).

Answer 75

A

het percentage geschikte personen in de populatie

Answer 76

A

Individu (of meerdere)
Twee of meer behandelingen waartussen men moet kiezen
Informatie die dient als basis voor de beslissing

Answer 77

A

Bij ▌individuele beslissingen wordt volledig gedacht vanuit het individu dat de beslissing moet nemen over waarvoor de beslissing geldt. De beslissing is eenmalig, en het
rendement van de beslissing varieert per individu.

Answer 78

A

Bij ▌institutionele beslissingen wordt een groot aantal gelijksoortige beslissingen genomen. Er is sprake van een voor alle beslissingen geldend systeem. Het totale rendement wordt bepaald door het gemiddelde rendement van de afzonderlijke beslissingen, en meestal is het de bedoeling dit rendement te maximaliseren.

Answer 79

A

De alternatieven kunnen kwantitatief van elkaar verschillen, maar wel in één dimensie
of in elkaars verlengde liggen. Omdat het uitsluitend om niveauverschil gaat, kan men
in principe dezelfde informatie gebruiken en volstaan met het variëren van de normen.
Informatie die op één dimensie kan worden geschaald, noemen we ▌univariaat.

Answer 80

A

De beslissingen worden genomen op basis van ▌multivariate informatie. De hiervoor benodigde testinformatie heeft ook een multivariaat karakter, en biedt de
mogelijkheid tot ▌differentiële voorspelling.

Answer 81

A

beslissingen waarbij het gaat om een keuze voor één enkel treatment, of
een keuze tussen verschillende alternatieven. Het gebruik van de univariate informatie is
in het eerste geval gericht op de tweedeling niet-wel, in het tweede geval op het indelen
in twee of meer klassen.

Answer 82

A

Van enkelvoudige selectie is sprake als individuen worden onderzocht met het oog op een
enkel criterium, waarbij er slechts twee mogelijkheden zijn. Het gaat hier om het klassieke
geschiktheidsonderzoek. Er wordt ook wel gesproken van een ▌afwijzingsmodel. Het gaat hier
om institutionele beslissingen, met gebruik van univariate informatie. Neemt men diverse
tests af, dan worden de scores wel gecombineerd tot een enkele predictorvariabele.

Answer 83

A

hoe hoog de correlatie met een criterium ten minste
moet zijn, wil de test een zinvolle functie hebben.

Answer 84

A

et percentage kandidaten dat wordt aangenomen:
𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑒𝑟𝑎𝑡𝑖𝑜 = (𝐵 + 𝐷) / (𝐴 + 𝐵 + 𝐶 + 𝐷)

Answer 85

A

het percentage
geschikte kandidaten wanneer men niet zou selecteren maar volgens toeval zou aannemen

Toevalskans = (A+B) /(A+B+C+D)

Answer 86

A

percentage succesvolle kandidaten binnen de aangenomen groep
Succesratio = B / (B +D)

Answer 87

A

De succesratio is afhankelijk van de correlatie van de test met het criterium, dus van de
validiteit. Hoe hoger de correlatie, hoe voller de kwadranten B en C en hoe leger A en D.
De succesratio wordt beïnvloed door de toevalskans. Stijging van A + B in verhouding tot
het totaal betekent immers ook stijging van de verhouding van B en B + D.
De succesratio wordt beïnvloed door de selectieratio. Hoe meer personen worden afgewezen, hoe groter de breuk B/(B + D) wordt.

Answer 88

A

Dat zelfs bij een psychologische selectie toch ongeschikte kandidaten worden aangenomen, hoeft niet aan de test te wijten te zijn. Het kan ook liggen aan de kwaliteit van het
aanbod of aan de geringe kwantiteit van het aanbod.
In het proces spelen ook oordelen een rol waarvoor noch de test, noch de testpsycholoog
verantwoordelijk is. Deze waardebepalingen behoren tot het beleid van de opdrachtgever,
want die bepaalt wat de kritische criteriumscore is. Hierbij spelen ook andere factoren een
rol, zoals de hoeveelheid kandidaten die moet worden aangenomen, en de succesratio
waarnaar men streeft.
Validiteit heeft niet steeds dezelfde waarde voor de beslissing. Als de toevalskans bijvoorbeeld dicht bij 1 ligt, heeft testen vrijwel geen zin, ook niet met een zeer valide test, omdat
de succesratio nog maar weinig kan worden verhoogd. Omgekeerd geldt dat als er maar
weinig geschikte kandidaten zijn, een test met een lage validiteit toch een grote bijdrage
kan leveren door veel ongeschikte kandidaten af te wijzen ten koste van slechts een klein
aantal ten onrechte afgewezen kandidaten.
Bij een hoge selectieratio is bij constant blijven van de toevalskans een veel hogere validiteit nodig om een bepaald effect te sorteren, dan wanneer een strenge selectie mogelijk
is en slechts een klein percentage hoeft te worden aangenomen.
Om de succesratio te kunnen bepalen bij een gegevens toevalskans, validiteit en selectieratio, of om een van die laatste drie factoren te kunnen bepalen, kunnen de tabellen van
Taylor en Russell worden gebruikt. Hun gedachtegang heeft verbreding gegeven aan de
evaluatie van de waarde van de test in selectiebeslissingen. Het is duidelijk dat de absolute
waarde van de validiteit van een test op zich weinig betekenis heeft. Ook met andere factoren, zoals toevalskans en selectieratio, moet rekening worden gehouden.
Een apart probleem vormt de relatie tussen positieve en negatieve missers. Verschuiving
van de aftestgrens naar rechts verhoogt de succesratio, maar ook het aantal positieve missers. Strengere selectie leidt ertoe dat meer kandidaten worden afgewezen die geschikt
zouden zijn gebleken. Het is een kwestie van beleid waar men de aftestgrens legt, afhankelijk van de gevolgen van het voorkomen van positieve danwel negatieve missers. Gesteld
kan worden dat een aftestgrens optimaal is als de daarbij behorende opbrengst of utiliteit
van de selectieprocedure maximaal is of, omgekeerd, als het verlies van de procedure minimaal is. Deze totale utiliteit is doorgaans afhankelijk van de utiliteiten van de afzonderlijke selectie-uitkomsten en van de kansen daarop binnen een populatie.
Een bijzonder probleem doet zich ook voor bij een zeer lage toevalskans, zoals vaak het
geval is in de klinische psychologie, waar de kans op een bepaalde abnormaliteit relatief
gering is. Een lage toevalskans heeft gevolgen voor de bijdrage van de test in het beslissingsproces. Het gebruik van tests met een matige validiteit kan het aantal foutieve
beslissingen zelfs vergroten.

Answer 89

A

De standaarddeviatie in de utiliteitsscores heeft betrekking op de vraag of een betere of
slechtere prestatie veel of weinig uitmaakt voor de organisatie. Als een geringe toename
in de prestatie van grote waarde is, zal de nuttigheid van het testonderzoek ook groot zijn.
De correlatie tussen test en utiliteit en tussen test en criterium is lineair gerelateerd aan
het nuttige effect van de test. Meestal zal er bij hen die een prestatie boven de kritische
criteriumscore leveren een toename in nuttigheid zijn bij een toenemende prestatie.
De selectieratio is van invloed op de utiliteit. Bij een gegeven aantal kandidaten is de nuttigheid van het onderzoek per persoon maximaal, als de ordinaat onder de normaalcurve
maximaal is. Dit is het geval bij een selectieratio van 0.50.
Bij een gegeven spreiding in criteriumscores, een gegeven validiteit en een gegeven selectieratio, kan men berekenen of de kosten van het testprogramma opwegen tegen het
uiteindelijke rendement van de procedure.

Answer 90

A

wel bij een gefixeerde selectieratio als bij
een gefixeerde succesratio kunnen de gewenste beslissingen worden bereikt via een statistisch proces van wegen van testscores en berekenen van succeskansen, of via een intuïtief
proces van weging en voorspelling. In deze controverse tussen ▌actuarische en ▌intuïtieve voorspelling is uit onderzoek gebleken dat de statistische methode superieur is. De actuarische verwerking leidt tot betere resultaten, dus tot minder foute beslissingen. Dit komt
doordat in een intuïtieve combinatie van objectieve gegevens allerlei vooroordelen, stereotypen en veronderstellingen een rol kunnen spelen

Answer 91

A

Sommige omstandigheden vereisen de procedure van de veelvoudige minimumscore (▌multiple cut-off procedure), waarbij voor iedere test afzonderlijk
een kritische score wordt vastgesteld. Deze testcombinatie heet ▌conjunctief, en die volgens
de gewogen samenstelling ▌compensatorisch. Ook een combinatie van beide methoden is
denkbaar. De mogelijkheid van compensatie is in veel gevallen realistisch, en levert bovendien
het voordeel dat extra informatie wordt verkregen, doordat de gewogen totaalscore ook de
mogelijkheid biedt tot verdere differentiatie binnen de groep geselecteerden. Soms is echter
de methode van veelvoudige minimumscore beter op zijn plaats

Answer 92

A

n de eerste fase kan het grote aantal mogelijkheden worden gereduceerd. Hiervoor is een test nodig die een groot aantal mogelijkheden tegelijk kan
bestrijken.

In de tweede fase kan worden beslist met betrekking tot het beperkte aantal mogelijkheden, of kan een veronderstelling als hypothese worden getoetst. Hiervoor is een meetinstrument nodig dat betrouwbaar meet en dat veel gerichter is

Answer 93

A

Ten eerste zijn een goede standaardisering en het gebruik
van een objectief verwerkingssysteem nodig. Ten tweede dient de test voldoende items te
bevatten. Ten derde moeten voor verschillende populaties specifieke normgegevens beschikbaar zijn. Ten vierde moeten beoordeelde kenmerken een plaats krijgen in een theorie over
een psychologisch construct. Door deze maatregelen nemen betrouwbaarheid en validiteit
van een test weliswaar toe, maar neemt de bandwijdte tegelijk sterk af.