H9: Besliskunde Flashcards

1
Q

De toegevoegde waarde van testresultaten op basis waarvan beslissingen worden genomen, is nauw verwant met het begrip….

A

incrementele validiteit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Door welke 3 kenmerken wordt een beslissing gekenmerkt?

A
  1. het individu of de groep individuen waarop de beslissing betrekking heeft
  2. de informatie waarop de beslissing wordt gebaseerd
  3. antal ‘behandelingen’ (therapie, training, volgen van opleiding enzovoorts) waaraan men een individu kan toewijzen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Beslissingen worden veelal genomen op basis van bepaalde….

A

beslisregels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Het totaal aan beslissingsregels vormt een…

A

beslissingsstrategie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welke taxonomieën van beslissingsstrategieën zijn er?

A
  1. Enkelvoudige selectie - c.q. afwijzingsmodel
    2.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat houdt de taxonomie “enkelvoudige selectie - c.q. afwijzingsmodel” in?

A

Dichotome beslissingen kunnen onderverdeeld worden in 4 categorieën op basis van:
1. Prestatie op de test (bijv. IQ score)
2. De daarop gebaseerde beslissing (bijv. wel/niet toewijzen huiswerkbegeleiding)
3. De werkelijke prestatie p het criterium (=criteriumprestatie; bijv. werkelijke intelligentie)

  1. Categorie A positieve missers: dit zijn personen die laag scoren op de test, terwijl ze in werkelijkheid voldoende scoren op het criterium. De personen worden op basis van de test ten onrechte afgewezen/niet geselecteerd voor een baan, studie of een andere ‘behandeling’.
  2. Categorie B positieve treffers: dit zijn personen die voldoende scoren op de test en ook in werkelijkheid een voldoende criteriumwaarde laten zien. Deze personen worden op basis van de testresultaten terecht geselecteerd voor een behandeling.
  3. Categorie C negatieve treffers: dit zijn personen die onvoldoende scoren op de test en ook in werkelijkheid onvoldoende presteren op het criterium. De personen worden terecht afgewezen.
  4. Categorie D negatieve missers: dit zijn personen die voldoende scoren op de test, maar in werkelijkheid onvoldoende presteren op het criterium. Ze worden ten onrechte geselecteerd voor een behandeling.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is de criteriumprestatie?

A

Werkelijke prestatie op het criterium.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is een kanttekening bij criteriumprestatie?

A

Het is goed te beseffen dat we soms geen echte scores hebben voor een criterium maar alleen een vaag beeld dat we kunnen beschrijven in termen van minder of meer, weinig of veel, slechter of beter. Denk bijvoorbeeld aan klachten, intelligentie, vaardigheden, stemming en diverse andere constructen die we met een test in kaart proberen te brengen maar niet direct kunnen meten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Bij de 4 categorieen van “Enkelvoudig selectie- c.q. afwijzingsmodel” moeten welke 3 kanttekeningen worden geplaatst?

A
  1. In de eerste plaats is er meettechnisch gesproken niet langer sprake van intervalschalen voor test en criterium, maar van nominale schalen.
  2. In de praktijk zullen de categorieën A en C niet zichtbaar zijn. Individuen die tot deze categorieën behoren, worden op basis van de testscore namelijk afgewezen en voor hen zal informatie over het criterium veelal niet beschikbaar zijn.
  3. De naamgeving voor de kwadranten kan anders zijn in de Engelstalige literatuur. De auteurs van het tekstboek schrijven dat positieve missers die bij de categorie A horen in de Engelstalige literatuur als false positives aangeduid worden. Dit is echter een typefout. In de medische testliteratuur en diverse psychometrische publicaties worden namelijk de volgende termen gebruikt voor de vier bovengenoemde situaties:

A (in het boek aangeduid als positieve missers): false negatives of onterecht negatieven. Iemand heeft, bijvoorbeeld, een bepaalde ziekte maar wordt niet als ziek herkend op basis van de test.
B (positieve treffers): true positives of terecht positieven. Iemand wordt op basis van de test terecht als ziek aangemerkt.
C (negatieve treffers): true negatives of terecht negatieven. Iemand wordt op basis van de test terecht als niet ziek aangemerkt.
D (negatieve missers): false positives of onterecht positieven. Iemand wordt op basis van de test onterecht als ziek aangemerkt (in werkelijkheid heeft hij/zij de ziekte niet).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

In de medische testliteratuur en diverse psychometrische publicaties worden welke termen gebruikt voor de 4 kwadranten van “Enkelvoudig selectie- c.q. afwijzingsmodel”?

A

A (in het boek aangeduid als positieve missers): false negatives of onterecht negatieven. Iemand heeft, bijvoorbeeld, een bepaalde ziekte maar wordt niet als ziek herkend op basis van de test.
B (positieve treffers): true positives of terecht positieven. Iemand wordt op basis van de test terecht als ziek aangemerkt.
C (negatieve treffers): true negatives of terecht negatieven. Iemand wordt op basis van de test terecht als niet ziek aangemerkt.
D (negatieve missers): false positives of onterecht positieven. Iemand wordt op basis van de test onterecht als ziek aangemerkt (in werkelijkheid heeft hij/zij de ziekte niet).

Merk op dat in de medische testliteratuur de termen ‘positief’ en ‘negatief’ naar de testscores verwijzen (een positieve en negatieve testuitslag betekent dat iemand volgens de test de ziekte wel of niet heeft). Een false positive verwijst dus naar een positieve testuitslag terwijl de persoon in werkelijkheid niet ziek is. In het tekstboek verwijzen de termen ‘positief’ en ‘negatief’ daarentegen naar de criteriumprestatie (iemands conditie). Tot positieve missers behoren personen die wel ziek zijn maar door de test worden gemist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat zijn kengetallen? 7x

A
  1. Selectieratio
  2. Succesratio
  3. Sensitiviteit
  4. Specificiteit
  5. Positief predictieve waarde (PPW)
  6. Negatief predictieve waarde (NPW)
  7. Toevalskans
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is selectieratio?

A

het percentage aangenomen kandidaten: (B + D) / (A + B + C + D)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is de toevalskans?

A

percentage van aangenomen kandidaten wanneer dit op toeval is gebaseerd: (A + B) / (A + B + C + D)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is het succesratio?

A

het percentage toegelaten kandidaten met een voldoende score op het criterium, B / (B + D).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is sensitiviteit?

A

De proportie van mensen met de ziekte/conditie die ook als zodanig zijn geïdentificeerd. In formulevorm gebaseerd op de kwadranten uit figuur 9.3 is dit gelijk aan B / (A + B).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is specificiteit?

A

de proportie van mensen die niet de ziekte/conditie hebben en die ook als zodanig zijn geïdentificeerd. In de formulevorm is dit gelijk aan C / (C + D).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wat is de positief predictieve waarde (PPW)?

A

De proportie van mensen met een positief testresultaat die daadwerkelijk de ziekte/conditie hebben. Dit is gelijk aan B / (B + D) ofwel de succesratio waar de auteurs van het tekstboek over spreken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Wat is de negatief predictieve waarde?

A

de proportie van mensen met een negatief testresultaat die daadwerkelijk niet de ziekte/conditie hebben, C / (A + C).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wat is een afkappunt?

A

Een afkappunt is de testscore die als grenswaarde wordt gehanteerd om te bepalen of de geteste persoon wel of niet behandeld moet worden.

Voor het bepalen van het optimale afkappunt kunnen bovengenoemde kengetallen helpen. Idealiter zou een test ten minste één optimaal afkappunt moeten hebben waarbij alle mensen met een testscore boven het afkappunt de conditie wel laten zien en alle mensen met een testscore lager dan of gelijk aan het afkappunt de conditie niet laten zien. Als we een meetschaal nemen voor het meten van depressieve symptomen dan zou dit optimale afkappunt alle depressieve en alle niet depressieve mensen van elkaar helpen te onderscheiden. Een dergelijk afkappunt zou de maximale sensitiviteit, specificiteit, PPW en NPW hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wat is de waarde van false negatives (A) bij het optimale afkappunt?

En van false positives (D)?

A

0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Omdat bij het meest optimale afkappunt, het aantal false negatives (A) en false positives (D) gelijk is aan 0, zullen de vier kengetallen steeds gelijk zijn aan….

A

1 (of 100 als dit in percentages wordt berekend).

In de formule van sensitiviteit staat bijvoorbeeld dat die gelijk is aan B / (A+B). Als A = 0, dan krijgen we B / (0 + B) = B / B = 1. Ook bij de specificiteit, de PPW en de NPW is makkelijk na te gaan dat ze 1 worden als D en A gelijk aan 0 zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Voor de meeste tests of meetschalen bestaat een dergelijk optimaal afkappunt niet. Men zou dan een afkappunt moeten kiezen afhankelijk van het doel. Welke 3 doelen kunnen er zijn?

A

(1) uitsluiten van de conditie

(2) screenen voor de conditie

(3) insluiten van de conditie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: uitsluiten van conditie?

A

Afkappunt met de hoogste waarden van sensitiviteit + NPW.

Wanneer de conditie wordt uitgesloten wil de diagnosticus zeker weten dat de geteste persoon niet afwijkend scoort op het criterium, bijvoorbeeld niet depressief is. Dit kan bijvoorbeeld spelen als je zeker wilt weten dat iemand geen behandeling nodig heeft. Of als men een groep mensen wil selecteren waarvan met zekerheid gezegd kan worden dat ze gezond zijn. In dit geval is het aantal false negatives (A) extreem laag of gelijk aan 0, dus hebben sensitiviteit, B / (A + B), en de NPW, C / (A + C), de hoogste waarden. Hun som is daarbij maximaal. In werkelijkheid is het mogelijk dat A niet precies gelijk is aan 0. Men zoekt dan alsnog naar een afkappunt met een maximale som van sensitiviteit en de NPW..

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: screen voor de conditie?

A

Optimaal afkappunt afhankelijk van nadelen van foutieve beslissing.

Als het doel screenen voor de conditie is, dan probeert men het maximale uit de test te halen waarbij rekening wordt gehouden met de kosten van mogelijke fouten, zowel die van het missen van diegenen die wel de conditie hebben (positieve missers of false negatives) als die van het onterecht aanmerken van diegenen die de conditie niet hebben (negatieve missers of false positives). Met kosten worden zowel diverse voor- en nadelen voor de persoon zelf als financiële en maatschappelijke kosten bedoeld. Bij sommige ziektes is het bijvoorbeeld heel belangrijk dat zo veel mogelijk mensen gevonden worden die ziek zijn ongeacht de kosten van de screening. Denk bijvoorbeeld aan ziektes die zich snel kunnen verspreiden en tot dood of ernstige verminkingen kunnen leiden. Bij andere ziektes is het juist heel belangrijk om geen verkeerde diagnose te stellen vanwege ernstige bijwerkingen van de behandeling. Als een verkeerde diagnose tot amputatie van een been of arm zal leiden, is het natuurlijk heel belangrijk om een false positive te voorkomen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Welke benadering wordt gebruikt bij het bepalen van het afkappunt bij het doel: insluiten van conditie?

A

Afkappunt met de hoogste waarden van specificiteit + PPW.

Bij het insluiten van de conditie wil de diagnosticus de eerder gestelde diagnose of een zeer sterk vermoeden dat iemand ziek is bevestigen. Als de score op een depressieschaal heel hoog is, dan is het vrij zeker dat er sprake is van een depressie. In dit geval is het aantal false positives (D) extreem laag of gelijk aan 0, dus hebben specificiteit, C / (C + D), en de PPW, B / (B + D) de hoogste waarden. Ook in dit geval zoekt men naar een afkappunt met een maximale som maar nu van specificiteit en de PPW.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Vaak heeft een bepaald afkappunt alleen een hoge sensitiviteit terwijl de specificiteit niet optimaal is. Of het is andersom: de specificiteit is hoog maar de sensitiviteit is niet optimaal.

Als het vooral belangrijk is om zo veel mogelijk terecht positieven (true positives) te selecteren (de kosten van false negatives zijn hoger dan de kosten van false positives) dan moet de sensitiviteit zo [laag/hoog] mogelijk zijn.

Men beweegt dan bij het kiezen van een afkappunt voor screeningsdoeleinden richting het ideale afkappunt voor het uitsluiten van de conditie met een maximale som van sensitiviteit en de NPW (figuur 1).

A

hoog

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Als het vooral belangrijk is om zo veel mogelijk mensen te selecteren die terecht negatieven (true negatives) zijn dan moet vooral de XXX hoog zijn.

A

specificiteit

Dit is belangrijk wanneer de kosten van false positives hoger zijn dan van false negatives. Men kiest dan een afkappunt dat dichter ligt bij het ideale afkappunt voor het insluiten van de conditie waarbij de som van de specificiteit en PPW maximaal zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Vaak wordt in de literatuur een afkappunt van een test geselecteerd waarbij de som van sensitiviteit en specificiteit maximaal zijn. Wanneer is dit afkappunt relevant?

A

Dit afkappunt is echter alleen relevant als de kosten van onterechte negatieven en de kosten van onterechte positieven gelijk zijn. In alle andere gevallen is het belangrijk om een ander afkappunt te kiezen. Het optimale afkappunt is dus afhankelijk van het gekozen doel en van de kosten die onjuiste beslissingen met zich meebrengen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Om het optimale afkappunt te bepalen gegeven een bepaald doel is wat nodig?

A

Om voor alle mogelijke afkappunten de verschillende kengetallen, zoals sensitiviteit (SE), specificiteit (SP), NPW, PPW en likelihoodratios (LR’s; zie uitleg hieronder) te berekenen.

Bijv. De hoogste som van sensitiviteit en specificiteit in dit voorbeeld is bij score 7. Het afkappunt 6/7 of 7/8 (de keuze is afhankelijk van het doel, wel de conditie bevestigen of juist uitsluiten) zou derhalve gekozen kunnen worden als de kosten van false positives en van false negatives gelijk zijn. Mensen die 7 of hoger scoren, kunnen aangemerkt worden als diegenen met de conditie (ziekte of een ander criterium). Mensen die 7 of lager scoren, kunnen aangemerkt worden als diegenen die de conditie niet hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

In het boek wordt besproken waarom het belangrijk is om de grootte van de toevalskans zo nauwkeurig mogelijk te kennen. De toevalskans wordt bepaald door A + B te delen door het totale aantal geteste personen. Wat zijn 2 redenen?

A
  1. Bij een hoge toevalskans kan zelfs een test met een hoge validiteit weinig bijdragen aan een verhoging van de succesratio, terwijl bij een lagere prevalentiewaarde ook een test met een betrekkelijk lage validiteit een zinvolle verbetering kan opleveren. Daarentegen is het ook belangrijk te beseffen dat bij zeer lage prevalentiecijfers het testen ook tot foutieve beslissingen kan leiden als validiteit niet perfect is (zie p. 411).
  2. Daarnaast is het kennen van de toevalskans belangrijk voor het bepalen van het optimale afkappunt omdat de PPW en NPW van de toevalskans afhankelijk zijn.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Als we de NPW en de PPW bepaald hebben in een aselecte groep mensen die vrij goed de totale populatie vertegenwoordigt dan hopen we dat de toevalskans in deze groep gelijk is aan de toevalskans in de totale populatie. De toevalskans in de populatie wordt binnen de epidemiologie ook wel hoe genoemd?

A

prevalentie : het percentage van de bevolking dat op een specifiek moment een bepaalde ziekte (of een andere conditie) heeft.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Als de toevalskans of de prevalentie voor een specifieke studie onbekend is of als de PPW en de NPW onbekend of niet bruikbaar zijn, moeten we kijken naar andere kengetallen voor het bepalen van het optimale afkappunten. Welke twee likelihoodratio’s zijn niet afhankelijk van de prevalentie of de toevalskans?

A
  1. positive Likelihood Ratio (LR+, de positieve aannemelijkheidsverhouding). Dit is de verhouding tussen de kans dat een persoon met een conditie (ziekte, een bepaalde criteriumscore) een positief testresultaat heeft en de kans dat een persoon zonder deze conditie (geen ziekte, een andere criteriumscore) een positief testresultaat heeft. In medische termen is de LR+ een maat voor de kracht waarmee de test bij positief resultaat de waarschijnlijkheid van de ziekte verhoogt. Dit wordt berekend als sensitiviteit / (1-specificiteit).
  2. negative Likelihood Ratio (LR-, de negatieve aannemelijkheidsverhouding). Dit is de verhouding tussen de kans dat een persoon zonder een conditie een negatief testresultaat heeft en de kans dat een persoon met deze conditie een negatief testresultaat heeft. In het onderwijs kan de LR- bijv. als een maat gezien worden voor de kracht waarmee een test bij negatief resultaat de waarschijnlijkheid van de geschiktheid van de persoon voor een concrete studierichting vermindert. Dit wordt berekend als (1 - sensitiviteit) / specificiteit.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

LR+ waarden hoger dan 10 worden als wat gezien?

A

Om een test te hebben die zo veel mogelijk mensen met een bepaalde conditie (bijvoorbeeld depressief) selecteert, zou de LR+ zo hoog mogelijk moeten zijn. Waarden hoger dan 10 worden als aanwijzing gezien van de conditie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Waar wijst een LR- lager dan 0.1 op?

A

Om er zeker van te zijn dat de test accuraat is in het herkennen van diegenen die de conditie niet hebben (bijvoorbeeld niet depressief zijn) wil men een zo laag mogelijk LR- hebben. Een LR- lager dan 0.1 wijst sterk op afwezigheid van de conditie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Wanneer spreekt men van een intuïtieve of klinische voorspelling?

A

Wanneer testgegevens van diverse soort in het geding zijn (bijvoorbeeld scores op capaciteitentests en vragenlijsten naast meer of minder subjectieve indrukken op basis van interview en gedragsobservatie) en het criterium moeilijk operationaliseerbaar is (bijvoorbeeld het succes van psychotherapie), is de verleiding groot om te vertrouwen op de persoonlijke ervaring. Men combineert ‘in het hoofd’ de diverse soorten informatie tot een gewogen totaalscore en maakt op basis hiervan een schatting van de te verwachten criteriumuitkomst.

e gewichten kunnen per gediagnosticeerde persoon worden aangepast en zodoende zou men meer recht kunnen doen aan de uniciteit van het individu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Wanneer is er sprake van een actuariële of statische voorspelling?

A

Een alternatieve benadering tov klinische voorspelling. komt neer op het negeren van de uniciteit van de onderzochte persoon door het gebruik van dezelfde gewichten voor alle personen. Deze gewichten dienen bij voorkeur op empirisch onderzoek te zijn gebaseerd en in een statistisch model (doorgaans het lineaire meervoudige regressiemodel) te passen; de gewichten zullen per test verschillen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Wat heeft onderzoek aangetoond over statistische vs klinische voorspellingen?

A

itgebreid onderzoek heeft aangetoond dat klinische voorspellingen vrijwel altijd inferieur zijn aan statistische voorspellingen. Hiermee is uiteraard niet aangetoond dat het geen zin zou hebben rekening te houden met unieke kenmerken van de persoon, laat staan dat deze kenmerken niet zouden bestaan. Wel komt duidelijk naar voren dat het in het algemeen niet goed lukt met deze unieke eigenschappen rekening te houden bij het opstellen van een voorspelling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Waarmee houdt de toegevoegde waarde van de test verband?

A

De vraag naar de toegevoegde waarde van de test kan niet los worden gezien van de vraag naar de waarde van de doelstelling van de beslissing die in een bepaalde context totstandkomt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Welke externe factoren zijn van belang bij testgebruik?

A
  1. Persoonlijkheidseigenschappen
  2. Leefomstandigheden van de onderzochte persooN
  3. Eisen van de werkgever
  4. Aantal beschikbare sollicitanten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Als gevolg waarvan kunnen identieke testresultaten tot verschillende beslissingen leiden?

A

Als gevolg van verschillen in externe factoren kunnen identieke testresultaten tot verschillende beslissingen leiden.

41
Q

Kan de waarde van een test die gebruikt wordt om beslissingen te nemen, uitgedrukt worden in een kwantitatieve maat?

A

Het is moeilijk zo niet onmogelijk de waarde van een test bij het totstandkomen van beslissingen in een kwantitatieve maat uit te drukken.

42
Q

Noem drie aspecten die kenmerkend zijn voor een beslissing.

A

Een beslissing wordt gekenmerkt door drie aspecten, te weten:
1) het individu of de groep individuen waarop de beslissing betrekking heeft
2) de informatie waarop de beslissing wordt gebaseerd, en
3) het aantal ‘behandelingen’ waaraan men een individu kan toewijzen.

43
Q

Wat kan onder behandeling worden verstaan?

A

Onder behandeling kan een vorm van psychotherapie of training worden verstaan, maar ook een schooltype of een bepaald soort werkzaamheden.

44
Q

Waardoor kan toewijzing gekenmerkt worden?

A

Toewijzing kan een min of meer dwingend karakter hebben, maar ook de vrije keus van een individu zijn.

45
Q

Op basis waarvan worden beslissingen genomen?

A

Beslissingen worden veelal genomen op basis van bepaalde beslisregels; het totaal aantal beslisregels vormt een beslissingsstrategie.

46
Q

Welke aspecten staan centraal bij individuele beslissingen?

A

Bij individuele beslissingen staan wensen, capaciteiten en normen en waarden van het individu centraal bij het streven naar het nemen van een voor het individu zo bevredigend mogelijke beslissing. Uiteraard moet hierbij rekening worden gehouden met allerlei externe beperkingen van institutionele en maatschappelijke aard.

47
Q

Wat staat centraal bij institutionele beslissingen?

A

Bij institutionele beslissingen wordt voor alle individuen een uniform patroon van eisen met betrekking tot capaciteiten en dergelijke aangehouden.

48
Q

Waar wordt op gelet bij een tweede onderscheid tussen beslissingen?

A

Een tweede onderscheid tussen beslissingen heeft betrekking op de soort informatie waarop een beslissing is gebaseerd; deze kan univariaat of multivariaat zijn.

49
Q

Geef een voorbeeld van univariate informatie.

A

Een voorbeeld van univariate informatie is intelligentie, geoperationaliseerd in het IQ. Een hoger IQ leidt tot een grotere kans op toelating tot een van de schooltypen in de volgorde mavo - havo - vwo. Impliciet wordt er dus van uitgegaan dat ook het criterium univariaat is.

50
Q

Wanneer is sprake van multivariate informatie?

A

Van multivariate informatie is sprake wanneer verschillende soorten gegevens worden gebruikt voor het nemen van een beslissing. Gewoonlijk is ook het criterium multivariaat en heeft men te maken met differentiële predictie.

51
Q

Geef een beschrijving van het enkelvoudige selectie- c.q. afwijzingsmodel.

A

Binnen het enkelvoudige selectie- c.q. afwijzingsmodel worden zowel de test- als de criteriumscores onderscheiden in voldoende en onvoldoende. Een juist inzicht in de waarde van een test voor het nemen van een beslissing kan alleen worden verkregen als duidelijk is wat de consequenties zijn als alle personen worden aangenomen.
De vier combinaties die binnen het model gemaakt kunnen worden, zijn: positieve missers, positieve treffers, negatieve treffers, negatieve missers.
a positieve missers; beslissingen waardoor personen die ondanks een onvoldoende testprestatie toch een voldoende criteriumscore behalen (onterecht afwijzen)
b positieve treffers; beslissingen waardoor personen zowel op de test als het criterium een voldoende resultaat behalen (terecht aannemen)
c negatieve treffers; beslissingen waardoor personen zowel op de test als het criterium een onvoldoende resultaat behalen (terecht afwijzen)
d negatieve missers; beslissingen waarbij personen een voldoende testresultaat combineren met een onvoldoende criteriumresultaat (onterecht aannemen).
De termen ‘positief’ en ‘negatief’ hebben betrekking op het criterium; de termen ‘missers’ en ‘treffers’ hebben betrekking op het al dan niet overeenstemmen van testprestatie en criteriumscore. Gedichotomiseerde test- en criteriumscores: een score uitgedrukt op een 10-puntsschaal, zoals een rapportcijfer, wordt bijvoorbeeld gedichotomiseerd door alles onder de 5.5 als onvoldoende te classificeren en alles vanaf 5.5 als voldoende. Bij een IQ-score worden bijvoorbeeld alle scores onder de 110 als onvoldoende en alle scores vanaf 110 als voldoende geclassificeerd.

52
Q

Welke categorieën van vraag 14 zullen in de praktijk niet zichtbaar zijn?

A

In de praktijk zullen de categorieën A en C niet zichtbaar zijn, omdat men door de afwijzing op basis van de testprestatie geen criteriumscore meer kan leveren. Er kan wel onderzocht worden wat de uitkomsten – in termen van het testcriterium; bijvoorbeeld in een keer geslaagd voor het tentamen Testtheorie vs. niet in een keer geslaagd voor het tentamen Testtheorie – van een model zouden zijn geweest indien men personen met een bepaalde testscore (als ingangscriterium bijvoorbeeld een 8 of hoger voor Statistiek vs. lager dan een 8 voor Statistiek) had afgewezen en daarboven had aangenomen..

53
Q

Wat houdt verantwoord testgebruik in?

A

Verantwoord testgebruik houdt onder meer in dat men zo nauwkeurig mogelijk weet welke grootte de categorieën A en C hebben. De ideale situatie is uiteraard dat de categorieën A en D niet voorkomen.

54
Q

Wat zijn belangrijke begrippen binnen het selectiemodel/afwijzingsmodel??

A

Belangrijke begrippen binnen het selectiemodel/afwijzingsmodel zijn:
a de selectieratio; het percentage aangenomen kandidaten (B + D) / (A + B + C + D)
b de succesratio; het percentage toegelaten kandidaten met een voldoende score op het criterium (B / B + D). De grootte van de succesratio wordt bepaald door de validiteit van de test, de selectieratio en de toevalskans.
c de toevalskans is het percentage geschikte kandidaten dat verkregen zou worden als men geen test zou gebruiken, maar de kandidaten op basis van toevallige gronden zou selecteren.

55
Q

Bij een selectie kunnen positieve missers (of false negatives/onterecht negatieven) veel schadelijker zijn dan negatieve missers (false positives/onterecht positieven). Geef een voorbeeld van een situatie waarin dit het geval is. Geef ook een voorbeeld van een situatie waarin het omgekeerde geldt.

A

Positieve missers zijn personen die ondanks een onvoldoende testscore een voldoende criteriumscore behalen. Gewoonlijk zijn deze personen niet zichtbaar, omdat zij worden afgewezen en dus niet in de gelegenheid zijn aan te tonen dat in hun geval een fout is gemaakt. Positieve missers zijn vooral schadelijk bij beslissingen waarin het belang van het individu vooropstaat. Ook bij institutionele beslissingen kan het van groot belang zijn, positieve missers te voorkomen, bijvoorbeeld wanneer het moeilijk is bepaalde vacatures te vervullen. Het voorkomen van negatieve missers (personen die een voldoende testscore koppelen aan een onvoldoende criteriumscore) is vooral van belang in gevallen waarin het institutionele belang vooropstaat. Een aansprekend voorbeeld is de selectie van F-16-piloten. De opleiding is zo kostbaar dat iedere negatieve misser een grote schadepost oplevert.

56
Q

Noem enkele manieren waarop het aantal positieve missers (false negatives) kan worden verkleind. Idem: het aantal negatieve missers (false positives).

A

De beste remedie is het zodanig wijzigen van de testbatterij dat de validiteit verhoogd wordt. Wanneer dit niet mogelijk is, kan men de consequenties bestuderen van het verschuiven van de grens van de testscore. Uit figuur 9.3 is af te lezen dat het aantal positieve missers kleiner wordt als de grensscore lager is; bovendien neemt het aantal positieve treffers toe. De schaduwzijde bestaat uit een afname van het aantal negatieve treffers en een toename van het aantal negatieve missers. Een verhoging van de grensscore heeft het omgekeerde effect: meer positieve missers en minder positieve treffers. Daarnaast: meer negatieve treffers en minder negatieve missers. Het is duidelijk dat het schuiven met testgrenzen gecompliceerde gevolgen heeft. In hoofdstuk 10 wordt erop gewezen dat de psycholoog de rol van intermediair tussen instituties en individuen vervult. Hier blijkt voor welke dilemma’s de psycholoog kan komen te staan. De situatie kan verder worden gecompliceerd wanneer als gevolg van een veranderd toelatingsbeleid ook de grensscore voor het criterium gaat veranderen.

57
Q

Waarom is het belangrijk de grootte van de toevalskans zo nauwkeurig mogelijk te kennen?

A

Het is belangrijk om de grootte van de toevalskans zo nauwkeurig mogelijk te kennen, omdat bij een hoge waarde ervan zelfs een test met een hoge validiteit weinig bijdraagt tot een verhoging van de succesratio. Bij een lage waarde van de toevalskans kan ook een test met een betrekkelijke lage validiteit een zinvolle verbetering opleveren.

58
Q

Worden in de praktijk beslissingen genomen op grond van uitsluitend één test?

A

In de praktijk worden beslissingen gewoonlijk genomen op basis van scores op meerdere tests in plaats van op één test. De categorieën A tot en met D kunnen dan ook bepaald worden, hoewel dit al bij twee tests tamelijk ingewikkeld is. De vraag is ook hoe de scores van (meer dan) twee tests moeten worden gecombineerd. Wanneer de scores bij elkaar worden opgeteld tot een totaalscore die als basis voor beslissingen dient, is doorgaans een weging van scores wenselijk.

59
Q

Wanneer spreekt men van een intuïtieve of klinische voorspelling?

A

Wanneer testgegevens van diverse soorten in het geding zijn en het criterium moeilijk operationaliseerbaar is, is de verleiding groot om te vertrouwen op de persoonlijke ervaring. Men combineert ‘in het hoofd’ de diverse soorten informatie tot een gewogen totaalscore en maakt op basis hiervan een schatting van de te verwachten criteriumuitkomst. Men spreekt in zo’n geval van een intuïtieve of klinische voorspelling.

60
Q

Wat is het idee achter een intuïtieve of klinische voorspelling?

A

Het idee is dat in het geval van een intuïtieve of klinische voorspelling de gewichten per gediagnosticeerde persoon kunnen worden aangepast, waardoor meer recht gedaan zou worden aan de uniciteit van het individu.

61
Q

Waar komt de alternatieve benadering op neer?

A

Een alternatieve benadering komt neer op het negeren van de uniciteit van de onderzochte persoon door het gebruik van dezelfde gewichten voor alle personen. Deze gewichten dienen bij voorkeur op empirisch onderzoek te zijn gebaseerd en in een statistisch model te passen (doorgaans het lineaire meervoudige regressiemodel). De gewichten zullen per test verschillen. In deze gevallen is sprake van een actuariële of statistische voorspelling.

62
Q

Welke voorspelling geniet de voorkeur volgens onderzoek, de klinische of de statistische?

A

Uitgebreid onderzoek heeft aangetoond dat klinische voorspellingen altijd inferieur zijn aan statistische voorspellingen. Uiteraard is hiermee niet aangetoond dat het geen zin zou hebben rekening te houden met unieke kenmerken van de persoon, noch dat er geen sprake zou zijn van individuele kenmerken. In het algemeen lukt het niet goed om rekening te houden met unieke eigenschappen van een persoon bij het opstellen van een voorspelling.

63
Q

Geef een voorbeeld van een compensatorisch model.

A

Het regressiemodel is een voorbeeld van een compensatorisch model. Lage scores op een bepaalde test kunnen worden gecompenseerd door hoge scores op een andere test. Alleen de hoogte van de gewogen totaalscore is van belang.

64
Q

Wat verstaat men onder het conjunctieve model?

A

Behalve het compensatorisch model bestaat ook het conjunctieve model dat gekenmerkt wordt door het hanteren van een minimumscore alvorens de overige scores te gebruiken. In het conjunctieve model wordt een absolute meting gebruikt. Wanneer voor verscheidene tests een minimumscore wordt gebruikt, spreekt men van een veelvoudige minimumscore. Voor de selectie wordt de multiple cut-offprocedure gehanteerd.

65
Q

Wat wordt bepaald bij plaatsingsbeslissingen?

A

Bij plaatsingsbeslissingen worden geen kandidaten afgewezen, maar wordt bijvoorbeeld bepaald in welk type brugklas iemand geplaatst wordt na het verlaten van de basisschool. Een ander voorbeeld is in welk onderdeel van de krijgsmacht een aankomend militair geplaatst wordt.

66
Q

Wat kan men zeggen over het verschil tussen plaatsingsbeslissingen en selectiebeslissingen?

A

Omdat een kandidaat slechts een beperkte keuzevrijheid heeft, is het verschil tussen plaatsingsbeslissingen en selectiebeslissingen in sommige gevallen meer schijn dan werkelijkheid.

67
Q

Waarop heeft de diagnostische informatie betrekking bij kwantitatieve verschillen?

A

Bij kwantitatieve verschillen heeft de diagnostische informatie betrekking op een of meer variabelen die in een bepaalde sterkte aanwezig zijn (bijvoorbeeld intelligentie of neuroticisme).

68
Q

Waarop heeft de diagnostische informatie betrekking bij kwalitatieve verschillen?

A

Kwalitatieve verschillen hebben betrekking op de aard en niet de hoeveelheid (bijvoorbeeld de belangstelling voor een bepaalde studierichting).

69
Q

Wat kan er gezegd worden van differentiële predictie bij kwalitatieve verschillen?

A

Bij kwalitatieve verschillen is de differentiële predictie in het geding. De testinformatie is doorgaans multivariaat. Beslissingen worden doorgaans genomen op grond van profielen van testscores.

70
Q

Wat zijn belangrijke kenmerken van individuele beslissingen?

A

Centrale kenmerken van individuele beslissingen zijn de grote vrijheid van het individu bij het nemen van een beslissing en de per individu variërende interpretatie van verschillende soorten diagnostische informatie.

71
Q

Leg uit waarom bij individuele beslissingen in zekere zin een groter beroep op de psycholoog moet worden gedaan dan bij institutionele beslissingen?

A

Het is mogelijk dat bij individuele beslissingen in zekere zin een groter beroep gedaan moet worden op de psycholoog dan bij institutionele beslissingen, omdat beslissingen niet volgens een min of meer vastliggende procedure totstandkomen. De taak van de psycholoog bestaat er vooral in, een cliënt zo veel mogelijk bewust te maken van diens capaciteiten, sterke en zwakke persoonlijkheidseigenschappen, normen- en waardepatroon, enzovoorts, zodat de cliënt in staat is een verantwoorde keuze uit de beschikbare mogelijkheden te maken.

72
Q

Wat voor onderzoek is raadzaam bij een vage vraagstelling, zoals ‘Karel gedraagt zich zo raar in de klas, wat is er met hem aan de hand?’

A

Bij een vage vraagstelling (‘Karel gedraagt zich zo raar in de klas. Wat is er met hem aan de hand?’) zal de psycholoog een onderzoek met een grote ‘bandwijdte’ (bandwidth) instellen, waarin bijvoorbeeld een algemene intelligentietest, een persoonlijkheidsvragenlijst en een interview met Karel, zijn leerkracht en zijn ouders is opgenomen.

73
Q

Wat voor soort test zal gebruikt worden bij een specifieke vraag, zoals ‘Is mevrouw Bell in staat telefoontjes van ontevreden klanten naar behoren te beantwoorden?’

A

Bij een specifieke vraag (‘Is mevrouw Bell in staat telefoontjes van ontevreden klanten naar behoren te beantwoorden?’) zal de psycholoog tests gebruiken met een hoge zuiverheid (fidelity) voor bijvoorbeeld de persoonlijkheidseigenschappen stressbestendigheid, eerlijkheid en extraversie, en de capaciteiten luistervaardigheid en spreekvaardigheid.

74
Q

Waar wordt de wetenschappelijke waarde van een test door bepaald?

A

door het wetenschappelijke belang
van de eigenschap die door de test wordt gemeten.

75
Q

Wat is in algemene zin de bijdrage van een test?

A

de verbetering in vergelijking met de situatie zonder test.

76
Q

Voor het bepalen van de bijdrage van een test mag men dus niet louter afgaan op de correlatie
met het criterium, maar dient men na te gaan in welke mate….

A

de correlatie in vergelijking met
het a-prioriniveau wordt verhoogd door toevoeging van testinformatie (er is dan sprake van
incremental validity).

77
Q

Wat is de antecedent probability of base rate?

A

het percentage geschikte personen in de populatie

78
Q

Een beslissing over mensen bevat altijd drie elementen. Welke 3?

A
  1. Individu (of meerdere)
  2. Twee of meer behandelingen waartussen men moet kiezen
  3. Informatie die dient als basis voor de beslissing
79
Q

Wat zijn individuele beslissingen?

A

Bij ▌individuele beslissingen wordt volledig gedacht vanuit het individu dat de beslissing moet nemen over waarvoor de beslissing geldt. De beslissing is eenmalig, en het
rendement van de beslissing varieert per individu.

80
Q

Wat zijn institutionele beslissingen?

A

Bij ▌institutionele beslissingen wordt een groot aantal gelijksoortige beslissingen genomen. Er is sprake van een voor alle beslissingen geldend systeem. Het totale rendement wordt bepaald door het gemiddelde rendement van de afzonderlijke beslissingen, en meestal is het de bedoeling dit rendement te maximaliseren.

81
Q

Wat betekent het als alternatieven kwantitatief van elkaar verschillen?

A

De alternatieven kunnen kwantitatief van elkaar verschillen, maar wel in één dimensie
of in elkaars verlengde liggen. Omdat het uitsluitend om niveauverschil gaat, kan men
in principe dezelfde informatie gebruiken en volstaan met het variëren van de normen.
Informatie die op één dimensie kan worden geschaald, noemen we ▌univariaat.

82
Q

Wat betekent het als alternatieven kwalitatief van elkaar verschillen?

A

De beslissingen worden genomen op basis van ▌multivariate informatie. De hiervoor benodigde testinformatie heeft ook een multivariaat karakter, en biedt de
mogelijkheid tot ▌differentiële voorspelling.

83
Q

Binnen de beslissingen op basis van univariate informatie kunnen we verder onderscheid
maken tussen….

A

beslissingen waarbij het gaat om een keuze voor één enkel treatment, of
een keuze tussen verschillende alternatieven. Het gebruik van de univariate informatie is
in het eerste geval gericht op de tweedeling niet-wel, in het tweede geval op het indelen
in twee of meer klassen.

84
Q

Wat houdt enkelvoudige selectie oftewel het afwijzingsmodel in?

A

Van enkelvoudige selectie is sprake als individuen worden onderzocht met het oog op een
enkel criterium, waarbij er slechts twee mogelijkheden zijn. Het gaat hier om het klassieke
geschiktheidsonderzoek. Er wordt ook wel gesproken van een ▌afwijzingsmodel. Het gaat hier
om institutionele beslissingen, met gebruik van univariate informatie. Neemt men diverse
tests af, dan worden de scores wel gecombineerd tot een enkele predictorvariabele.

85
Q

Wat is de eerste vraag bij het afwijzingsmodel?

A

hoe hoog de correlatie met een criterium ten minste
moet zijn, wil de test een zinvolle functie hebben.

86
Q

Wat is het selectieratio?

A

et percentage kandidaten dat wordt aangenomen:
𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑒𝑟𝑎𝑡𝑖𝑜 = (𝐵 + 𝐷) / (𝐴 + 𝐵 + 𝐶 + 𝐷)

87
Q

Wat is de ▌antecedent probability of ▌base rate, ook wel toevalskans?

A

het percentage
geschikte kandidaten wanneer men niet zou selecteren maar volgens toeval zou aannemen

Toevalskans = (A+B) /(A+B+C+D)

88
Q

Wat is het succesratio?

A

percentage succesvolle kandidaten binnen de aangenomen groep
Succesratio = B / (B +D)

89
Q

Waar is de succesratio van afhankelijk? 3x

A
  1. De succesratio is afhankelijk van de correlatie van de test met het criterium, dus van de
    validiteit. Hoe hoger de correlatie, hoe voller de kwadranten B en C en hoe leger A en D.
  2. De succesratio wordt beïnvloed door de toevalskans. Stijging van A + B in verhouding tot
    het totaal betekent immers ook stijging van de verhouding van B en B + D.
  3. De succesratio wordt beïnvloed door de selectieratio. Hoe meer personen worden afgewezen, hoe groter de breuk B/(B + D) wordt.
90
Q

Voor de praktijk van het beslissen en voor de evaluatie van de bijdrage van de test hebben de
genoemde relaties enkele belangrijke repercussies. Welke 6?

A
  1. Dat zelfs bij een psychologische selectie toch ongeschikte kandidaten worden aangenomen, hoeft niet aan de test te wijten te zijn. Het kan ook liggen aan de kwaliteit van het
    aanbod of aan de geringe kwantiteit van het aanbod.
  2. In het proces spelen ook oordelen een rol waarvoor noch de test, noch de testpsycholoog
    verantwoordelijk is. Deze waardebepalingen behoren tot het beleid van de opdrachtgever,
    want die bepaalt wat de kritische criteriumscore is. Hierbij spelen ook andere factoren een
    rol, zoals de hoeveelheid kandidaten die moet worden aangenomen, en de succesratio
    waarnaar men streeft.
  3. Validiteit heeft niet steeds dezelfde waarde voor de beslissing. Als de toevalskans bijvoorbeeld dicht bij 1 ligt, heeft testen vrijwel geen zin, ook niet met een zeer valide test, omdat
    de succesratio nog maar weinig kan worden verhoogd. Omgekeerd geldt dat als er maar
    weinig geschikte kandidaten zijn, een test met een lage validiteit toch een grote bijdrage
    kan leveren door veel ongeschikte kandidaten af te wijzen ten koste van slechts een klein
    aantal ten onrechte afgewezen kandidaten.
  4. Bij een hoge selectieratio is bij constant blijven van de toevalskans een veel hogere validiteit nodig om een bepaald effect te sorteren, dan wanneer een strenge selectie mogelijk
    is en slechts een klein percentage hoeft te worden aangenomen.
    Om de succesratio te kunnen bepalen bij een gegevens toevalskans, validiteit en selectieratio, of om een van die laatste drie factoren te kunnen bepalen, kunnen de tabellen van
    Taylor en Russell worden gebruikt. Hun gedachtegang heeft verbreding gegeven aan de
    evaluatie van de waarde van de test in selectiebeslissingen. Het is duidelijk dat de absolute
    waarde van de validiteit van een test op zich weinig betekenis heeft. Ook met andere factoren, zoals toevalskans en selectieratio, moet rekening worden gehouden.
  5. Een apart probleem vormt de relatie tussen positieve en negatieve missers. Verschuiving
    van de aftestgrens naar rechts verhoogt de succesratio, maar ook het aantal positieve missers. Strengere selectie leidt ertoe dat meer kandidaten worden afgewezen die geschikt
    zouden zijn gebleken. Het is een kwestie van beleid waar men de aftestgrens legt, afhankelijk van de gevolgen van het voorkomen van positieve danwel negatieve missers. Gesteld
    kan worden dat een aftestgrens optimaal is als de daarbij behorende opbrengst of utiliteit
    van de selectieprocedure maximaal is of, omgekeerd, als het verlies van de procedure minimaal is. Deze totale utiliteit is doorgaans afhankelijk van de utiliteiten van de afzonderlijke selectie-uitkomsten en van de kansen daarop binnen een populatie.
  6. Een bijzonder probleem doet zich ook voor bij een zeer lage toevalskans, zoals vaak het
    geval is in de klinische psychologie, waar de kans op een bepaalde abnormaliteit relatief
    gering is. Een lage toevalskans heeft gevolgen voor de bijdrage van de test in het beslissingsproces. Het gebruik van tests met een matige validiteit kan het aantal foutieve
    beslissingen zelfs vergroten.
91
Q

Ten slotte brengen we de ▌utiliteit van een testprocedure in verband met eerder genoemde
begrippen. In een situatie waarin een hogere criteriumscore wordt gewaardeerd met een hogere utiliteit en waarin maar twee criteriumintervallen bestaan, beneden en boven de kritische score, hebben we twee utiliteitswaarden. De netto-utiliteit per onderzochte is dan:
9.1 ∆𝑈 = 𝑆𝑈𝑟𝑋𝑈𝜗(𝑋′)− 𝐶
Hierin is ∆U de netto utiliteitswinst per onderzochte, SU de standaarddeviatie van de utiliteit
in de ongeselecteerde populatie, rXU de correlatie tussen predictor en utiliteit in de ongeselecteerde populatie, ξ(X’) de ordinaat (waarde op verticale as, dus een kans) van de normaalverdeling van X bij aftestgrens X’ en C de gemiddelde kosten per onderzochte.
Formule 9.1 is gebaseerd op de lineaire regressie van U op de predictor X, waarbij de helling
van de regressielijn wordt bepaald door SUrXU. De utiliteit wordt beïnvloed door vier factoren:
Welke 4?

A
  1. De standaarddeviatie in de utiliteitsscores heeft betrekking op de vraag of een betere of
    slechtere prestatie veel of weinig uitmaakt voor de organisatie. Als een geringe toename
    in de prestatie van grote waarde is, zal de nuttigheid van het testonderzoek ook groot zijn.
  2. De correlatie tussen test en utiliteit en tussen test en criterium is lineair gerelateerd aan
    het nuttige effect van de test. Meestal zal er bij hen die een prestatie boven de kritische
    criteriumscore leveren een toename in nuttigheid zijn bij een toenemende prestatie.
  3. De selectieratio is van invloed op de utiliteit. Bij een gegeven aantal kandidaten is de nuttigheid van het onderzoek per persoon maximaal, als de ordinaat onder de normaalcurve
    maximaal is. Dit is het geval bij een selectieratio van 0.50.
  4. Bij een gegeven spreiding in criteriumscores, een gegeven validiteit en een gegeven selectieratio, kan men berekenen of de kosten van het testprogramma opwegen tegen het
    uiteindelijke rendement van de procedure.
92
Q

Zelden volstaat één enkele test om een criterium met voldoende zekerheid te voorspellen,
vooral als het criterium heterogeen van aard is. Meestal zal een zo hoog mogelijke validiteit
bereikt worden door een verzameling van tests die zo hoog mogelijk correleren met de criteriumprestatie, maar onderling zo laag mogelijk correleren. oor het combineren van de gegevens van de afzonderlijke tests om zo goed mogelijke selectieresultaten te realiseren, geldt het volgende:

A

wel bij een gefixeerde selectieratio als bij
een gefixeerde succesratio kunnen de gewenste beslissingen worden bereikt via een statistisch proces van wegen van testscores en berekenen van succeskansen, of via een intuïtief
proces van weging en voorspelling. In deze controverse tussen ▌actuarische en ▌intuïtieve voorspelling is uit onderzoek gebleken dat de statistische methode superieur is. De actuarische verwerking leidt tot betere resultaten, dus tot minder foute beslissingen. Dit komt
doordat in een intuïtieve combinatie van objectieve gegevens allerlei vooroordelen, stereotypen en veronderstellingen een rol kunnen spelen

93
Q

Niet in alle gevallen is de gewogen samenstelling van testscores de aangewezen methode voor
het bepalen van geschiktheid. Wat is er dan nodig?

A

Sommige omstandigheden vereisen de procedure van de veelvoudige minimumscore (▌multiple cut-off procedure), waarbij voor iedere test afzonderlijk
een kritische score wordt vastgesteld. Deze testcombinatie heet ▌conjunctief, en die volgens
de gewogen samenstelling ▌compensatorisch. Ook een combinatie van beide methoden is
denkbaar. De mogelijkheid van compensatie is in veel gevallen realistisch, en levert bovendien
het voordeel dat extra informatie wordt verkregen, doordat de gewogen totaalscore ook de
mogelijkheid biedt tot verdere differentiatie binnen de groep geselecteerden. Soms is echter
de methode van veelvoudige minimumscore beter op zijn plaats

94
Q

Tot dusver hebben we de procedure behandeld waarbij alle kandidaten aan hetzelfde onderzoek worden onderworpen. Soms is het efficiënter om niet eenmaal, maar trapsgewijs te
testen. Er kan bijvoorbeeld voorselectie plaatsvinden. De basis daarvoor dient valide te zijn
met betrekking tot de criteriumprestatie. Niet van alle methoden kan die validiteit worden
aangetoond. Vaak kan een voorselectie beter worden gerealiseerd door middel van een korte
testprocedure. De gebruikte test kan zelfs nuttig zijn als hij minder betrouwbaar en valide is
dan de procedure die in een definitief onderzoek wordt gebruikt. Sequentiële beslissingsmodellen kunnen ook gecompliceerder zijn.
Vooral als het onderzoek vele personen betreft en ook in die gevallen waarin het onderzoek
kostbaar, moeilijk of vervelend voor de betrokkene is, kan een sequentiële beslissingsstrategie
een goede oplossing zijn. Een ander toepassingsgebied is de klinische diagnostiek.

A
95
Q

Voor de beantwoording van een open vraag kan men de
persoon het beste in fasen testen. Welke fasen zijn er dan?

A

n de eerste fase kan het grote aantal mogelijkheden worden gereduceerd. Hiervoor is een test nodig die een groot aantal mogelijkheden tegelijk kan
bestrijken.

In de tweede fase kan worden beslist met betrekking tot het beperkte aantal mogelijkheden, of kan een veronderstelling als hypothese worden getoetst. Hiervoor is een meetinstrument nodig dat betrouwbaar meet en dat veel gerichter is

96
Q

onbach en Gleser hebben deze twee typen tests omschreven in termen van informatietheorie. Ze gebruiken de termen ▌bandwijdte en ▌zuiverheid. Een test kan deze kenmerken niet
tegelijk bezitten. Een grote bandwijdte gaat ten koste van de zuiverheid, en vice versa. Toegepast op een test betekenen deze termen dat steeds wordt getracht een compromis te vinden
tussen de veelheid aan informatie (bandwijdte) en de nauwkeurigheid ervan (zuiverheid). Bij
een definitieve conclusie of keuze dient de zekerheid maximaal te zijn, en dat kan pas bij een
beperkte en gerichte vraagstelling. Bij hypothesevorming of inperking van de keuzemogelijkheden dient juist de breedte, het bereik van de test voorop te staan.

A
97
Q

Om de zuiverheid van brede-bandtests, zoals projectietests, te verbeteren zijn wel de volgende maatregelen voorgesteld.

A

Ten eerste zijn een goede standaardisering en het gebruik
van een objectief verwerkingssysteem nodig. Ten tweede dient de test voldoende items te
bevatten. Ten derde moeten voor verschillende populaties specifieke normgegevens beschikbaar zijn. Ten vierde moeten beoordeelde kenmerken een plaats krijgen in een theorie over
een psychologisch construct. Door deze maatregelen nemen betrouwbaarheid en validiteit
van een test weliswaar toe, maar neemt de bandwijdte tegelijk sterk af.

98
Q

Doe zelftoets youlearn

A