Hoofdstuk 8. Validiteit Flashcards

Question

Validiteitsgeneralisatie

Answer 1

In hoeverre heb je met tests met dezelfde voorspellingssituatie te maken? Wanneer dit wordt bevestigd heb je geen nieuw validiteitsonderzoek nodig. De opvatting is dat predictieve validiteit in hoge mate situatie specifiek is. Er is echter een methode voor. • Voor alle combinaties van een specifieke test en gedragingen in een specifieke functie worden validiteitcoëfficiënten verzameld. • Deze worden opgevat als waarden en omgezet naar standaarddeviatie. Deze geeft de variatie in gevonden validiteit-coëfficiënten weer. • De standaarddeviatie wordt gecorrigeerd voor veronderstelde methodologische fouten: steekproeffouten, onbetrouwbaarheid van predictoren en criteria en beperking van de variatiebreedte. Als gevolg van steekproeffouten worden validiteitcoëfficiënten te hoog of te laag geschat. De invloed van kleine steekproeven is groter dan de effecten van meetfouten en variatiebeperking. • Door nu te corrigeren voor dit soort effecten, wordt een meer realistische schatting van de validiteits-coëfficiënt verkregen. Wanneer na correctie de resulterende standaarddeviatie van validiteitcoëfficiënt gelijk is aan nul, dan betekent dit dat de validiteit van de tests niet verschilt over deelsituaties. • Uit onderzoek blijkt: de validiteitcoëfficiënten zijn vaak weinig situatie specifiek, dus generalisatie is mogelijk over organisatie, geografische gebieden, functies, tijd

Answer 2

Effectiviteit mag worden opgevat als de representatieve validiteit binnen een specifieke categorie van tests en functies. Is de standaarddeviatie van de validiteitscoëfficiënten na correctie voor fouten niet gelijk aan nul (dan is er dus wel sprake van situatiespecificiteit), dan wordt een BI berekend waarvan het tiende percentiel wordt beschouwd als ondergrens voor validiteit. Op basis van zowel effectiviteit als deze ondergrens worden uitspraken gedaan over te verwachten validiteit in toekomstige selectiesituaties. Ligt de effectiviteit en de ondergrens relatief dicht bij elkaar dan kan worden gesteld dat generalisatie mogelijk is.

Answer 3

* Ingewikkelde criteria als beroepssucces zijn op veel te eenvoudige manier gemeten( te globaal). Slecht geoperationaliseerde criteria leidt tot te lage validiteit met te weinig spreiding. Dus als wel goed was gemeten, zou de mogelijkheid van situatiespecificiteit niet verworpen worden. * Correctie van standaarddeviatie validiteitscoëfficiënten is vaak te groot.

Answer 4

Het onderzoek naar de predictieve validiteit houdt zich bezig met de selectie van de voor de voorspelling beste predictoren. Wat de beste predictoren zijn kan b.v. worden vastgesteld m.b.v. regressieanalyse. Predictoren die hoog correleren met het criterium en laag met andere predictoren krijgen een zwaar gewicht. Construct validity is belangrijk omdat: • Het blind toepassen van een test ter voorspelling van een criterium, zonder je af te vragen waarom de voorspelling ‘werkt’, leidt niet tot noodzakelijk inzicht. • Het blind afgaan op de grootste correlaties impliceert dat men eigenlijk alle mogelijk predictoren zou moeten onderzoeken. Dit is geen doen. • Er kan sprake zijn van een unieke of zeldzame situatie waarvoor niet of nauwelijks een criterium valt vast te stellen. Hypothesen kunnen wel geformuleerd. • Zonder theorie komt de psycholoog in de knel bij het beschrijven van de onderzochte. • Betekenisanalyse en begripsvaliditeit bieden de mogelijkheid criterium van zijn voetstuk te halen en te analyseren. Conclusie: predictieve validiteit is onmisbaar voor voorspellend testgebruik. Begripsanalyse is onmisbaar voor wetenschappelijk inzicht en praktisch gebruik.

Answer 5

Aan begripsvalidering gaat meestal een proces van betekenisanalyse vooraf. Dit is het vinden van een theorie als verklaring voor het testgedrag. Deze verklaring is hypothetisch. Bij begripsvalidering gaat het om de theorie empirisch te bevestigen. Na keuze voor trekvalidering of nomologisch netwerk start de fase van begripsvalidering. Er dienen voorspellingen te worden geformuleerd om te toetsen of de vermoedens over de test juist zijn. De uitkomsten leveren de basis voor conclusies over juistheid van deze verklaring.

Answer 6

* De eerste fase is creatief. Er wordt gezocht naar plausibele verklaringen. * De voorspelling moet ondubbelzinnig te onderzoeken zijn * Er kan nooit definitief worden bewezen of een test al of niet een bepaalde theoretische betekenis heeft. De voorspelling kan alleen de theorie verstevigen of verzwakken. * Alternatieve hypothesen moeten kunnen worden verworpen, oorspronkelijke hypothese moet kunnen worden geaccepteerd.

Answer 7

Bij trekvalidering is de vraag in hoeverre testgedrag verklaard kan worden m.b.v. een persoonlijkheidstrek of een geschiktheid. Het gaat niet noodzakelijk om een theorie. Bij de nomologische validering wordt het testgedrag wel verklaard uit een psychologische theorie. De mogelijkheid om testgedrag te relateren aan een nomologisch netwerk is groter naarmate de psychologie als wetenschap verder vordert en er meer nomologische netwerken ontstaan. Testgedrag wordt doorgaans gevalideerd in termen van trekvaliditeit.

Answer 8

Er worden twee soorten voorspellingen bij begripsvalidering onderscheiden. Confirmerende validering zijn voorspelingen die kunnen dienen om de oorspronkelijke hypothese te bevestigen. Discriminante validering zijn voorspellingen die alternatieve hypothesen verwerpen.

Answer 9

Vermoeden en verwachtingen vormen de basis voor theorievorming over testgedrag. Maar wat als de onderzoeker nog helemaal niets weet over het testgedrag? Er zijn dan twee suggesties voor het analyseren van testgedrag. • Structuuronderzoek. Hoe kan een analyse van de structuurkenmerken van de test leiden tot hypothetisch inzicht in de betekenis van testgedrag? Dit kan door een psychologische analyse van de inhoud van de items (leidt tot iets wat lijkt op indrukvaliditeit behalve dat er geen definitieve vaststellingen volgen) of door een analyse van de formele kenmerken van de test. • Relatie onderzoek. Deze kent vier vormen. Zowel het structuuronderzoek als het relatieonderzoek dragen bij tot een voorlopige formulering van een antwoord op de betekenisvraag.

Answer 10

* Spreiding en normen. Onderzoeker verzameld gegevens over spreiding en normen en bestudeerd deze in verschillende groepen. Dit soort informatie levert bruikbare indicaties op van wat de test meet. * Experimenteel onderzoek. Onderzoeken wat de effecten van verschillende condities zijn. * Factoranalyse. Nagegaan kan worden met welke factoren een test hoog en met welke laag correleert. Op basis van psychologische interpretatie van factoren kan de betekenis van testgedrag worden verduidelijkt. B.v. RAKIT die verbale en performale intelligentie meet. * Wat kan de test voorspellen. Er is een wisselwerking tussen betekenisanalyse en predictieve validiteit. De voorspellingen geven aanleiding tot zinvolle veronderstellingen over de testbetekenis.

Answer 11

Een explorerende methode om informatie die in een groot aantal variabelen is vervat, samen te vatten in een geringer aantal nieuw te construeren variabelen. Deze nieuwe variabelen heten dan factoren. Doel: samenvatting van informatie waarbij een vereenvoudiging van gegevens wordt verkregen en een grotere mate van inzichtelijkheid. Hierbij gaat informatie verloren maar men streeft ernaar dit verlies te beperken. Een factor is een gewogen som van itemscores of testscores. De gewichten worden zo bepaald dat de factorscore (gewogen somscore) zoveel mogelijk inzicht verschaft in de afzonderlijke items of tests. Zijn de correlaties tussen testscores 0, dan zijn de testprestaties onafhankelijk van elkaar. De tests meten dan een andere eigenschap en hebben weinig gemeen. Dit betekent ook dat een kleiner aantal factoren de test niet kan samenvatten. Zijn de correlaties heel hoog dan is er veel overlap en wordt dezelfde eigenschap gemeten. De werkelijkheid ligt hier ergens tussenin.

Answer 12

Factoranalyse heeft wel wat weg van de meervoudige regressieanalyse ter voorspelling van een criterium. Bij beide worden testscores met verschillende gewichten bij elkaar opgeteld wat resulteert in een optimale voorspelling. Bij beide speelt ook de correlatie tussen de test een rol bij de keuze van de gewichten. Verschil: Bij RA worden de gewichten zo gekozen dat het criterium zo goed mogelijk wordt voorspeld. Bij FA worden de gewichten zo gekozen dat de informatie in de testscores zo goed mogelijk wordt samengevat.

Answer 13

* Algemene factoren. Waarmee vrijwel alle test minder of meer samenhangen. * Groepsfactoren. Vertegenwoordigen meestal een kleiner gedeelte van de tests. * Specifieke factoren. Zijn gekoppeld aan één test of slecht enkele items.

Answer 14

Het resultaat van factoranalyse is afhankelijk van voorwaarden en uitgangspunten: • Soort en hoeveelheid van de variabelen die men in de analyse opneemt. Er kan niets uit de analyse komen wat er niet eerst is ingestopt. • De steekproef waarop de analyse is uitgevoerd. Hoe meer variatie de steekproef vertoont, hoe hoger de correlaties tussen testscores. Het contrast tussen hoge en lage correlaties neemt toe. • Enkele wiskundige en technische vooronderstellingen, die vaak een arbitrair karakter hebben. • Interpretatie van de resultaten van factoranalyse. Als rekening wordt gehouden met de beperkingen kan factoranalyse zeer helpend zijn om inzicht te krijgen in psychologische betekenis van tests.

Answer 15

Begripsvalidering vindt zowel plaats door bevestiging van oorspronkelijke hypothese als verwerpen van concurrerende hypothesen. Dus een test die zegt A te meten, mag geen relatie vertonen met tests die B meten waarvan wordt verondersteld dat ze niet samenhangt met A. een lage correlatie tussen en test en eigenschap A kan even belangrijk zijn als een hoge correlatie tussen dezelfde test en eigenschap B. Bij predictieve validiteit is lage correlatie altijd ongewenst (suppressorvariabelen uitgezonderd)

Answer 16

De waarde van het verwerpen van alternatieve verklaringen is niet steeds even groot. Dit hangt af van: • Precisie van de experimentele opzet. Door onjuiste of slordige opzet kan ten onrechte een alternatieve verklaring worden verworpen. • Plausibiliteit van de alternatieve verklaring. Hierin speelt de wisselwerking tussen test en theorie een rol.

Answer 17

* Samenhang met intelligentie. Zinvol om zowel tests voor prestatieniveau als tests voor gedragswijze te correleren met een intelligentietest, die wat de formele kenmerken betreft zo veel mogelijk op de onderzochte test lijkt. * Sociale wenselijkheid als onbedoelde eigenschap. Dit speelt vooral bij persoonlijkheidsvragenlijsten een probleem. Wanneer een test in sterke mate sociale wenselijkheid meet, kan worden gesteld dat de test niet goed functioneert * Antwoordtendenties. Een neiging tot een consistent keuzepatroon in het antwoordgedrag op tests, los van inhoud van vragen.

Answer 18

* Instemtendentie. Het overmatig instemmen met de richting van de vraag. * Positievoorkeur. B.v. voorkeur voor neutrale middenpositie op ratingscale. * Semantische interpretatie. Interpretatie van woorden zoals ‘altijd’ of ‘vaak’ * Sequentietendentie. Tendentie tot kiezen van bepaalde verdeling * Snelheidstendentie. Zo snel mogelijk. Belangrijke bron van verschil in prestatie. * Precisietendentie. Zo precies mogelijk. * Uitvoerigheidtendentie bij vrije antwoordmogelijkheden. * Gistendentie. * Voorkeur voor formele kenmerken. B.v. langste optie of met vreemde termen.

Answer 19

In essentie komt deze benadering erop neer dat het correlatiepatroon dat ontstaat bij de afname van verschillende tests voor meer dan één eigenschap, geanalyseerd wordt op consistentie. Het is een methode voor evaluatie van test waarbij zowel betrouwbaarheid als validiteit kan worden onderzocht. Het idee is dat een test voor een bepaalde eigenschap kan worden vervangen voor een andere test die dezelfde eigenschap pretendeert te meten. Dit lukt niet perfect waardoor variatie in de testresultaten voor een deel is toe te schrijven aan variatie van de onderzochte groep op de bedoelde eigenschap, maar ook aan de specifieke eigenschappen van de verschillende meetinstrumenten. Bij deze benadering wordt geschat in hoeverre de variantie van de testscore wordt bepaald door de variantie in de bedoelde trek en juist niet door variantie t.g.v. gebruikte methode of variantie in niet-bedoelde trekken. De multitrek-multimethodematrix bevat de correlaties die op deze wijze uit alle combinaties van methoden en trekken ontstaan. De in de matrix staan: • B. waarden: de correlaties voor dezelfde trekken en dezelfde methoden (monotrek-monomethode overlap. Dit is de betrouwbaarheid. • V. waarden. De correlaties voor dezelfde trekken maar verschillende methoden. Monotrek-heteromethode-overlap. Dit is confirmerende validiteit. • M. waarden: correlaties voor dezelfde methoden, verschillende trekken. Indicatie van methodevariantie. • D. waarden: correlaties voor verschillende trekken, verschillende methoden.

Answer 20

De voornaamste eis is dat twee tests die dezelfde eigenschap pretenderen te meten, hoger met elkaar correleren dan twee tests die verschillende eigenschappen pretenderen te meten Er dient sprake te zijn van zowel confirmerende validiteit en discriminante validiteit • V waarden moeten significant van 0 verschillen en voldoende hoog zijn om het verder werken met de tests te rechtvaardigen. • V waarden moeten hoger zijn dan de D waarden. Dit betekent dat validiteit van variabele hoger is dan correlatie tussen variabelen. • V waarden moeten hoger zijn dan M waarden. Twee onafhankelijke maten van dezelfde trek moeten dus hoger correleren dan twee verschillende trekken met dezelfde methode. • In de M driehoeken en de D driehoeken moeten ongeveer gelijke patronen van correlaties gevonden worden. De laatste drie vormen de basis voor eventuele discriminante validiteit.

Answer 21

* Test-hertest = categorie dezelfde meting (methode), zelfde eigenschap (trek). De b-waarden zeggen dan iets over de herhaalbaarheid van de meting. * Paralleltest. De b-waarde is de correlatie tussen twee paralleltests. In praktijk kan sprake zijn van zelfde trek, verschillende test. Dan is correlatie v-waarde.

Answer 22

Parallel aan de ontstane mening over validiteit als eenledig begrip zijn ook diverse taxonomieën van validiteit voorgesteld die aangeven hoe verschillende vormen/aspecten van validiteit zich tot elkaar verhouden. • COSMIN-taxonomie. Deze taxonomie beschrijft drie kwaliteitsdomeinen van testen, namelijk betrouwbaarheid, validiteit en reactievermogen. Elk domein bevat een of meer meeteigenschappen (bijvoorbeeld bij het domein validiteit: content validity, criterion validity en construct validity; verder te verdelen in structural validity, hypothesetoetsing en cross-cultural validity) • Taxonomie door de Von. Die heeft construct validiteit opgedeeld in translational validiteit (en dan face/content) en criterion validity (en dan concurrent, predictive, convergent en discriminant)

Hoofdstuk 8. Validiteit Flashcards

(46 cards)