Hoofdstuk 5 deel 2 Flashcards by Melissa Simson

Hoe noem je het volgende.
Dmv een verzameling van goed gekozen items schatten van de mate van beheersing van
deelvaardigheden die nodig zijn om dergelijke items op te lossen. Dit kan gebruikt worden om
eventuele deficiënties bij leerlingen te verhelpen

Antwoord ‘cognitive skills diagnostics’.

How well did you know this?

Not at all

Perfectly

De computer maakt het mogelijk om bvb aandacht te testen, door het scoren van reactietijden of het
aantal fouten, dit vooral bij toepassingen waarin snelle beslissingen vereist zijn, bvb het bedienen
van complexe machines.

Naast bijdrages kan de computer ook belemmerend werken, bvb testangst of obv de ervaring met
computers. Men gaat er evenwel vanuit dat deze verschillen uitgevlakt worden wanneer iemand
voorafgaand de sessie voldoende kan oefenen

Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn

Bij een computertest is het onmogelijk om items over te slaan (passive omitting), wat kan leiden tot
andere verdelingen van itemscores dan bij conventionele tests, maar ook dit blijkt weinig invloed te
hebben vergeleken met conventioneel testen

How well did you know this?

Not at all

Perfectly

Welke kenmerken zijn middels conventionele testmethoden, dus zonder computers, moeilijk
meetbaar?
P166

Individuele verschillen in ruimtelijk-visueel redeneren, geheugen en aandacht. Ook
leerpotentieel zou wellicht beter mogelijk zijn mbv computer gestuurde testprocedures.

How well did you know this?

Not at all

Perfectly

Behalve bijdragen die de computer kan leveren, zijn er ook problemen die juist ontstaan door het
gebruik van computers bij het testen van personen. Wie
a.Hofer en Green
B Hofman en lundberg

Hofer en Green ze veronderstellen dat dergelijke verschillen gedeeltelijk kunnen verdwijnen als
respondenten voldoende gelegenheid krijgen om voorafgaand aan de testsessies te oefenen en zo
aan het medium te wennen.
Wie onderzochten bij een vorderingstoets de invloed van het afnemen van respectievelijk per
computer en schriftelijk op onder andere de testscore, drie itemvormen werden onderzocht, goed,
fout , meerkeuze met een goed antwoord en ten slotte matching van antwoorden.

A Hoffer en Green
B Hofman en lundberg

noemen twee factoren die het gevolg zijn
van het testen per computer en waarbij personen of groepen verschillen kunnen vertonen.
Testangst en ervaring met computers.

How well did you know this?

Not at all

Perfectly

Wat concludeerde hofer en green.

a. Dat zowel voor persoonlijkheidstests als capacitietstests de verschillen in test prestaties
onder computergestuurde en conventionele condities meetstal niet groot zullen zijn

b. Dat zowel voor persoonlijkheidstests als capacitietstests de verschillen in test prestaties
onder computergestuurde en conventionele condities meetstal groot zullen zijn

Antwoord a

How well did you know this?

Not at all

Perfectly

Wetenschappelijke bijdrages en veranderingen
De computer maakt het mogelijk om bvb aandacht te testen, door het scoren van reactietijden of
het aantal fouten, dit vooral bij toepassingen waarin snelle beslissingen vereist zijn, bvb het bedienen
van complexe machines.

Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn.

How well did you know this?

Not at all

Perfectly

p164 Dmv een verzameling van goed gekozen items schatten van de mate van beheersing van
deelvaardigheden die nodig zijn om dergelijke items op te lossen. Dit kan gebruikt worden om
eventuele deficiënties bij leerlingen te verhelpen.hoe noem je dit.
‘

cognitive skills diagnostics’?

How well did you know this?

Not at all

Perfectly

Welke kenmerken zijn middels conventionele testmethoden, dus zonder computers, moeilijk
meetbaar?

P166 Individuele verschillen in ruimtelijk-visueel redeneren, geheugen en aandacht. Ook
leerpotentieel zou wellicht beter mogelijk zijn mbv computer gestuurde testprocedures.

How well did you know this?

Not at all

Perfectly

Welke 2 complicerende factoren worden genoemd in het onderzoek naar individuele verschillen in
aandacht? P 167

1) Aandacht lijkt bij sommigen een nogal instabiele eigenschap te zijn

2) Individuele verschillen in vaardigheid bij de uitvoering van een taak en individuele verschillen in
aandacht zijn niet steeds makkelijk te scheiden.

How well did you know this?

Not at all

Perfectly

Welke twee factoren worden door Hofer en Green genoemd die een rol spelen bij testen me
gebruik van computers?

1) Testangst
2) (gebrek aan) ervaring met computers. Mensen dienen voldoende tijd te krijgen om te wennen aan
het gebruik van de computer.

How well did you know this?

Not at all

Perfectly

Wat stelde van de Vijver mbt de verschillen die soms toch worden gevonden tussen conventionele
en computergestuurde tests?
P 168

Dat de normen die behoren bij een conventionele test niet zonder nader onderzoek mogen
worden overgenomen door een computergestuurde testversie.

How well did you know this?

Not at all

Perfectly

Wetenschappelijke bijdrages en veranderingen .

Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn.

How well did you know this?

Not at all

Perfectly

Een belangrijke bijdrage van de computer aan de psychometrie is

Adaptief testen ofwel testen op maat.

How well did you know this?

Not at all

Perfectly

Hoe noem je het volgende, dit komt er op neer dat iedere respondent een test krijgt voorgelegd die
op zijn of haar niveau is toegesneden.

Adaptief testen.

How well did you know this?

Not at all

Perfectly

Waarom krijgt een respondent met geringe vaardigheden ,bij een adaptieve test, een makkelijkere
test toegekend dan een respondent met een behoorlijkere vaardigheid.

Het idee is dat bijvoorbeeld de respondent met geringe vaardigheid items van een
gemiddeld of grote moeilijkheidsgraad niet aan zal kunnen en dus voortdurend faalt.
En dit is frustrerend voor de respondent maar levert ook weinig informatie op voor
dienst niveau, behalve dat het onder het niveau van de gepresenteerde item ligt en
dit is meettechnish niet zinvol.

How well did you know this?

Not at all

Perfectly

Als de volledige verzameling items, opgeslagen in de itembank voldoet aan de eisen van de
itemresponstheorie, kunnen de scores van verschillende respondenten achteraf vergeleken worden,
ook al hebben ze andere tests gemaakt. Dit komt omdat de metingen in het kader van de
itemrepsonstheorie gecorrigeerd kunnen worden voor het moeilijkheidsniveau van de test.

Binnen de item-responstheorie kan worden aangetoond dat de meting van een eigenschap van een
persoon met een bepaald item de grootste nauwkeurigheid geeft als de moeilijkheid van het item en
het niveau van de persoon op de psychologische eigenschap (beide gemeten op dezelfde schaal)
samenvallen. In dit geval is de subjectieve kans op een positief antwoord op een item 0.5, vanuit de
persoon gezien is de kans op goed en fout even groot.

Hoe dan? Eerst krijgt de correspondent één of enkele items die in een populatie gemiddeld zijn, op
basis waarvan de computer een eerste schatting maakt van het meetwaarde van de persoon. Hierna
worden items aangeboden waarvan de moeilijkheid samenvalt met de meetwaarde. Een volgende
schatting wordt dan gebaseerd obv de testscores op de startitems en het nieuwe item,… dit totdat
een meetwaarde is bereikt die voldoende nauwkeurig is. Deze stapsgewijze bepaling van iemands
meetwaarde heeft volgende kenmerken:

De schatting van iemands meetwaarde komt bij iedere stap dichter bij de gezochte waarde.
De schatting van de meetwaarde is nauwkeuriger naarmate meer items gegeven werden.’

Waar liggen de verschillen mett de klasieke benadering van testen.

A in de klassieke test krijgt iedereen dezelfde test gepresenteerd
B in de klassieke test krijgt iedereen een andere test gepresenteerd

Welke kenmerken heeft bovengenoemde stapsgewijze bepaling van iemand meetwaarde? P171,

 Schatting komt bij iedere stap dichterbij de gezochte meetwaarde .

 Schatting van de meetwaarde is nauwkeuriger naarmate er meer items zijn gepresenteerd

Wat is juist.
A Adaptief testen kan efficiënt plaatsvinden zonder itembank met minstens 150-200 items
B Adaptief testen kan niet efficiënt plaatsvinden zonder itembank met minstens 150-200 items

Antwoord b dit omdat een computer moet items kunnen kiezen uit een grote verzamelig met
gevarieerde moeilijkheid.

Wat is juist.

A Weiss (1985) stelt dat een adaptieve test net zo lang moet zijn als een standaardtest om met
dezelfde nauwkeurigheid te meten.

B Weiss (1985) stelt dat een adaptieve test ongeveer half zo lang moet zijn als een standaardtest
om met dezelfde nauwkeurigheid te meten.

Antwoord b

Wat is juist Binnen onderwijs kunnen adaptieve testen gebruikt worden om:

a Bepalen of iemand al dan niet geslaagd is.

b Bepalen of iemands prestatie binnen de grenzen van een bepaald interval ligt.

c Bepalen of iemand in een bepaald leerstofgebied vooruitgang heeft gemaakt.

Antwoord: a b en c

Wat is juist.
A een ruwe score heeft veel betekenis.
B een ruwe score heeft meestal weinig betekening.

Antwoord b. als iemand zegt op het examen slechts vijf foute antwoorden te hebben gegeven dan
zegt dat aleen maar iets als men ook weet van hoeveel opgaven of voor hoeveel fouten een punt
werd afgetrokken.

De ruwe score heeft op zichzelf meestal weinig betekenis, maar men kan hieruit wel bewerkte scores
afleiden die gebaseerd zijn op:

Het vergelijken met een absolute standaard.
Deling door bvb leeftijd of schoolklas.
De relatieve positie in een referentiegroep

De ruwe score heeft weinig betekenis als er geen referentiewaarde is. Welke 3 vergelijkingen
worden genoemd? P173 1)

1)Vergelijking met een absolute standaard
2) Gebaseerd op deling door bijvoorbeeld leeftijd of schoolklas
3) Gebaseerd op relatieve positie in een referentiegroep.

Opgelet: niet iedere bewerkte score heeft een norm karakter! Diverse bewerkingen staan los van de
prestaties van anderen (bvb aantal goede antwoorden omzetten in een rapport cijfer). Om te kunnen
spreken van testnormen is afhankelijkheid van de scores van anderen een voorwaarde.

Hoe noem je het volgende. referentiekader voor de evaluatie van ruwe scores dat is gebaseerd op de kenmeren van de verdeling van de ruwe scores in een populatie. Deze kenmerken worden geschat op basis van een representatieve steekproef.

Antwoord; norm. Het gebruik van normen voor de beoordeling van een concrete testscore houdt de vergelijking in van deze score met de scoreverdeling van de referentiepopulatie. De beoordeling van het individu vindt plaats tegen de populatie waartoe hij behoort en niet van die van de groep die men toevallig onderzoekt en waarvan hij deel uitmaakt. Het gebruik van normen voor de waardering van iemands testprestatie overstijgt de kenmerken van de groep waartoe hij behoort.

Wat is juist. A Normen zijn altijd nodig B normen zijn niet altijd nodig.

Antwoord b soms volstaat een eenvoudiger vorm van bewerkte scores, bvb als het enkel noodzakelijk is om de 3 best scorende personen te kennen bij rekrutering. Er zijn ook gevallen waarin men zich kan beperken tot ruwe scores, bvb als men voor onderzoeksdoeleinden geïnteresseerd is in de samenhang tussen testscores en criteriumscores.

Wat is juist. A Hoe groter een groep is, hoe meer het de kenmerken van een relevante populatie weerspiegelt en hoe meer de vergelijkingen het karakter krijgen van vergelijkingen met een norm . B Hoe kleiner een groep is, hoe meer het de kenmerken van een relevante populatie weerspiegelt en hoe meer de vergelijkingen het karakter krijgen van vergelijkingen met een norm.

Antwoord a hierbij is belangrijk dat  Bij normeringsonderzoek moeten de specifieke kenmerken van de onderzochte normgroep vermeld worden, zo kan men afleiden of de normsteekproef geschikt is. * Normen dienen niet al te absoluut gezien te worden, want met een verandering in de populatie veranderen ook de daarop gebaseerde normen. Vandaar de eis van geregelde normrevisie van tests.

Het gebruikt van normen voor de beoordeling van een concrete test sore houdt de vergelijking in van deze score met de scoreverdeling van de referentiepopulatie. Hoe vind de beoordeling ven het individu plaats. A De beoordeling van het individu vindt plaats tegen de populatie waartoe hij behoord en niet van die van de groep die men toevallig onderzoekt en waarvan hij deel uitmaakt. b. De beoordeling van het individu vindt niet plaats tegen de populatie waartoe hij behoord maar van die van de groep die men toevallig onderzoekt en waarvan hij deel uitmaakt.

Antwoord A. de kenmerken van deze groep zoals het gemiddelde en de spreiding van de testscores hebben dan geen invloed op de beoordeling van het individu. ( een voorbeeld hier van is een onderzoek van een leerling in een bepaalde klas van een basisschool waarbij de referentiegriep de populatie van Nederlandse basisschoolleerlingen van groep acht is. Denk aan een Cito-toets de uitslag geeft aan waar het kind in de populatie in Nederland staat en niet in zijn klas.

Welke twee zaken zijn belangrijk bij normeringsonderzoek? P175 1) Specifieke kenmerken van de onderzochte normgroep vermelden, daaruit kan afgeleid worden of men te maken heeft met een geschikte normsteekproef 2) Normen dienen niet te absoluut te worden gezien; met een verandering in de populatie kunnen de daarop gebaseerde normen eveneens veranderen, vandaar de eis van geregelde normrevisie van test.

Wat is juist. A bij de vergelijking van een testscore met een absolute standaard wordt de testprestatie beoordeel door die van anderen hierbij te betrekken. B bij de vergelijking van een testscore met een absolute standaard wordt de testprestatie beoordeeld zonder die van anderen hierbij te betrekken

Antwoord b de vraag is dan hoe goed de prestatie is in vergelijking met een absolute maatstaaf of norm en niet wat de prestatie is in vergelijking met de klas leeftijdgenoten of de Nederlandse populatie.