Hoofdstuk 5 deel 2 Flashcards
Hoe noem je het volgende.
Dmv een verzameling van goed gekozen items schatten van de mate van beheersing van
deelvaardigheden die nodig zijn om dergelijke items op te lossen. Dit kan gebruikt worden om
eventuele deficiënties bij leerlingen te verhelpen
Antwoord ‘cognitive skills diagnostics’.
De computer maakt het mogelijk om bvb aandacht te testen, door het scoren van reactietijden of het
aantal fouten, dit vooral bij toepassingen waarin snelle beslissingen vereist zijn, bvb het bedienen
van complexe machines.
Naast bijdrages kan de computer ook belemmerend werken, bvb testangst of obv de ervaring met
computers. Men gaat er evenwel vanuit dat deze verschillen uitgevlakt worden wanneer iemand
voorafgaand de sessie voldoende kan oefenen
Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn
Bij een computertest is het onmogelijk om items over te slaan (passive omitting), wat kan leiden tot
andere verdelingen van itemscores dan bij conventionele tests, maar ook dit blijkt weinig invloed te
hebben vergeleken met conventioneel testen
Welke kenmerken zijn middels conventionele testmethoden, dus zonder computers, moeilijk
meetbaar?
P166
Individuele verschillen in ruimtelijk-visueel redeneren, geheugen en aandacht. Ook
leerpotentieel zou wellicht beter mogelijk zijn mbv computer gestuurde testprocedures.
Behalve bijdragen die de computer kan leveren, zijn er ook problemen die juist ontstaan door het
gebruik van computers bij het testen van personen. Wie
a.Hofer en Green
B Hofman en lundberg
Hofer en Green ze veronderstellen dat dergelijke verschillen gedeeltelijk kunnen verdwijnen als
respondenten voldoende gelegenheid krijgen om voorafgaand aan de testsessies te oefenen en zo
aan het medium te wennen.
Wie onderzochten bij een vorderingstoets de invloed van het afnemen van respectievelijk per
computer en schriftelijk op onder andere de testscore, drie itemvormen werden onderzocht, goed,
fout , meerkeuze met een goed antwoord en ten slotte matching van antwoorden.
A Hoffer en Green
B Hofman en lundberg
noemen twee factoren die het gevolg zijn
van het testen per computer en waarbij personen of groepen verschillen kunnen vertonen.
Testangst en ervaring met computers.
Wat concludeerde hofer en green.
a. Dat zowel voor persoonlijkheidstests als capacitietstests de verschillen in test prestaties
onder computergestuurde en conventionele condities meetstal niet groot zullen zijn
b. Dat zowel voor persoonlijkheidstests als capacitietstests de verschillen in test prestaties
onder computergestuurde en conventionele condities meetstal groot zullen zijn
Antwoord a
Wetenschappelijke bijdrages en veranderingen
De computer maakt het mogelijk om bvb aandacht te testen, door het scoren van reactietijden of
het aantal fouten, dit vooral bij toepassingen waarin snelle beslissingen vereist zijn, bvb het bedienen
van complexe machines.
Naast bijdrages kan de computer ook belemmerend werken, bvb testangst of obv de ervaring met
computers. Men gaat er evenwel vanuit dat deze verschillen uitgevlakt worden wanneer iemand
voorafgaand de sessie voldoende kan oefenen.
Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn.
Bij een computertest is het onmogelijk om items over te slaan (passive omitting), wat kan leiden tot
andere verdelingen van itemscores dan bij conventionele tests, maar ook dit blijkt weinig invloed te
hebben vergeleken met conventioneel testen.
p164 Dmv een verzameling van goed gekozen items schatten van de mate van beheersing van
deelvaardigheden die nodig zijn om dergelijke items op te lossen. Dit kan gebruikt worden om
eventuele deficiënties bij leerlingen te verhelpen.hoe noem je dit.
‘
cognitive skills diagnostics’?
Welke kenmerken zijn middels conventionele testmethoden, dus zonder computers, moeilijk
meetbaar?
P166 Individuele verschillen in ruimtelijk-visueel redeneren, geheugen en aandacht. Ook
leerpotentieel zou wellicht beter mogelijk zijn mbv computer gestuurde testprocedures.
Welke 2 complicerende factoren worden genoemd in het onderzoek naar individuele verschillen in
aandacht? P 167
1) Aandacht lijkt bij sommigen een nogal instabiele eigenschap te zijn
2) Individuele verschillen in vaardigheid bij de uitvoering van een taak en individuele verschillen in
aandacht zijn niet steeds makkelijk te scheiden.
Welke twee factoren worden door Hofer en Green genoemd die een rol spelen bij testen me
gebruik van computers?
1) Testangst
2) (gebrek aan) ervaring met computers. Mensen dienen voldoende tijd te krijgen om te wennen aan
het gebruik van de computer.
Wat stelde van de Vijver mbt de verschillen die soms toch worden gevonden tussen conventionele
en computergestuurde tests?
P 168
Dat de normen die behoren bij een conventionele test niet zonder nader onderzoek mogen
worden overgenomen door een computergestuurde testversie.
Wetenschappelijke bijdrages en veranderingen .
De computer maakt het mogelijk om bvb aandacht te testen, door het scoren van reactietijden of het
aantal fouten, dit vooral bij toepassingen waarin snelle beslissingen vereist zijn, bvb het bedienen
van complexe machines.
Naast bijdrages kan de computer ook belemmerend werken, bvb testangst of obv de ervaring met
computers. Men gaat er evenwel vanuit dat deze verschillen uitgevlakt worden wanneer iemand
voorafgaand de sessie voldoende kan oefenen.
Onderzoek toont aan dat zowel voor persoonlijkheidstests als capacitietentests de verschillen in
testprestatie onder computergestuurde en conventionele condities meestal niet groot zullen zijn.
Bij een computertest is het onmogelijk om items over te slaan (passive omitting), wat kan leiden tot
andere verdelingen van itemscores dan bij conventionele tests, maar ook dit blijkt weinig invloed te
hebben vergeleken met conventioneel testen.
Een belangrijke bijdrage van de computer aan de psychometrie is
Adaptief testen ofwel testen op maat.
Hoe noem je het volgende, dit komt er op neer dat iedere respondent een test krijgt voorgelegd die
op zijn of haar niveau is toegesneden.
Adaptief testen.
Waarom krijgt een respondent met geringe vaardigheden ,bij een adaptieve test, een makkelijkere
test toegekend dan een respondent met een behoorlijkere vaardigheid.
Het idee is dat bijvoorbeeld de respondent met geringe vaardigheid items van een
gemiddeld of grote moeilijkheidsgraad niet aan zal kunnen en dus voortdurend faalt.
En dit is frustrerend voor de respondent maar levert ook weinig informatie op voor
dienst niveau, behalve dat het onder het niveau van de gepresenteerde item ligt en
dit is meettechnish niet zinvol.
Als de volledige verzameling items, opgeslagen in de itembank voldoet aan de eisen van de
itemresponstheorie, kunnen de scores van verschillende respondenten achteraf vergeleken worden,
ook al hebben ze andere tests gemaakt. Dit komt omdat de metingen in het kader van de
itemrepsonstheorie gecorrigeerd kunnen worden voor het moeilijkheidsniveau van de test.
Binnen de item-responstheorie kan worden aangetoond dat de meting van een eigenschap van een
persoon met een bepaald item de grootste nauwkeurigheid geeft als de moeilijkheid van het item en
het niveau van de persoon op de psychologische eigenschap (beide gemeten op dezelfde schaal)
samenvallen. In dit geval is de subjectieve kans op een positief antwoord op een item 0.5, vanuit de
persoon gezien is de kans op goed en fout even groot.
Hoe dan? Eerst krijgt de correspondent één of enkele items die in een populatie gemiddeld zijn, op
basis waarvan de computer een eerste schatting maakt van het meetwaarde van de persoon. Hierna
worden items aangeboden waarvan de moeilijkheid samenvalt met de meetwaarde. Een volgende
schatting wordt dan gebaseerd obv de testscores op de startitems en het nieuwe item,… dit totdat
een meetwaarde is bereikt die voldoende nauwkeurig is. Deze stapsgewijze bepaling van iemands
meetwaarde heeft volgende kenmerken:
- De schatting van iemands meetwaarde komt bij iedere stap dichter bij de gezochte waarde.
- De schatting van de meetwaarde is nauwkeuriger naarmate meer items gegeven werden.’
Waar liggen de verschillen mett de klasieke benadering van testen.
A in de klassieke test krijgt iedereen dezelfde test gepresenteerd
B in de klassieke test krijgt iedereen een andere test gepresenteerd
a
Welke kenmerken heeft bovengenoemde stapsgewijze bepaling van iemand meetwaarde? P171,
Schatting komt bij iedere stap dichterbij de gezochte meetwaarde .
Schatting van de meetwaarde is nauwkeuriger naarmate er meer items zijn gepresenteerd
Wat is juist.
A Adaptief testen kan efficiënt plaatsvinden zonder itembank met minstens 150-200 items
B Adaptief testen kan niet efficiënt plaatsvinden zonder itembank met minstens 150-200 items
Antwoord b dit omdat een computer moet items kunnen kiezen uit een grote verzamelig met
gevarieerde moeilijkheid.
Wat is juist.
A Weiss (1985) stelt dat een adaptieve test net zo lang moet zijn als een standaardtest om met
dezelfde nauwkeurigheid te meten.
B Weiss (1985) stelt dat een adaptieve test ongeveer half zo lang moet zijn als een standaardtest
om met dezelfde nauwkeurigheid te meten.
Antwoord b
Wat is juist Binnen onderwijs kunnen adaptieve testen gebruikt worden om:
a Bepalen of iemand al dan niet geslaagd is.
b Bepalen of iemands prestatie binnen de grenzen van een bepaald interval ligt.
c Bepalen of iemand in een bepaald leerstofgebied vooruitgang heeft gemaakt.
Antwoord: a b en c
Wat is juist.
A een ruwe score heeft veel betekenis.
B een ruwe score heeft meestal weinig betekening.
Antwoord b. als iemand zegt op het examen slechts vijf foute antwoorden te hebben gegeven dan
zegt dat aleen maar iets als men ook weet van hoeveel opgaven of voor hoeveel fouten een punt
werd afgetrokken.
De ruwe score heeft op zichzelf meestal weinig betekenis, maar men kan hieruit wel bewerkte scores
afleiden die gebaseerd zijn op:
- Het vergelijken met een absolute standaard.
- Deling door bvb leeftijd of schoolklas.
- De relatieve positie in een referentiegroep
De ruwe score heeft weinig betekenis als er geen referentiewaarde is. Welke 3 vergelijkingen
worden genoemd? P173 1)
1)Vergelijking met een absolute standaard
2) Gebaseerd op deling door bijvoorbeeld leeftijd of schoolklas
3) Gebaseerd op relatieve positie in een referentiegroep.
Opgelet: niet iedere bewerkte score heeft een norm karakter! Diverse bewerkingen staan los van de
prestaties van anderen (bvb aantal goede antwoorden omzetten in een rapport cijfer). Om te kunnen
spreken van testnormen is afhankelijkheid van de scores van anderen een voorwaarde.