5. Afneming van tests en verwerking van testgegevens Flashcards

1
Q

Hoe is Diagnostisch toetsen opgebouwd?

A

Testen van deelvaardigheden om de mate van beheersing van hoofdvaardigheid te toetsen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Adaptief testen: waarvoor wordt het gebruikt?
Hoeveel items nodig in databank?
Nauwkeurigheid volgens Weiss (1985)?

A

Adaptief testen: Testen op maat. Wordt gebruikt om te zien of:

  • iemand geslaagd is.
  • iemand vooruitgang heeft geboekt.
  • Geeft meer nauwkeurig beeld dan klassiek testen.
  • Minimaal 150 -200 in itembank noodzakelijk.

Volgens Weiss (1985) is adaptief testen met helft van lengte gewoon testen even nauwkeurig. Schatting van nauwkeurigheid wordt steeds beter bij ieder item.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  • Het ‘moderne-complex’ volgens van der Linden (1983)

* Standaardtest en succeskans? Voor wie slecht meet instrument?

A
  • Het ‘moderne-complex’: Het modern testen met computer adhv databanken en item-responstheorie.
  • Standaardtest: klassieke wijze van testen waarbij iedereen dezelfde test krijgt. Veel items hebben subjectieve succeskans die ver van 0.5 afwijkt.
    Slecht meetinstrument voor mensen met extreem lage en hoge meetwaarden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  • Verschil tussen bewerkte score en norm?
  • Wat is de voorwaarde voor een testnorm?
  • Welke 3 zaken zijn belangrijk bij normonderzoek?
  • kenmerken
  • niet absoluut
  • analyse
  • Hoe heet vergelijken met norm in Engels en Nederlands?
A

Niet iedere bewerkte score heeft een norm (de verhouding van de ruwe score in de populatie en worden geschat op basis van een representatieve steekproef).

Voorwaarde Testnorm; de score van anderen (de populatie). Klas of groep sollicitanten is nog geen norm.

3 belangrijke zaken bij normonderzoek:

  • Vermelden van specifieke kenmerken van normgroep.
  • norm is niet absoluut maar verandert met groep mee. Bv met overnemen van norm uit oorspronkelijk taalgebied.
  • Analyse van de te meten doelen bij normatief meten essentieel evenals de vraag of deze doelen op betrouwbare manier te meten zijn.

Vergelijken van testprestatie met norm heet: norm-referenced measurement of absoluut en normatief meten. (Is dus wat anders dan de absolute standaard).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Absolute standaard (criterion-referenced measurement).

A

Vergelijking van testscore (met absolute norm) zonder de beoordeling van anderen (zoals een klas of populatie) hierbij te betrekken. Denk aan repetitiebeoordelingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat zijn Verhoudingsnormen en hoe komen ze tot stand?

A
Testscore wordt gedeeld door andere variabele zoals leeftijd of klasse en daardoor onafhankelijk gemaakt van variabele. IQ is bekendste.
#verhouding met een andere vrouw. Sowieso delen door leeftijd.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Basale leeftijd bij meten van IQ

A

Leeftijd waarop geen fout meer wordt gemaakt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is rangordening, wat is de bekendste en wat is een zwakte?

A

Rangordening: Eenvoudigste vorm van vergelijken van individuen adhv testprestaties. Bewerkte score is het rangnummer dus score 1 eerste positie enz.

  • Geen norm omdat het niet met populatie vergeleken wordt. Dit is zwakte van rangscores/ ordening.
  • Bekendste vorm zijn percentielen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat zijn Percentielscores en percentielnormen en wat is het meetniveau?
Wat is het verschil en wat zijn de bekendste?
Waarvan zijn ze afhankelijk en onafhankelijk?
Waarvoor gebruikt?
Hoe worden percentielscores berekend adhv Vb: stel 28% heeft ruwe score van 61 of lager en 34% 62 of lager.

mogen gemiddelde en variantie berekend worden?
Vorm van de frequentieverdeling van percentielscores? Decielen en ventielen?

A
  • Percentielscores:
  • Meetniveau is ordinaal.
  • Bekendste vorm van rangordening; P50 (mediaan), Q1 (kwartiel 1).
  • Onafhankelijk van groepsgrootte, afhankelijk van niveau, spreiding en andere kenmerken van de groep.
  • Binnen groep met zelfde ruwe score kan men geen verschil in percentielscore geven.
  • Berekend (liniare interpolatie): Vb: stel 28% heeft ruwe score van 61 of lager en 34% 62 of lager. 6% heeft dan ruwe score van 62. Bijbehorende percentielscore is:
    28+0.5(34-28) = 31.
  • Mag geen gemiddelde of variantie berekend worden.
  • Frequentieverdeling: gelijk en rechthoekig van vorm ongeacht de vorm van de verdeling van de ruwe score. Decielen = 10, ventielen = 20.
  • Percentielnormen:
  • Meetniveau is ordinaal.
  • Onafhankelijk van kenmerken van de groep.
  • Schatting van de verdeling in de populatie.

Handig voor snelle indicatie. Te grote tekortkomingen voor wetenschappelijk onderzoek.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Verschil tussen standaardscores en standaardnormen. Z-scores normaal verdeeld? En wat zijn lineaire transformaties en hoe te berekenen?

A
  • Standaardscores; (z-scores) wanneer ruwe scores worden omgerekend naar standaardscore-eenheden.
  • Standaardnormen; wanneer het gaat om een representatie van de populatie.
  • Misverstand dat z-scores standaard normaal verdeeld zijn. Een niet normale verdeling blijft na standaardisatie niet normaal verdeeld. Behouden op gemiddelde en standaarddeviatie na zelfde kenmerken als de ruwe score.
  • Lineaire transformaties; wanneer gemiddelde van getransformeerde score op 100 of 50 wordt gezet om negatieve of kleine getallen te voorkomen.
    Te berekenen door met een constante te verminderen of vermeerderen én door een constante delen of met een constante vermenigvuldigen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Xc (corrected) score betekent?

  • 4 bezwaren van gebruik van gis-/ toevalscorrectie:
  • onder- en overcorrectie?
  • Variantie Xc ivm X?
  • Wel of niet gebruiken?
A

Xc: Aantal goede antwoorden dat door kennis tot stand is gekomen.

  • 4 bezwaren gis-/toevalscorrectie:
  • Overcorrectie: In de uitzonderlijke situatie dat partiële kennis niet bestaat. Bv door een erg verleidelijk of suggestieve antwoordmogelijkheid.
  • Ondercorrectie betekent: dat Xc eigenlijk lager had moeten uitvallen. Bv doordat van 4 antwoordmogelijkheden er 2 worden weggestreept omdat die het zeker niet zijn. Door te gokken toch de juiste van de 2 mogelijke antwoorden beantwoord heeft.
  • Xc heeft grotere variantie dan X
  • Sommige personen vallen door giscorrectie onder aftestgrens en zakken voor tentamen.

gis-/toevalscorrectie beter niet gebruiken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

In een formule staan K, g, Xg voor?

A
K = aantal items
g = identificatienummer van een item
Xg = score op een item
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Formule voor berekenen van IQ, functie en 4 kritische kanttekeningen

A

IQ = ML (mentale leeftijd) / CL (Chronische leeftijd) X 100

Functie van IQ vooral informatief om te weten of een kind voor of achter loopt. Intelligentie wordt hierdoor een ontwikkelingsbegrip.

Kanttekeningen:

  • ML en CL wekt suggestie dat het vergelijkbare grootheden zijn, maar dat zijn ze niet. ML = testscore en CL is leeftijd.
  • IQ vertoont bij ontwikkeling grote schommelingen bv door lichamelijke, fysiologische factoren of emotionele bereidheid.
  • Oudere mensen zijn in het nadeel doordat in IQ-ratio de noemer gelijk en maximaal blijft
  • IQ voldoet niet aan eis van evenredig toenemende spreiding. Vb: leerachterstand van een jaar op 6-jarige leeftijd is 2x zo erg als op 12 jaar.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat zijn (meest voorkomende) genormaliseerde standaardscores? En hoe zijn deze verdeeld? Gerechtvaardigd?

A
  • T-scores:
  • Zet ruwe scores om naar T-score.
  • Gemiddelde van 50 met een spreiding van 10. Verdeling ligt tussen 20 en 80.
  • Sommige scores worden uitgerekt en anderen ingedrukt.
  • Normalisering bv bij 2 toppige verdeling kan niet gerechtvaardigd worden omdat werkelijkheid teveel geweld wordt aangedaan. Hooguit voor gemak (intervalschaal) en bruikbaarheid.
  • Stanines: 9 eenheden die passen in kolom van IBM-ponskaartje. Vertegenwoordigt een 0,5Sx
  • Deviatie-IQ: standaardnormen met gemiddelde van 100. Leeftijdsklasse verwerkt tot genormaliseerde standaardscores (score-WAIS).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat geeft iemand zijn percentiel weer? En hoe is de verdeling van mensen in een links scheve verdeling?

A

Het percentage personen dat lager scoort dan de desbetreffende persoon.

Bij een linksscheve verdeling zitten meer mensen rechts van het midden en zijn hier de verschillen het kleinst, terwijl links van het midden de verschillen het grootst zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is test-wiseness?

A

Test-Wiseness is kennis vooraf van proefpersoon over test bv vanuit een boek of oefenmateriaal.

17
Q
  • Wat is een objectieve testsituatie en standaardisatie? Wat valt hieronder?
  • Invloed van proefleider? Waarbij het meest? Welke houding dient hij aan te nemen? Bij open-vraagvorm?
  • is Validiteit gewaarborgd met 2 testleiders?
A
  • objectieve testsituatie:
    een gestandaardiseerde situatie, waarin de onderzochten in maximaal gelijke omstandigheden worden getest.
  • Goed uitgewerkte instructies en eis aan proefleider om zich hieraan te houden.
  • Weren van opvallende omgevingsinvloeden
  • proefleider:
  • speelt vooral bij individuele test vanwege de mate van wisselwerking tussen onderzochte en testleider.
  • Grote vergelijkbaarheid en objectiviteit wordt bereikt door zo normaal mogelijke relatie op te bouwen, met positieve, stimulerende en vriendelijke toon.
  • ‘Doen alsof’ van de aangeduide weg.
  • Bij open vraagvorm: maak gebruik van conderingssysteem. Bv checklist.
  • validiteit:
    Hoge overeenstemming van twee beoordelaars is niet per se valide omdat ze beide verkeerd gedrag meten. Overeenstemming is noodzakelijk, maar niet voldoende voorwaarde voor validiteit.
18
Q

Wat te doen bij onbevredigende betrouwbaarheid en validiteit? Wegen van items?

A
  • Meer items opnemen voor verhogen betrouwbaarheid
  • Beter nadenken inhoud items voor verhogen validiteit.
  • Wegen van items wordt afgeraden. Leidt vrijwel nooit tot meer info over individu.
19
Q

Waar staat de ruwe score voor? Wat zegt het? Wanneer niet is omzetting naar bewerkte scores niet noodzakelijk?

A

Ruwe score: staat voor verschillende zaken zoals:

  • goede of foute antwoorden
  • aantal keer ‘ja’
  • somscore van attitudelijst
  • etc.
  • Ruwe score zegt niks zolang je bv niet weet om hoeveel opgave het gaat of voor hoeveel fouten een punt wordt afgetrokken.
  • Omzetten naar bewerkte scores niet noodzakelijk als men voor onderzoeksdoeleinde geïnteresseerd is in de samenhang tussen testscores en criteriumscores. Correlatie tussen ruwe score is afdoende om vraag naar samenhang te beantwoorden.
20
Q

Onderzoeken van een hypothetische eigenschap?

A

Kan nooit op kenmerken onderzocht worden.