normen in psychologische testen Flashcards
Waarom gaan we vergelijkingsschalen gebruiken?
- Interpreteren van waarneembaar gedrag
->Wat willen we bekomen als we het gedrag interpreteren? - Doel: het gedrag allemaal op zelfde manier interpreteren
- Omzetten van kwantitatieve ruwe score naar kwantitatieve gestandaardiseerde score
->Je wil dat iedereen die ruwe score op zelfde wijze interpreteert - Verschillende testen hebben ook verschillende ruwe scores ->Bij 1 test kan een ruwe score van 5 heel hoog zijn, bij een andere heel laag
- Verschillende soorten afgeleide standaardscores zijn gebaseerd op verschillende vergelijkingsschalen
- Vergelijkingsschaal: ruwe score omzetten naar standaardscore
Welke vergelijkingsschalen heb je?
- normgerelateerd
- criteriumgerelateerd
- persoonsgerelateerd
Leg uit normgerelateerde vergelijkingsschaal
- Vergelijken van de score client met een algemene of specifieke normgroep -> hoe heeft client gescoord tegenover normgroep (zeer laag – laag – gemiddeld – hoog- zeer hoog)
- Algemene normgroep of steekproef vb Vlaamse populatie of alle Belgen -> heel groot
->Je kan nooit iedereen van Vlaamse populatie bevragen
->Daarom steekproef uit populatie nemen = normgroep - Specifieke normgroep of steekproef vb leerling uit 2e leerjaar vergelijken met z’n klasgenoten -> veel kleiner en is specifieke groep
Wat zijn de kwaliteitsvereisten van een normgerelateerde vergelijkingsschaal?
- Voldoende groot
->Minimum tussen 300 – 400 personen
->Moet representatief zijn: spiegel zijn van populatie
->Moet voldoende divers zijn: - Geldigheidsduur (Flynn effect)
->Normen moeten om de 15 jaar vernieuwd worden
->Je wil resultaten van client het liefst vergelijken met recente resultaten van normgroep ipv resultaten van 30 jaar oud
->Flynn effect: over de generaties is er een stijging van intelligentie door verbeterd onderwijs, hogere welvaart, voeding enz. - Lokale normen
->Vlaamse client vergelijken met andere Vlamingen -> representatief
->Best vergelijken met mensen die zoveel mogelijk aa->sluiten
->Vele testen hebben geen Vlaamse normen maar Engelse
->Sluiten dicht bij ons aan maar vergelijkingen niet zomaar aannemen -> klinisch benaderen
Wat is een criteriumgerelateerde vergelijkingsschaal?
Minder gebruikt-> vooral in onderwijslandschap
- Vergelijken van client met op voorhand vastgelegd doel/criterium/absolute norm
Voorwaarden
->Zicht op de te bereiken doelen/criteria
->Op welke prestaties/gedrag ga je meting baseren
Wat zijn persoonsgerelateerde vergelijkingsschalen?
- Vergelijken van client met door de client eerder behaalde resultaten (= ipsatieve vergelijking)
->In verleden heb je al testen ondergaan: resultaten van toen vergelijken met die van nu
->Minder gebruikt
->Vb gelijktijdige meting van 2 aparte eigenschappen van persoon of 2 metingen van zelfde eigenschap op ander moment
->Gelinkt aan vorderingstesten/interessetesten
Wat is het doel van een standaardscore?
zorgt ervoor dat iedereen de scores op zelfde manier interpreteren
Op welke andere manieren kan je waarneembaar gedrag interpreteren?
- Beschrijven van ruwe scores van normgroep
- Berekenen van centrale tendentie
- Iemands positie berekenen binnen groep
- Berekenen van spreiding
Wat zijn de 3 stappen om een ruwe score van een normgroep te beschrijven?
- Stap 1 Frequentieverdeling
->Dit is de fundering – wetenschappelijk onderbouwd
->Je maakt overzicht van respondenten en hun scores
->Nodig om berekeningen zoals scheefheid te kunnen maken
->Tonen hoe vaak waarnemingen voorkomen
Onderscheid tussen
->Absolute frequentie: hoe vaak komt een waarde voor in absolute aantallen
->Relatieve frequentie: absolute frequentie in %
- Stap 2 grafische voorstelling
->De plek waar de meeste scores liggen, daar ligt ook het gemiddelde
->Voornamelijk normaal of klokvormige verdeling - Stap 3: is er een normaalverdeling?
->In 1 oogopslag maak je duidelijk hoe de testresultaten zijn verdeeld
->Goeie manier om datasetting samen te vatten
->GAUSS curve
->Kan iets zeggen over de scheefheid van verdeling (links of rechts)
Welke verdeling heb je bij skewness of scheefheid?
Scheef: hoge top aan linker of rechterkant + andere kant vlakt uit in vorm van staart
Rechtsscheef: veel lage scores en staart van verdeling ligt rechts
Linksscheef: veel hoge scores en staart van verdeling ligt
Normaalverdeling: meeste scores liggen in het midden of rond gemiddelde vb IQ
->Weinig extreem hoge en lage scores
->klokvorm
Waarom bereken je de centrale tendentie?
- willen individuele scores vergelijken met de normgroep
* Centrale tendentie
= rond welke waarde zijn meeste scores gegroepeerd
->hoe ver van het gemiddelde ligt de score van client? Gebruik van centrale tendentie
->score ligt boven/onder gemiddelde
->Meer gedetailleerd dan ruwe score
->Toont welke waarneming het meest voorkomt in steekproef
* Maakt onderscheid tussen
->Vaak voorkomende waarden
->Uitzonderlijke waarden
**Afhankelijk van meetniveau **
->Modus= nominaal -> waarde die het meest voorkomt = hoogste frequentie
->Mediaan= ordinaal
->Rekenkundig gemiddelde= minimum interval
Waarom bereken je iemands positie in groep?
Percentiel: positie van score client specifieker maken
->= welk % van de groep behaalde een score van minder dan of gelijk aan de score van client
- Toont waar client zich bevindt in steekproef
**2 soorten **
* Cumulatieve frequentie tegenover het totale aantal groepsleden
->Hoeveel respondenten bekomen een score en lager
* Percentielen
->Cumulatieve frequentie in %
**Verschillende varianten **
* Percentielen
->Meest gebruikt
->Heel gedetailleerd en exact
->Geeft in % aan waar iemand z’n score zich bevindt in vergelijkingsgroep
* Decielen
* Kwartielen
* Klasse indeling (van 1 tot 5)
->Opgedeeld in delen van 10 tot 40%
->Klasse A= bovenste 10% van score
->Klasse B= 20 % onder A
->Klasse C= middenmoot
->Klasse D=20% onder C
->Klasse E= onderste 10%
Wat is spreiding?
- Toont in hoeverre individuele scores afwijken van gemiddelde of scores van anderen
- Hoe groter de spreiding hoe meer variatie tussen individuele scores
- Spreiding helpt bij inschatting
->Weinig spreiding enkel scores tussen 80-100
->Grote spreiding scores tussen 60 en 150
Wat zijn de verschillende spreidingsmaten?
- Variatiebreedte/range -> weinig gebruikt
->Hoogste score – laagste score
->Je houdt enkel rekening met 2 waarden
->Heel extreem hoge en lage waarden zorgen voor vertekening - Variantie
->Kwadraat van standaarddeviatie
->Gaat hele frequentieverdeling/alle testgegevens bekijken
->Uitspraken doen over steekproef en generaliseren naar populatie
->Verfijndere inschatting
Formule (alle individuele waarnemingen – gemiddelde)² / aantal respondenten
- Standaardafwijking/standaarddeviatie
->Vierkantswortel van variantie
->Focus van spreiding van ruwe scores tov gemiddelde
->Gemiddelde afwijking tegenover rekenkundig gemiddelde
Wat zegt de standaardscore?
- Percentiel zegt waar individuele score van client in groep ligt
->Geen goed zicht op werkelijke prestatie client
->Maken geen vergelijking met groepsgemiddelde - Standaardscore zegt waar individuele score zich bevindt in hele groep
Wat is een Z score?
- Hoe sterk/laag presteert iemand tegenover groepsgemiddelde
->Gemiddelde 0
->Standaardafwijking 1 - Neutrale schaal om tot gestandaardiseerde interpretatie te komen
- Zegt hoeveel standaarddeviatie iedere uitslag boven/onder gemiddelde ligt
Wanneer gebruiken?
->Intelligentietesten vergelijken als ze gebaseerd zijn op verschillend gemiddelde/standaardafwijking
Formule Z score: ruwe score – gemiddelde/standaardafwijking
Wat zijn de andere standaardscores?
- T score
->gemiddelde 50 en standaardafwijking 10 - C score
->gemiddelde 5 en standaardafwijking 2 - Stanines
->gemiddelde van 5 en standaardafwijking 2
->Normale verdeling in slechts 9 categorieën
->loopt gelijk met C score maar categorie 0 en 10 worden eraf geknipt en versmelten met categorie 1 en 9 - IQ gemiddelde 100 en standaardafwijking 15
- Deviatie IQ
->Verstandelijke leeftijd gedeeld door kalenderleeftijd * 100 - Wechsler schaalscore
Wat is een betrouwbaarheidsinterval?
- zone waarbinnen gemiddelde van populatie moet liggen
- Tonen interval rond geobserveerde score waarin betrouwbare score van individu met bepaalde waarschijnlijkheid zal vallen
Waaruit bestaat een betrouwbaarheidsinterval?
- Testresultaat van client
- Zekerheidspercentage van Z score
->90% z: meer informativiteit maar ten koste van zekerheid -> 10% kans op foute inschatting
->95%: balans tussen informativiteit en zekerheid -> meestal hiervoor kiezen
->99%: heel veel zekerheid maar ten koste van informativiteit - Standaardafwijking
Hoe bereken je onder en bovengrens?
- Ondergrens altijd aan linkerkant curve
->Formule: score client- (betrouwbaarheidsinterval*standaardafwijking) - Bovengrens altijd aan rechterkant curve
->Formule: score client + (betrouwbaarheidsinterval* standaardafwijking) - 95% kans dat score tussen 2 punten ligt
->5% kans dat het er niet tussen ligt dus 2,5% kans dat het onder de ondergrens ligt en 2,5% kans dat het boven de bovengrens ligt
Ligt de boven en ondergrens dicht bij elkaar hoe betrouwbaarder de test
Wat is het belang van betrouwbare/valide testen?
Hoe betrouwbaarder en valider je test, hoe minder kans op meetfouten + hoe kleiner de standaardafwijking + hoe exacter het meetresultaat