ZekereVragen Flashcards
Welke uitspraak is waar?
A Je kunt de normen gebruiken om het eigen sterkte-/zwakteprofiel van de geobserveerde persoon te kennen.
B Je kunt de normen gebruiken om gemiddelden te berekenen.
C Je kunt de normen gebruiken om te weten of je correct observeerde.
D Je kunt de normen gebruiken om je eigen observaties met de schaal te vergelijken met de uitkomsten voor een geijkte groep.
A
VRAAG 2
De eerste wetenschappelijke of experimentele methode van beoordeling (cfr. Wundt) was
aanvankelijk vooral gericht op….
a) het gedetailleerd bestuderen van intra-individuele verschillen tussen kerst-; paas- en
juni-examens (bij kinderen van de lagere school).
b) het zoeken naar verklaringen voor extreem afwijkende scores (proefpersonen die
extreem hoog of extreem laag scoorden op de proef).
c) het ontdekken en meten van algemene wetmatigheden in de menselijke waarneming.
d) het onderzoeken van afwijkingen en inter-individuele verschillen tussen mensen op
grond van fysiologische reacties, zonder de intentie algemene wetmatigheden daaruit af
te leiden.
C
VRAAG 3 Een onderzoeker heeft besloten om de lengte van de proefpersonen (die deelnemen aan zijn sportonderzoek) te meten via de volgende vraag (inclusief antwoordmogelijkheden): Vraag: Wat is uw lengte? Duid één van onderstaande mogelijkheden aan. Antwoordmogelijkheden: □ ≤ 1,5 m □ tussen 1,5 m en 1,75 m □ ≥ 1,75 m Wat is het meetniveau van deze schaal? a) Dit is een interval schaal b) Dit is een ratio schaal c) Dit is een nominale schaal d) Dit is een ordinale schaal
D
VRAAG 4
Wat betekent standaardisatie als psychometrische voorwaarde waar psychometrische testen moeten aan voldoen?
a) Dat de inter- en intrabeoordelaarsverschillen minimaal moeten zijn.
2
b) Dat de resultaten zo nauwkeurig en stabiel mogelijk tot stand moeten komen.
c) Dat men effectief voldoende zeker is dat met meet wat de test bedoelt te meten
(doelmatig zijn).
d) Dat de beoordelingssituatie S zo constant mogelijk gehouden moet worden, zodat
verschillen in gedrag (G) ook werkelijk verschillen in eigenschappen (P) van een bepaald
individu representeren.
D
VRAAG 5
Bij het bepalen van een betrouwbaarheidsinterval maken we gebruik van de standaardmeetfout
(SFm). Vul aan: In 95 % van de gevallen ligt de ware score Xw binnen een afstand van ………………….
van de geobserveerde score Xt.
a) + en – (1,96 x SFm) van de geobserveerde score Xt.
b) + en – (3 x SFm) van de geobserveerde score Xt
c) + en – (2 x SFm) van de geobserveerde score Xt.
d) + en – (1 x SFm) van de geobserveerde score Xt
A
VRAAG 6
Niels werkt bij een testuitgever, en onderzoekt de psychometrische kenmerken van nieuwontwikkelde testen. Bij een persoonlijkheidstest wordt beslist om de betrouwbaarheid te onderzoeken via de halveringsbetrouwbaarheids-methode. Het afnemen en vervolgens halveren van de test in de helften A en B levert 2 testhelft-scorereeksen op. Hij berekent tussen die testhelftscorereeksen een correlatiecoëfficiënt rAB die +.73 bedraagt. Vervolgens beslist Niels om deze
betrouwbaarheidscoëfficiënt te corrigeren met de Spearman-Brown formule. Zal die betrouwbaarheidscoëfficiënt (+ .73) nà correctie hoger of lager uitvallen? (bereken en geef aan of dit
hoger of lager uitvalt)
a) De gecorrigeerde betrouwbaarheidscoëfficiënt rtt = + 0.90 en valt hoger uit dan de rhh.
b) De gecorrigeerde betrouwbaarheidscoëfficiënt rtt = + 0.84 en valt hoger uit dan de rhh.
c) De gecorrigeerde betrouwbaarheidscoëfficiënt rtt = +0.73 en valt lager uit dan de rhh.
d) De gecorrigeerde betrouwbaarheidscoëfficiënt rtt = - 0.84 en valt lager uit dan de rhh.
B
VRAAG 7
Jan behaalt op een test een totaalscore Xt = 10. Het (groeps)gemiddelde van deze test is 𝑋̅t = 7,37. De geobserveerde standaarddeviatie voor die test is st = 3,25. Is Jan’s score nu goed of slecht te noemen? We hebben een normscore (of standaardscore) nodig om zijn prestatie te beoordelen. In dit geval kiezen we ervoor om zijn ruwe score om te zetten in een T50-score.
a) De score van Jan is goed te noemen: met zijn specifieke score van +0.80, kunnen we
besluiten dat ongeveer 80% van de populatie een gelijke score behaalt (of lager) en dus dat
slechts 20% van de populatie hoger scoort dan hem.
b) De score van Jan is goed te noemen: met zijn specifieke score van +0.80, scoort hij duidelijk
bovengemiddeld, nl. bijna 1 standaarddeviatie (van 1) boven het gemiddelde van 0.
c) De score van Jan is goed te noemen: met zijn specifieke score van 58 scoort hij duidelijk
bovengemiddeld, nl. bijna 1 standaarddeviatie (van 10) boven het gemiddelde van 50.
d) De score van Jan is goed te noemen: met zijn specifieke score van 10 scoort hij duidelijk
bovengemiddeld, nl. bijna 1 standaarddeviatie (van 3.25) boven het gemiddelde van 7,37.
C
VRAAG 8
Mieke behaalt op een intelligentietest een totaalscore Xt = 71. Het (groeps)gemiddelde van deze test is 𝑋̅t = 100. De geobserveerde standaarddeviatie voor die test is st = 15. Is Mieke’s score nu goed of slecht te noemen? We hebben een normscore (of standaardscore) nodig om haar prestatie te beoordelen. In dit geval kiezen we ervoor om haar ruwe score om te zetten in een T50-score.
a) De score van Mieke is ondermaats te noemen: met haar specifieke score van - 1,933 kunnen we besluiten dat ze ruim ondergemiddeld scoort, nl. binaj 2 standaarddeviaties van 1 onder het gemiddelde van 0.
b) Mieke behaalt een T50-score van 31: dat betekent dat 31% van de populatie dezelfde score
als haar behaalt (of lager) en dat 69% van de populatie beter scoort dan haar. Dat zou betekenen dat haar particuliere score niet goed is.
c) De score van Mieke is niet goed te noemen: met haar score van 71 zit ze bijna 2 standaarddeviaties (van 15) onder het gemiddelde van 100.
d) De score van Mieke is duidelijk ondermaats te noemen: met haar specifieke score van 31 scoort zij duidelijk onder-gemiddeld, nl. bijna 2 standaarddeviaties (van 10) onder het gemiddelde van 50.
D
VRAAG 9
De vrienden Bart en Lowie behaalden op een verschillende subtest een ‘ogenschijnlijk vergelijkbaar resultaat’. Zowel Bart als Lowie pochen tegenover elkaar,en elk van beide beweert dat hij de beste score behaalde. Wie van beide heeft nu gelijk? Gegeven: De schaalscore voor Bart is Xt=14 (met 𝑋̅t=16,33; en st=2,80). De schaalscore voor Lowie is Xt=13 (met 𝑋̅t=11,20; en st=1,30). Bereken voor beide vrienden de lineair afgeleide standaardscore T10, en bepaal (op basis van hun Tscore) wie van beide het sterkste resultaat heeft neergezet en waarom.
a) De sterkste leerling is Lowie want zijn specifieke score van + 1.38 is méér dan 1 SD (van 1) boven het gemiddelde van 0, terwijl de specifieke score van Bart – 0.83 onder het gemiddelde ligt.
b) De sterkste leerling is Bart want zijn behaalde score (14) is hoger dan de behaalde score van Lowie (13), en ook het groepsgemiddelde ligt hoger bij Bart (16.33) dan bij Lowie (11.20)
c) De sterkste leerling is Bart want zijn T-score van 7,5 valt minder hoog uit dan de T-score van Lowie (nl. 14,15). Bart is met een score van 7,5 minder dan één SD (van 3) verwijderd van het gemiddelde van 10. Lowie is met zijn score duidelijk méér dan 1 SD verwijderd van het gemiddelde, dus Lowie is een zogenaamde ‘outlier’ (afwijkende score).
d) De sterkste leerling is Lowie want zijn T-score van 14,15 is duidelijk hoger dan de T-score 7,5 van Bart. Lowie scoort bovengemiddeld, nl. méér dan 1 SD (van 3) boven het gemiddelde van 10. Bart scoort ondergemiddeld, nl. hij scoort bijna 1 SD (van 3) onder het gemiddelde van
10.
D
VRAAG 11
Lode en Soetkin leggen dezelfde intelligentieproef af. Lode behaalt een geobserveerde testscore Xt =13. Soetkin behaalt een testscore Xt = 9. De SFm van deze intelligentieproef is 1,2.
a. Bepaal (voor beide proefpersonen) het 95% betrouwbaarheidsinterval (en vergelijk ze t.o.v. elkaar). Reken uit tot op 2 cijfers na de komma.
b. Bepaal wie van beide intelligenter is, en of de testscores werkelijk van elkaar verschillen?
a) Het 95%-betrouwbaarheidsinterval rond de testscore van Lode is [10,65 ; 15,35]. Het 95% betrouwbaarheidsinterval rond de testscore van Soetkin is [6,65 ; 11,35]. Als we 5 rekening houden met een 95%-zekerheidsniveau moeten we stellen dat hun scores niet
werkelijk van elkaar verschillen, maar dat het ogenschijnlijke verschil tussen die 2 geobserveerde testscores aan toevalsfouten te wijten moet zijn. Lode is niet intelligenter dan Soetkin.
b) Het 95% betrouwbaarheidsinterval rond 13 is [10,65 ; 15,35]. Dat betekent dat we met 95% zekerheid mogen beweren dat de ware score in dat interval zal liggen. Het 95%- betrouwbaarheidsinterval rond 9 is [6,65 ; 11,35]. De geobserveerde testscores 13 en 9 verschillen werkelijk van elkaar. Lode is intelligenter dan Soetkin.
c) Het 95%-betrouwbaarheidsinterval rond de testscore van Lode is [10,60 ; 15,40]. Het 95% betrouwbaarheidsinterval rond de testscore van Soetkin is [6,60 ; 11,40]. Als we rekening houden met een 95%-zekerheidsniveau moeten we stellen dat hun scores niet
werkelijk van elkaar verschillen, maar dat het ogenschijnlijke verschil tussen die 2 geobserveerde testscores aan toevalsfouten te wijten moet zijn. Lode is niet intelligenter dan Soetkin.
d) Het 95%-betrouwbaarheidsinterval rond de testscore van Lode is [11,80 ; 14,20]. Het 95% betrouwbaarheidsinterval rond de testscore van Soetkin is [7,80 ; 10,20]. Als we rekening houden met een 95%-zekerheidsniveau zien we dat beide betrouwbaarheidsintervallen elkaar overlappen. Lode is dus intelligenter dan Soetkin.
A
VRAAG 12
Beschouw de 2 volgende situaties:
In situatie A wordt een test afgenomen van 100 proefpersonen en deze toont een
geobserveerde standaarddeviatie st = 8. De standaardmeetfout van de test is se = 2.
In situatie B wordt een (andere) test afgenomen van dezelfde 100 proefpersonen en
toont eveneens een geobserveerde standaarddeviatie st = 8. De standaardmeetfout van
de test is hier se = 6.
In welke situatie verwacht je de grootste betrouwbaarheid (rtt), en leg uit waarom?
a) De test-betrouwbaarheid zal het grootst zijn in situatie A, want de standaardmeetfout is
daar het kleinst. Er is namelijk een omgekeerd verband tussen de betrouwbaarheid van
een test en de standaardmeetfout. Het is evenwel niet mogelijk om de betrouwbaarheid
(rtt) voor situatie A en situatie B concreet uit te rekenen, omdat bepaalde cruciale
gegevens hier niet gegeven zijn.
b) In situatie A (met rtt = +0.75) is 75% van de geobserveerde scorevariantie toe te schrijven
aan ware scorevariantie, en slechts 25% van de geobserveerde scorevariantie is toe te
schrijven aan errorscorevariantie. In situatie B (met rtt = +0.25) kan slechts 25% van de
geobserveerde scorevariantie toegeschreven worden aan ware scoreverschillen, en
maar liefst 75% van de geobserveerde scorevariantie is toe te schrijven aan
errorscorevariantie. De betrouwbaarheid is dus duidelijk groter in situatie A.
c) In situatie A (met rtt = +0.94) is 94% van de scores toe te schrijven aan ware scores, en
slechts 6% van de scores is toe te schrijven aan toevalsfouten. In situatie B (met rtt =
+0.44) kan slechts 44% van de scores toegeschreven worden aan ware scores, en maar
liefst 56% van de scores is toe te schrijven aan error. De betrouwbaarheid is dus groter
in situatie A.
d) In situatie A (met rtt = +0.94) is 94% van de geobserveerde scorevariantie toe te schrijven
aan ware scorevariantie, en slechts 6% van de geobserveerde scorevariantie is toe te
schrijven aan errorscorevariantie. In situatie B (met rtt = +0.44) kan slechts 44% van de
6
geobserveerde scorevariantie toegeschreven worden aan ware scoreverschillen, en
maar liefst 56% van de geobserveerde scorevariantie is toe te schrijven aan
errorscorevariantie. De betrouwbaarheid is dus groter in situatie A.
D
VRAAG 13 Bij een karaktervragenlijst met slechts 5 vragen wordt een betrouwbaarheid gevonden van + 0.57. Met hoeveel vragen (van dezelfde aard) moet deze test verlengd worden, om een gewenst niveau van betrouwbaarheid van .85 te bereiken. a) met ± 0,2 vragen b) met 1 vraag c) met ± 4 vragen d) met ± 21 vragen
D
VRAAG 14
Welke uitspraak is waar?
a) Een test kan slechts betrouwbaar zijn als ze ook valide is.
b) Validiteit is een noodzakelijke (maar geen voldoende) voorwaarde voor
betrouwbaarheid
c) Betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit, maar
betrouwbaarheid garandeert geen validiteit.
d) Als een test zeer betrouwbaar is, zal ze ook per definitie valide zijn.
C
VRAAG 15
Bij het onderzoeken van de validiteit van een test, maak je gebruik van een criterium. Binnen een
(relevant en betrouwbaar) criterium kan je verschillende niveau’s bedenken. Met welk niveau wordt
doorgaans ‘praktisch’ aan de slag gegaan bij het concreet uitvoeren van validiteitsonderzoek.
a) In validiteitsonderzoek wordt concreet aan de slag gegaan met het conceptueel
criterium
b) In validiteitsonderzoek wordt concreet aan de slag gegaan met de criteriumprestaties
c) In validiteitsonderzoek wordt concreet aan de slag gegaan met de criteriumscores
d) In validiteitsonderzoek wordt concreet aan de slag gegaan met criteriumgedragingen
C