Les 3 - Variabelen definiëren Flashcards
Wat is een variabele?
= kenmerken of condities die veranderlijk zijn voor verschillende individuen of situaties
Voorbeelden:
- effect van therapie op depressieve symptomen, verschil in job satisfactie van arbeiders VS bedienden in een bedrijf
- effect van onderwijsstijl op schools presteren
- invloed van alcohol op rijgedrag
- verschil in reactietijd op makkelijke versus moeilijke taak
Leg uit: Onafhankelijke Variabele (Predictor X)
= De verwachte oorzaak
- De voorspellende/verklarende variabele
- Variabele die gemanipuleerd wordt (in experimenten)
Leg uit: Afhankelijke variabele (
= Het verwachte effect
- De variabele die voorspeld/verklaard wordt
- Variabele die gemeten wordt, niet gemanipuleerd (in experimenten)
Wat is een concrete variabele?
= makkelijk te definiëren, direct observeerbaar, eenvoudig te meten
(e.g., lengte, leeftijd, uren wiskunde, score op statistiek)
= makkelijk te definiëren, direct observeerbaar, eenvoudig te meten
Wat is een abstracte variabele?
niet direct observeerbaar, complexer om te meten
🡪 e.g., motivatie, persoonlijkheid, leerstijl)
🡪 Voorb.: een intelligent kind presteert slecht op school omdat ze “lage motivatie” heeft
Leg uit: construct en betrek interne en externe stimuli in je antwoord.
In de psychologie zullen veel variabelen een construct zijn.
=> hypothetische entiteiten die we creëren op basis van theorie en speculatie.
=> Helpen het gedrag binnen een theorie verklaren en voorspellen.
1) Constructen kunnen vaak niet direct geobserveerd worden, maar we kunnen de factoren die het construct beïnvloeden (externe stimuli) en het gedrag dat door het construct beïnvloed wordt (extern gedrag) meten
2) Externe stimuli 🡪 construct 🡪 extern gedrag
Voorbeeld: Beloning (meetbaar) 🡪 motivatie 🡪 prestatie (meetbaar)
DUS:
constructen indirect meten adhv de externe stimuli en gedragingen die ermee verbonden zijn!
Leg uit: Theorie
= set stellingen over mechanismen onderliggend aan een bepaald gedrag.
=> organiseert en integreert verschillende observaties rond dit gedrag in relatie tot andere variabelen.
=> genereert predicties over het gedrag
Verklaar: operationele definitie en verklaar dit adhv een ‘IQ test’
= procedure om indirect variabelen te meten en definiëren die niet direct meetbaar zijn.
🡪 Specifieert een manier om extern, observeerbaar gedrag te meten
🡪 gebruikt vervolgens dit gedrag als definitie en meting van het hypothetisch construct
Toepassing: Intelligentie
= hypothetisch construct, niet direct observeerbaar/meetbaar!
MAAR: Intelligentie zal extern gedrag beïnvloeden dat wél observeerbaar/meetbaar is (e.g., prestatie op taken)
=> IQ test: meet extern gedrag, nl. antwoorden op vragen
We gebruiken de IQ test als operationele definitie van intelligentie: er bestaat een procedure om de test af te nemen en te scoren, en we gebruiken de geobserveerde score als definitie en meting van “intelligentie”
Eigenlijk meet IQ-test dus “intelligent GEDRAG”, maar we gebruiken de score om “intelligentie” te meten en definiëren
IQ-test om intelligentie te “operationaliseren”
Andere voorbeelden:
1) Persoonlijkheidstest om extraversie te operationaliseren
2) Aantal woorden van een lijst onthouden om lange termijn geheugen te operationaliseren
3) Examen om kennis te operationaliseren
Leg uit waarom de manier waarop je gaat operationaliseren belangrijk is.
Operationaliseringen zijn NIET hetzelfde als het construct zelf!
=> We meten nl. externe manifestaties, gedrag waarvan we HOPEN dat die een goede indicator zijn van de onderliggende constructen
Kwaliteit van de operationele definities en van de metingen die ze opleveren zijn dus cruciaal
Voorb: examen om kennis te operationaliseren, maar wat als student die dag ziek/vermoeid is?
Noem een vaak voorkomend probleem bij het opstellen van een operationele definitie en reik ook twee oplossingen aan.
operationele definities kunnen belangrijke componenten van een construct missen
=> Opl: meerdere operationele definities gebruiken om tot een brede, meer nauwkeurige operationele definitie te komen.
OF
=> bijkomende componenten meten die geen deel zijn van het construct
Hoe kom je tot een goede operationele definitie?
1) Consulteer vorig onderzoek:
=> hoe werd een bepaald construct gemeten?
2) Wees kritisch! Was dit een goede operationalisering en meting? Er zijn altijd andere procedures mogelijk!
=> Er is geen juist/fout, maar je moet heel wat beslissingen maken om te beslissen hoe je je variabelen gaat meten!
Welk hoger doel dienen validiteit en betrouwbaarheid?
1) Tot een goede methode komen om variabelen te meten?
2) Tot goede operationele definities en metingen komen
3) Een goede meting of meetprocedure uitvoeren.
Hoe kunnen we de consistentie tussen twee metingen nagaan?
1) Scatter plot (puntenwolk)
=> Plot relaties tussen metingen/variabelen
=> Plot de score van elke individu op één meting/variabele tov diens score op de andere meting/variabele
Correlatie
r=Covxysxsy=i=1nxi-xyi-y(N-1)sxsy
=> Varieert tussen
-1 : perfect negatieve relatie)
0 : geen relatie
+1 : perfecte positieve relatie)
Noem de 6 soorten validiteit op.
1) Indruksvaliditeit
2) Concurrerente validiteit
3) Predictieve validiteit
4) construct validiteit
5) convergente validiteit
6) divergente validiteit
Bespreek indruksvaliditeit
= “face validity”
Lijkt het erop dat de meting meet wat het beoogt te meten?
Ja? dan heeft ze ‘Face value’ = Subjectieve beoordeling
🡪oppervlakkig,
🡪op het eerste zicht
Voorb: gewicht meten adhv een weegschaal heeft hoge face validity. Gewicht meten met een meetlat heeft geen face validity
Bespreek concurrente validiteit
1) Vaak gebruikt voor nieuwe meettechnieken
2) Leent validiteit van ‘concurrentie’ door eraan verwant te zijn.
3) Zijn de scores die we bekomen met de nieuwe meting direct gerelateerd aan de scores doe we bekomen met een gekende, reeds gevalideerde methode (concurrentie)?
Voorb: nieuwe IQ test meet echt intelligentie, aangezien de scores op de nieuwe test individuen op dezelfde manier differentiëren dan de scores op een standaard IQ-test
Bespreek predictieve validiteit
1) Aangetoond wanneer de metingen van een construct accuraat het gedrag voorspellen (op basis van een theorie)
2) Kan de meting voorspellen wat het volgens de theorie moet kunnen voorspellen?
Voorb: meting om kinderen die risico hebben op ontwikkelen dyscalculie al vroeg te identificeren. Later nagaan hoe accuraat de voorspelling was
Bespreek construct validiteit
Gedraagt onze meting zich zoals we verwachten dat het construct zich gedraagt (op basis van wetenschappelijke literatuur)
=> Nooit absoluut!
Voorb: je hebt een meting voor agressie.
=> Uit vorig onderzoek weten we dat agressie gerelateerd is aan de buitentemperatuur.
=> Hangt onze meting ook samen met temperatuur?
=> Neen. Indien wel, lage construct validiteit want buitentemperatuur zou geen logische predictor zijn van agressie
convergente validiteit
Indien verschillende metingen van hetzelfde construct convergeren, sterk gerelateerde scores produceren
Bespreek: divergente validiteit
Indien metingen van verschillende constructen zijn weinig of niet gerelateerd aan elkaar
=> Het construct dat we meten, overlapt niet met andere constructen
Validiteit is vaak combinatie van convergente en divergente validiteit!
Wanneer is een meetprocedure betrouwbaar?
Een meetprocedure is betrouwbaar
=> wanneer ze (bijna) identieke resultaten oplevert
=> wanneer ze herhaaldelijk gebruikt wordt om hetzelfde individu onder dezelfde condities/omstandigheden te meten
Bespreek ‘consitentie’ binnen het kader van betrouwbaarheid
Consistentie van de metingen bekomen met een specifieke meetprocedure:
Gemeten score = Ware score + Fout (onnauwkeurigheid)
De fout component
varieert van de ene meting naar de andere
=> Over een groot aantal metingen heen moet de som van de fouten = 0
=> Indien fout component klein en de scores over verschillende metingen heen dus vrij consistent zijn
=> metingen betrouwbaar
Wat is de oplossing in dien de ‘fout’ groot is?
Fout is groot, dus lage betrouwbaarheid!
=> Oplossing? Reactietijd niet 1 keer meten, maar heel vaak (i.e., heel veel “trials”) en het gemiddelde over de trials gebruiken als meer stabiele maat voor reactietijd
Wat kan de ‘fout’ component voortbrengen?
1) Proefleider (“Observer”): verwachtingen, menselijk oordeel
2) Omgeving: omstandigheden waarin individu gemeten wordt zijn nooit identiek (e.g., tijdstip, seizoen, belichting, etc.)
3) Participant: participanten veranderen tussen metingen (e.g., focus, aandacht, honger, nachtrust, gezondheidstoestand, etc.)
Wat zijn de drie types van betrouwbaarheid?
1) test-hertestbetrouwbaarheid
2) Interbeoordelersovereenstemming
3) interne consistentie
Bespreek het betrouwbaarheidstype:test-hertest betrouwbaarheid
Test-hertest betrouwbaarheid:
=> in hoeverre geeft dezelfde meetprocedure dezelfde resultaten bij dezelfde groep participanten op verschillende tijdstippen?
E.g., correlatie tussen scores op moment 1 en scores op moment 2
Bespreek het betrouwbaarheidstype:Interbeoordelaarsovereenstemming
=> in hoeverre geeft dezelfde meetprocedure dezelfde resultaten bij dezelfde groep participanten gemeten door verschillende beoordelaars/proefleiders?
E.g., correlatie tussen scores van beoordelaar 1 en scores van beoordelaar 2
bespreek het betrouwbaarheidstype: interne consistentie
=> in hoeverre is er consistentie tussen vragen/items die samen 1 construct meten?
E.g., split-half betrouwbaarheid: items in 2 delen splitsen en correlatie tussen de scores op beide helften berekenen
Leg uit: betrouwbaarheid is een voorwaarde voor validiteit
een meetprocedure kan nooit valide zijn als ze niet betrouwbaar is
Voorb: IQ-test meting 1 = 75, IQ-test meting 2 = 160
🡪 onbetrouwbaar, deze metingen zijn geen goede operationalisering van intelligentie
🡪 niet valide
Leg uit: Een meting hoeft niet valide te zijn om betrouwbaar te zijn.
Voorb: intelligentie operationaliseren adhv lengte: uiteraard niet valide, maar wel betrouwbaar (scores zullen zeer consistent zijn over metingen heen)
=> Je kan dus eigenlijk vertrouwen hebben in de incorrectheid van de intelligentie op basis van de meting.
Wat beoogt men te doen als men meet?
= procedure om individuen toe te wijzen aan categorieën
Wat is een meetschaal?
Een set van categorieën
Waarvan hangt de keuze voor een bepaalde meetschaal af?
🡪 relatie tussen de categorieën waaruit de meetschaal bestaat
🡪 de informatie die elke meting oplever
Bespreek een nominale meetschaal
- Categorieën = kwalitatieve (geen kwantitatieve) verschillen binnen de gemeten variabele
- Categorieën hebben verschillende namen, maar geen systematische samenhang tussen de categorieën
=> Laat enkel toe om na te gaan of individuen gelijk zijn of verschillend (gelijkheid)
MAAR:
zegt niets over de richting van verschillen tussen individuen (geen meer/minder uitspraken)
zegt niets over de grootte van de verschillen tussen individuen
Voorb.: geslacht, beroep, studierichting, diersoort, hobby’s, etc.
Bespreek: Ordinale meetschaal
- Categorieën hebben verschillende namen en zijn georganiseerd in een geordende reeks
- Er bestaat dus een directionele relatie tussen de categorieën
- Laat enkel toe om na te gaan of individuen gelijk zijn of verschillend én wat de richting is van verschillen tussen individuen (meer/minder uitspraken; orde)
MAAR:
zegt niets over de grootte van de verschillen tussen individuen
Voorb.: medium and small coffee @ Starbucks, opleidingsniveau, kledingmaat, afstudeergraad (voldoende, onderscheiding, etc.)
Bespreek: interval meetschaal
- Categorieën zijn sequentieel georganiseerd én alle categorieën hebben dezelfde grootte
- Meetschaal bestaat dus uit een serie van identieke intervallen (cf. meetlat)
- Het is dus mogelijk om
=> de afstand tussen 2 punten op de schaal te bepalen
=> iets te zeggen over de grootte van de verschillen (verhouding van verschil) tussen individuen - Gelijke intervallen op de meetschaal representeren gelijke verschillen in de gemeten variabele
MAAR:
geen absoluut nulpunt, nulpunt is arbitrair, duidt niet de afwezigheid van de gemeten variabele aan (e.g., 0° ≠ geen temperatuur)
Voorb.meetlat, temperatuur (39° VS 37° is identiek aan 25° VS 23°)
Bespreek een ratio meetschaal
Idem als interval meetschaal, maar: absoluut, niet-arbitrair nulpunt
=> Nulpunt duidt de afwezigheid van de gemeten variabele aan
=> Betekent dat we de afstand tot 0 kunnen berekenen (i.e., absolute hoeveelheid van de variabele)
Laat ons toe om metingen te vergelijking in ratio’s (verhouding)
Voorb: een score van 10/20 is de helft van een score van 20/20 op een examen
Voorb: score op examen, hoeveelheden in liter/meter, lengte, gewicht, reactietijd
wat is het essentiële verschil tussen een interval en ratio meetschaal?
De keuze van een absoluut nulpunt. Nul in een ratio meetschaal is de afwezigheid van de gemeten variabele.
Wat zijn de drie meetmodaliteiten?
1) fysiologie
2) zelfrapportage
3) gedrag
Bespreek de voor-en nadelen van de meetmodaliteit ‘fysiologie’ en de bijbehorende validiteit
= Reacties van het lichaam als manifestaties van een onderliggend construct
vb: Angst 🡪 verhoogde hartslag en zweten (kan je meten adhv huidgeleiding)
Voorbeelden : EEG, fMRI, PET, pupil dilation, etc.
- Voordeel:
= zeer objectief - Nadeel:
apparatuur nodig, kan leiden tot artificiële context
Wat met validiteit? Veel fysiologische responsen zijn gelinkt aan verschillende constructen (e.g., verhoogde hartslag 🡪 angst, arousal, inspanning, etc.)
🡪 Meten deze metingen wel wat ze beogen te meten?
Bespreek de voor-en nadelen van de meetmodaliteit ‘zelfrapportage’ en de bijbehorende validiteit
Ja/nee vraag, beoordelingsschaal, vragenlijst, etc.
Voordeel:
directe manier om het construct te bevragen, individu als expert over zichzelf
Nadeel:
subjectief, sociale wenselijkheid, invloed van proefleider/instructies/omgeving, verstoorde antwoorden op gevoelige vragen, etc.
impact op validiteit!
Bespreek de voor-en nadelen van de meetmodaliteit ‘gedragsmaten’
Constructen tonen zich vaak in gedrag dat observeerbaar en meetbaar is
Voorb: reactietijd, aantal woorden correct herinnerd, prestatie op IQ-test, etc.
Gedrag kan ook het construct zelf zijn en dus direct observeerbaar/meetbaar (e.g., storend gedrag in de klas bij meisjes VS jongens)
Voordeel:
Zeer breed! Veel keuzemogelijkheden afhankelijk van de precieze situatie, hypothese, etc.
Nadeel:
kan tijdelijk of situationeel bepaald zijn
opl: meerdere gedragsmaten combineren.
Leg uit ‘meerdere metingen’ in het kader van andere aspecten van meten.
= Meerdere metingen om een construct te meten
Voorb: om het effect van angsttraining te meten bevragen we zelfgerapporteerde angst én meten we de hartslag
=> Voordeel:
verhoogt validiteit
=> Nadeel:
statistische analyses worden complexer, metingen kunnen elkaar tegengespreken (e.g., wat als zelfgerapporteerde angst daalt maar hartslag niet?)
Wat kan je zeggen over sensitiviteit en ‘range effects’ en de oplossing hiervoor?
Metingen moeten sensitief genoeg zijn om het type en de grootte van de verwachte veranderingen op te pikken
=> Kan men de meting wel waarnemen?
=> Zeker indien de verwachte veranderingen klein/subtiel zijn
Range effects (ceiling/floor effects): de scores zijn geclusterd aan één uiteinde van de meting
Voorb: participanten leggen een taak af die zo makkelijk is dat ze gemiddeld slechts 1.2% fouten maken
=> weinig ruimte voor verbetering, dus we gaan veranderingen in accuraatheid niet kunnen oppikken met deze taak
Voorb: depressietest bij gezonde mensen: antwoorden zullen rond de 0 liggen
Oplossing: piloteer je studie! Test je studie eerst uit op een kleine steekproef van representatieve individuen
(= pilootstudie)
Bespreek ‘artefacten’ in het kader van andere aspecten van meten.
= externe factor die de metingen kan beïnvloeden of vertekenen
=> Bedreigt de validiteit en betrouwbaarheid van de metingen
Bespreek het artefact ‘proefleider bias’ en de oplossing.
Proefleider bias (observer/experimenter bias):
=> verwachtingen kunnen metingen intentioneel of niet-intentioneel beïnvloeden (e.g., manier waarop instructies worden gegeven, omgang met participant)
Oplossing:
gestandaardiseerde procedures (vaste instructies, scripts, persoonlijk contact minimaliseren, single/double blinde experimenten)
Bespreek ‘vraagkarakteristieken’ in het kader van artefacten
= Demand characteristics
Participanten die weten dat ze geobserveerd/gemeten worden kunnen onverwacht reageren
De onderzoeksomgeving geeft vaak cues (vraagkarakteristieken) die suggereren wat het doel/hypothese is van de studie en welk gedrag gepast is of verwacht wordt
Invloed op metingen! Deelname aan een studie “verlangt” van de participant dat hij/zij meewerkt en instructies volgt, zelfs als dat indruist tegen gebruikelijk gedrag
gevaar voor validiteit en betrouwbaarheid
Bespreek participant reactiviteit en de 4 subject rollen.
Good subject rol: => trachten om gedrag te stellen dat de hypothese van de proefleider bevestigt
Negative subject rol:
=> trachten om gedrag te stellen dat de hypothese van de proefleider ontkracht
Apprehensive subject rol:
=> trachten zich sociaal wenselijk te gedragen in plaats van waarheidsgetrouw
Faithful subject rol:
=> volgen de instructies trouw op en laten zich niet beïnvloeden door hun vermoedens omtrent de hypothese van de studie
Bespreek het probleem van subject rollen in labaratorium studies versus veldstudies + geef 2 oplossingen
Vooral een probleem in laboratorium studies, omdat participanten er zich hier heel bewust van zijn dat ze deelnemen aan een studie
Soms minder een probleem in veldstudies, waar participanten geobserveerd/gemeten worden in hun natuurlijke omgeving waardoor ze minder reactief zijn
Oplossing: misleiding (deception)
=> vergt ethische reflectie
Oplossing:
=> Stel de participant gerust dat zijn/haar deelname anoniem en vertrouwelijk is en moedig aan om eerlijke antwoorden te geven (“reassure and relax”)
Bespreek populatie en sample
Uit de populatie (N) nemen we een steekproef (n)
=> met beschrijvende statistiek berekenen we resultaten die we dan omzetten naar algemene conclusies
=> met inferentële statistiek kunnen we die algemene conclusies weer linken aan de populatie.
Leg ‘steekproef bias’ uit.
Indien de steekproef andere karakteristieken heeft dan de populatie (e.g., sneller, ouder, slimmer)
=> steekproef BIAS
- Steekproef bias kan toevallig ontstaan
- Steekproef bias is vaak het gevolg van selectiebias
leg uit ‘selectiebias’
Selectiebias komt vaak voort uit de procedure die gebruikt wordt om participanten te selecteren
=> individuen worden geselecteerd op een manier die de kans vergroot op het verkrijgen van een gebiaste steekproef
Voorbeeld:
Populatie waarover we uitspraak willen doen = volwassenen
Steekproef: universiteitsstudenten, Facebook gebruikers
🡪 Zijn dit representatieve steekproeven?
Neen: lage validiteit
Hoe groot moet de steekproef zijn om representatief te zijn? = steekproefgrootte of sample size (n) en wat is het doel ?
Geen eenvoudig antwoord
Algemeen: “hoe groter de steekproef, hoe accurater deze de populatie representeert”
MAAR: ook een zeer grote steekproef kan gebiast zijn!
Baseer je op wetenschappelijke literatuur over gelijkaardige studies
Bereken n (cf. online calculator G*Power)
Het “trekken” van een steekproef uit de populatie = steekproeftrekking of sampling
Doel is steeds om een representatieve steekproef te trekken uit een populatie
Noem de twee categorieën van methoden van steekproeftrekking
1) Probability sampling
2) Nonprobability sampling
Benoem de drie voorwaarden voor probability sampling
De kans (“probability”) om een specifiek individu te selecteren is gekend en kan berekend worden
E.g.: N = 100
Elk individu 1/100 kans om geselecteerd te worden
3 voorwaarden:
1) De exacte grootte van de populatie is gekend en het moet (theoretisch) mogelijk zijn om alle individuen op te lijsten
2) Elk individu in de populatie heeft een gespecifieerde kans om geselecteerd te worden
3) Selectie moet een random proces zijn gebaseerd op de kansen
Wat zijn de 5 vormen van random sampling?
1) simple random sampling
2) systematische sampling
3) gestratificeerde random sampling
4) proportioneel gestratificeerde random sampling
5) cluster sampling
Bespreek ‘simple random sampling’
==> Vermeld de drie stappen
==> Vermeld de twee methoden
Elk individu in de populatie heeft evenveel kans om geselecteerd te worden
Elke selectie is onafhankelijk van de andere selecties
de selectie van één individu heeft geen invloed op de kans om een ander individu te kiezen
3 stappen:
2) Definieer de populatie
2) Lijst alle leden van de populatie op
3) Gebruik een random proces om individuen uit de lijst te selecteren
Twee methoden van random steeproeftrekking:
Met teruglegging:
=> individu dat geselecteerd wordt voor de steekproef wordt als deel van de steekproef genoteerd, en dan teruggelegd in de populatie
Garandeert dat de kans om geselecteerd te worden identiek blijft doorheen het selectieproces
Kansen blijven constant (e.g., 1/100), waardoor onafhankelijkheid van de selecties verzekerd is
Zonder teruglegging:
=> individu dat geselecteerd wordt voor de steekproef wordt als deel van de steekproef genoteerd, en dan verwijderd uit de populatie
Garandeert dat geen enkel individu meer dan 1 keer in de steekproef voorkomt
Maar: bij elke verwijdering van een individu, veranderen de kansen (e.g., 1/100, 1/99, 1/98, etc.) waardoor de selecties niet onafhankelijk zijn
Let op: kans bepaalt elke selectie
Bij vele selecties levert dit een representatieve steekproef op
1000 keer munt opgooien: gemiddeld 50% kop en 50% munt
1000 mensen uit populatie trekken: ongeveer helft mannen en helft vrouwen
MAAR: bij slechts enkele selecties is het mogelijk dat de steekproef niet representatief is
slechts 5 keer munt opgooien: 5 keer kop is mogelijk (hoewel onwaarschijnlijk)
10 mensen uit populatie trekken: steekproef met 10 mannen is mogelijk
Oplossing: bijkomende restricties opleggen (zie methoden 3 en 4)
Wat is systematische sampling?
Gelijkaardig aan simple random sampling
Startpunt = random
zelfde procedure als simple random sampling om
1e individu te selecteren
Nadien: geen random proces meer om andere individuen uit de populatie te selecteren elk kde individu wordt geselecteerd
k = N/n
Voorbeeld:
N = 100
n = 25
k = 100/25 = 4 🡪 elk 4e individu wordt geselecteerd
=> Minder random
=> Garandeert hoge mate van representativiteit
Leg uit: gestratificeerde random sampling. Vermeld de 3 stappen de 2 nadelen.
Populatie bestaat vaak uit subgroepen (“strata”)
Representatieve steekproef betekent vaak dat we willen garanderen dat elk van de subgroepen adequaat vertegenwoordigd is in de steekproef
3 stappen:
1) Identificeer de subgroepen
2) Selecteer random steekproeven van vergelijkbare grootte uit elk van deze subgroepen (n1 ≈ n2 ≈ n3 ≈ …)
3) Combineer de subgroep steekproeven tot 1 steekproef = gestratificeerde random steekproef
=> Nuttig wanneer je groepen uit de populatie wil bestuderen en vergelijken
Voorbeeld:
Hypothese: mannelijke 1e bachelor Psychologie studenten presteren beter op Statistiek I examen dan vrouwelijke 1e bachelor Psychologie studenten
Simple random sampling: kans is groot dat we meer vrouwen dan mannen in onze steekproef gaan hebben
Oplossing: gestratificeerde random sampling om een steekproef te bekomen met evenveel mannen en vrouwen
Nadelen:
1) Vertekend beeld van de populatie (cf. voorb hierboven)
2) Elk individu uit de populatie heeft niet meer evenveel kans om geselecteerd te worden (cf. voorb hierboven) ≠ random
Bespreek ‘cluster sampling’ alsook het bijbehorende voordeel en bedenking.
Groepen selecteren ipv individuen
Voorbeeld: in plaats van 300 lagere schoolkinderen random te selecteren, 10 klassen selecteren met telkens 30 kinderen
Voordeel: Snel en eenvoudig grote steekproef bekomen, metingen in groep ipv individueel
MAAR: onafhankelijkheid?
Bespreek non probablitity sampling en het doel.
= De kans om een specifiek individu te selecteren is NIET gekend
- De grootte van de populatie niet gekend is en het is dus niet mogelijk om alle individuen op te lijsten
- De methode van selectie is gebiast, waardoor de kans op het verkrijgen van een gebiaste steekproef groter is
Doel = representativiteit zo veel mogelijk behouden en bias zo veel mogelijk vermijden
Wat zijn de twee vormen van non probability sampling?
Convenience sampling
quota sampling
Bespreek de non probability sampling vorm: convenience sampling (voor-en nadeel)
Vaak gebruikt in de psychologie
“Convenience”:
=> we gebruiken de steekproef waar we toegang toe hebben, die bereid zijn deel te nemen, etc.
Voorbeeld: studenten die deelnemen aan experimenten voor course credit, kinderen uit lokale school
Oproep om deel te nemen aan survey 🡪 wie antwoordt hierop? Representatief?
Vereist geen kennis van de hele populatie, gebruikt geen random proces
Nadeel: Kans op steekproef bias is groot
Voordeel: snel, goedkoop, minder tijdsintensief dan probability sampling
Hoewel geen garantie op representatieve steekproeven, strategieën om bias zo veel mogelijk te vermijden
Convenience sample trachten zo representatief mogelijk te houden, brede doorsnede (leeftijd, geslacht, etc.): studenten KU Leuven ≈ studenten UGent
Let op met locaties met unieke, ongebruikelijke karakteristieken (e.g., scholen in stad VS platteland)
Rapporteer grondig hoe de steekproef tot stand kwam zodat iedereen de representativiteit kan beoordelen!