Thema 5: Participanten bepalen Flashcards
Populatie
- Gehele groep waarin we geïnteresseerd zijn
- e.g., alle mensen, alle adolescenten, alle leerkrachten in Vlaanderen)
Steekproef
Subset v individuen uit populatie die de populatie representeert in een studie
- data van steekproef veralgemenen naar populatie
Representatieve steekproef
Om uitspraken te doen over populatie moet de steekproef dezelfde karakteristieken hebben dan de populatie
Steekproef bias
- Indien de steekproef andere karakteristieken heeft dan de populatie (e.g., sneller, ouder, slimmer)
- Vaak gevolg van selectiebias
Selectiebias
Individuen worden geselecteerd op een manier die de kans vergroot op het verkrijgen van een gebiaste steekproef
Steekproefgrootte
- Moeilijk antwoord
- Law of larger numbers: hoe groter steekproef, hoe accurater deze de populatie representeert
- MAAR grote steekproeven kunnen ook gabiast zijn
=> berekenen van n of zich baseren op voorgaande wetenschappelijke literatuur
Probability sampling
De kans (“probability”) om een specifiek individu te selecteren is gekend en kan berekend worden
3 voorwaarden van probability sampling
- Exacte grootte van populatie is gekend en moet (theoretisch) mogelijk zijn om alle individuen op te lijsten
- Elk individu in de populatie heeft een gespecifieerde kans om geselecteerd te worden
- Selectie moet een random proces zijn gebaseerd op de kansen
Random proces
- Produceert een uitkomst uit een set van mogelijke uitkomsten
- De uitkomst moet elke keer opnieuw onvoorspelbaar zijn
- Elke mogelijke uitkomst moet een gelijke kans hebben om op te treden
Simple random sampling
- Elk individu in populatie evenveel kans
- Elke selectie onafhankelijk van de andere
- 3 stappen
1) Populatie definieren
2) Leden van populatie polijsten
3) Random proces gebruiken om uit lijst te selecteren
MAAR kan nog altijd niet representatieve steekproef hebben => meer restricties leggen
Simple random sampling met teruglegging
Geselecteerd individu wordt teruggelegd in de populatie
- Garandeert dat de kans om geselecteerd te worden identiek blijft doorheen het selectieproces
- Kansen blijven constant (e.g., 1/100), waardoor onafhankelijkheid van de selecties verzekerd is
Simple random sampling zonder teruglegging
Individu dat geselecteerd wordt voor de steekproef wordt als deel van de steekproef genoteerd, en dan verwijderd uit de populatie
- Garandeert dat geen enkel individu meer dan 1 keer in de steekproef voorkomt
- MAAR: bij elke verwijdering ve individu, veranderen de kansen (e.g., 1/100, 1/99, 1/98, etc.) waardoor de selecties niet onafhankelijk zijn
Systematische sampling
- Gelijkaardig aan simple random sampling
- Startpunt = random –> zelfde procedure als simple random sampling om 1e individu te selecteren
- Nadien: geen random proces meer MAAR elk kde individu wordt geselecteerd
- k=N/n
- Minder random en garandeert hogere mate van representativiteit
Gestratificeerde random sampling
- Populatie bestaat uit subgroepen (“strata”
- Representatieve steekproef -> garanderen dat elk subgroepen adequaat vertegenwoordigd is in steekproef
- 3 stappen
1) Identificeer subgroepen
2) Selecteer random steekproeven van vergelijkbare grootte uit elk van deze subgroepen (n1 ≈ n2 ≈ n3 ≈ …)
3) Combineer de subgroep steekproeven tot 1 steekproef= gestratificeerde random steekproef
Nadelen gestratificeerde random sampling
- Vertekend beeld van de populatie (cf. voorb hierboven)
- Elk individu uit de populatie heeft niet meer evenveel kans om geselecteerd te worden (cf. voorb hierboven) ≠ random
Proportionele gestratificeerde random sampling
- 4 stappen
1) Identificeer subgroepen
2) Identificeer welke proportie van de populatie correspondeert met elke subgroep
3) Selecteer random steekproeven uit elk van deze subgroepen die de proporties respecteren van de populatie
4) Combineer de subgroep steekproeven tot 1 steekproef = proportionele gestratificeerde random steekproef
=> Representatief tov populatie MAAR arbeidsintensief
Cluster sampling
- Groepen selecteren ipv individuen
- Snel en eenvoudig grote steekproef bekomen, metingen in groep ipv individueel
MAAR: onafhankelijkheid?
Nonprobality sampling
- Kans om specifiek individu te selecteren is NIET gekend
- De grootte van de populatie niet gekend is en het is dus niet mogelijk om alle individuen op te lijsten
- De methode van selectie is gebiast, waardoor kans op het verkrijgen van een gebiaste steekproef groter is
Convenience sampling
- Vorm van nonprobality sampling
- “Convenience”: gebruik van steekproef waar we toegang toe hebben, die bereid zijn deel te nemen, etc.
- Geen kennis van hele populatie EN geen random proces
Voordeel en Nadeel van convenience sampling
- Nadeel: Kans op steekproef bias is groot
- Voordeel: snel, goedkoop, minder tijdsintensief dan probability sampling
- Strategieën om bias zo veel mogelijk te vermijden maar geen garantie op representatieve steekproeven
–> Convenience samplezo representatief mogelijk te houden, brede doorsnede
–> Let op met locaties met unieke, ongebruikelijke karakteristieken
–> Grondig rapporteren!!
Quota sampling
- Gestratificeerde sampling, maar NIET random
- Methode om te zorgen dat subgroepen in gelijke mate gerepresenteerd zijn in een convenience steekproef
- Quota op aantal individuen dat geselecteerd moet worden uit elke subgroep
- Ook proportionele quota sampling (match populatie proporties) en technieken van systematische- en cluster sampling gebruiken