H8 Flashcards
Foutmarge (margin of error)
Verschil tussen de schatting die je vindt in je steekproef en de populatie. Wordt kleiner bij grote willekeurige steekproef
Confidence level (betrouwbaarhied)
De kans op het verkrijgen van een schatting binnen de foutenmarge bij herhaalde steekproeven
Stratum
- Subgroep elementen van de populatie met dezelfde kenmerken
- Hoe je de populatie kan verdelen aan de hand van kenmerken
- Het creëren van subgroepen binnen de populatie
- Meerder strata binnen een populatie. Deze kunnen elkaar overlappen
Geslacht, opleidingsniveau, leeftijd
Sampling frame
- Een lijst van alle elementen in een populatie die individueel kunnen worden geïdentificeerd
- Kan overlappen met een census
○ Alleen Sampling frame bevat contactgegevens
○ Bevat niet altijd alle elementen van de populatie, door fouten of een oude lijst
Census
- Opsomming of telling van alle elementen in de populatie
- Gehele populatie: Verwijst naar situatie waar alle elementen in de populatie gemeten zijn
- Niet altijd bekend
- National census: Verwijst naar situatie waar alle elementen binnen één land gemeten zijn
–> Kan bijvoorbeeld alleen virtueel via database van de overheid
Niet-aselecte steekproef:
- Sommige elementen in het steekproefkader hebben geen kans om te worden geselecteerd of hun waarschijnlijkheid is onbekend
- Foutmarge is niet nauwkeurig te bepalen
- Niet te bepalen of steekproef de gehele populatie representeert
- Proportieberekening is mogelijk, maar kan erg afwijken met werkelijke populatie
- Niet-willekeurige steekproeven leveren bias (systematische afwijkingen) op
- De grootte van het verschil en dus vertekening is onbekend
- Correctie doorvoeren gaat daardoor niet
- Laag in externe validiteit, maar dit hoeft niet altijd het doel te zien
Soorten niet-aselecte steekproeven: (4)
1) Convenience sampling (accidental/haphazard sampling)
* Een steekproef waarbij je gebruikmaakt van mensen die toevallig voorhanden zijn.
* Simpelste vorm
* Het selecteren van elementen die het makkelijkst te vinden zijn
* Veel ‘dezelfde elementen’ binnen de steekgroep
* Particularistic research
* Lastig te generaliseren:
* Veel bias
* Zegt weinig of gehele populatie
* Toch wordt het wel vaak gebruikt
- Onmogelijk verwerven sampling frame
- Andere methoden kosten te veel tijd
* Docent vraagt eigen studenten voor onderzoek
* Eerste 100 mensen die je tegenkomt en geïnterviewd willen worden
2) Snowball sampling
* Start met kleine groep
* Participanten zorgen voor nieuwe participanten en deze weer voor nieuwe
* Hierdoor groeit de kleine groep in een steeds grotere groep
* Goed bruikbaar bij lastige te bereiken, hechte community populatie
* Zelfde nadelen als convenience sampling en misschien nog wel meer
* Veel zelfde populatie: risico dat we een kliek vrienden/collega’s selecteren.
–> Veel zelfde kenmerken
3) Purposive sampling (doelgerichte steekproef)
* Typische elementen voor de populatie gekozen aan de hand van oordeel onderzoeker
* Bijvoorbeeld gebruik van extreme elementen, of dezelfde kenmerken, of tegenovergestelde kenmerken, alleen specialisten –> Specifiek onderzoeksdoel
* Vaak bij kwalitatief onderzoek
* Zelfde nadelen als convenience sampling
* Ook oordeel onderzoeker brengt bias met zich mee
* Variabelen van interesse
4) Quota sampling
* Moet populatie ‘representeren’
* Uit alle strata van je populatie neem je een element
* Vergelijkbaar met gestratificeerde willekeurige steekproeven
* Specifiek kiezen aan de hand van kenmerken elementen/variabelen, zoals gender en leeftijd (geen interesse)
* Mogelijke doelen
- Verhoudingen uit minderheden includeren
- Verhoudingen van groepen hetzelfde als populatie * Verhouding kenmerken steekproef corresponderen met verhouding kenmerken populatie
- Niet random selecteren van elk stratum
- Bij elke stratum convenience sampling gebruikt
* Lijkt representatief te zijn, maar wel veel bias
- Bij een interview naar makkelijk aanspreekbare mensen gaan
* Voorzichtig conclusies trekken en generaliseren
Single stage cluster sampling (aselecte steekproef)
De clusters worden willekeurig gekozen. Alle individuen in dat cluster worden geselecteerd. En de totale steekproefgrootte is het totaal aantal individuen.
multi stage cluster sampling (aselecte steekproef)
Clusters worden willekeurig gekozen en daarna vindt er een verdere willekeurige selectie plaats. Uit die clusters (scholen) trek je weer kinderen.
Tree-stage cluster sampling (aselecte steekproef)
Eerst willekeurig een aantal clusters gemaakt (scholen). Daaruit worden willekeurig klassen getrokken. Per school, 1 klas. En uit die ene klas weer een willekeurig aantal leerlingen.
Sampling distribution
Steekproefverdeling. Heeft vergelijkbare vorm bij aslecte steekproef. Hoe groter de steekproef, hoe kleiner de afwijking van daadwerkelijke populatie
Random digit dial (RDD) telephone sampling
Met random cijfers een telefoonnummer vormen
Aslecte steekproef doel: (3)
- Maximaliseren externe validiteit
- Random selecteren mensen uit populatie
- Generaliseren
Aslecte steekproef:
- Elk element van de steekproefpopulatie heeft een bekende kans om te worden opgenomen, dit hoeft geen gelijke kans te zijn
- Aan de hand van steekproef iets zeggen over gehele populatie
- Beter dan bij niet-aselecte steekproef, maar zal altijd iets verschillen met ware uitkomst gehele populatie
- Proporties
- Deel/geheel x 100 = proporties in %
- Geschatte proporties liggen rond de proportie in werkelijke populatie
- Willekeurige steekproeven leveren afwijkingen op, maar die zijn niet systematisch
- Grotere steekproeven leveren minder grote afwijkingen op dan kleinere steekproeven
- Steekproefverdeling ligt dit bij daadwerkelijke populatie
Wanneer Bias aselecte steekproef (3)
- Als niet alle participanten die je uitnodigt mee willen doen. (Weigeraars zijn waarschijnlijk anders dan niet-weigeraars) (morality)
- Als er participanten tijdens het onderzoek uitvallen. (Uitvallers zijn waarschijnlijk anders dan niet-uitvallers) (morality)
- Als participanten systematische fouten maken/antwoordtendensen vertonen. (Beide groepen kunnen anders zijn)
Soorten aselecte steekproeven (3)
1) Simple random sampling
* Simpelste vorm
* Opgenomen in complexere steekproeven
* Elk element heeft een gelijke en onafhankelijke kans
* Soort loting
* Gebruik maken van een lijst random numbers (reeks getallen die gegenereerd zijn zonder specifieke volgorde)
2) Stratified random sampling
* Steekproef uit elke strata
* Steekproefgroottes hoeven niet even groot te zijn
* Verhoudingen hoeven niet gelijk te zijn aan de populatie * Verhoudingen in populatie moet wel bekend of geschat zijn
* Gebruiken bij:
- De verschillen (op variabelen van interesse) tussen de strata relatief groot zijn t.o.v. de verschillen binnen de strata.
- En als de proporties (op de stratificatie variabelen) bekend zijn.
* Steekproef: 42 mannen, 38 vrouwen. Is totaal 80 65+ers. Werkelijkheid: 41 % man en 59 % vrouw. Schatting van de werkelijke populatie: 0,41 x het gemiddelde gewicht van de 42 mannen + 0,59 x het gemiddelde gewicht van de 38 vrouwen.
3) (Single/Multi-stage) cluster sampling
* Niet elementen (individuen) maar clusters worden willekeurig getrokken
* Meerdere keren steekproeftrekkingen
* Foutmarge lastig vast te stellen
* Minder kosten en werk
* Het willekeurig kiezen van clusters en daarbinnen willekeurig kiezen van elementen
* Single stage: 1 steekproef
* Multi stage: 2 steekproeven
* Three-stage cluster sampling: 3 steekproeven
* Kan zelfs 4 stages
a) Studenten clusteren in districten, bepaalde gebieden in het land
b) Scholen selecteren binnen de geselecteerde districten
c) Random steekproef van wiskundeklassen binnen geselecteerde scholen
d) Random steekproef van leerlingen binnen de geselecteerde klassen
Stappen simple random sampling (2)
a) Sample frame nodig, die correct is
b) Verwerven van random numbers (Random number tables of random number generators)
Ieder persoon koppelen aan een nummer
Errors random sampling (2)
- Systematic sampling (kiezen van elementen waarbij keuzes niet onafhankelijk zijn)
Populatie van 160. Random getal is 12. Daarna steeds 10 erna pakken als steekproef
–> Wel gelijke kans
–> Niet onafhankelijk - Sommige elementen komen wel in aanmerking, anderen niet
Mensen die langer dan een jaar zijn afgestudeerd komen in aanmerking
–> Geen gelijke kans
–> Wel onafhankelijk van andere elementen
Stappen stratified random sampling (3)
- Verdelen de bevolking in uitsluitende strata
- Van elke strata een simpel random steekproef
- Deze steekproeven van strata zijn samen de gehele sample
Stratified random sampling bruikbaar omdat (4)
- Op gebied van strata is de steekproef representatief
- Steekproef zelfde verhoudingen als in populatie
- Maakt steekproef meer efficiënt
- Kleinere foutmarge
Expierience sampling methods onderzoekers moeten vaststellen (3)
1- Wanneer ‘ervaringen’ vastgesteld worden
2- Hoe vaak ervaringen vastgesteld worden
3- Nadenken wat andere beperkingen zijn
Steekproef fout (sampling error)
- Geeft de mate van onzekerheid van de uitkomst weer ten opzichte van de opvattingen van de gehele populatie.
- Willekeurige verschillen tussen een steekproef en het sampling frame
- Ons vertrouwen (confidence) in een schatting uitdrukken in een getal
- Een onderzoek met een grotere foutmarge geeft minder nauwkeurig de werkelijke opvattingen van de populatie weer.
- Meest gebruikte foutmarge is 5% (gewenste betrouwbaarheid dus 95%). Deze werkt zowel naar beneden als naar boven
95% confidence interval
De onder- en bovengrens berekenen van de 95% betrouwbaarheidsinterval