ch6 Flashcards
Aselecte steekproef
- Er worden random respondenten uitgenodigd vanuit een lijst van elementen in de populatie (kunnen mensen, personen, werkgroepen, scholen, bedrijven, afhankelijk waar je onderzoek naar wil doen en de manier waarom je de steekproef vormgeeft).
o Grootste kans dat de steekproef representatief is voor de hele populatie: representaties is alle kenmerken uit de populatie, komen terug in de steekproef.
o Generaliseren van steekproef naar populatie mogelijk (conclusies uit de steekproef laten gelden voor de gehele populatie) ->Positief voor de externe validiteit
Enkelvoudige aselecte steekproef
1: Enkelvoudige aselecte steekproef
- Lijst met elementen uit de populatie
- Random elementen worden geselecteerd
o Bijvoorbeeld met een random number generater. Deze methode wijst aan wie een onderzoeker kan vragen om deel te nemen aan een onderzoek. Bijvoorbeeld je hebt een populatie van 400 mensen je wil een steekproef van 4o deelnemers. De number generator benoemd willekeurige 40 nummers uit de populatie.
Gestratificeerde aselecte steekproef
- Populatie opdelen in subpopulaties (deelpopulaties)
- Lijst met elementen binnen subpopulaties
- Random elementen selecteren uit subpopulaties
Gebruiken wanneer er verschillen zijn tussen subpopulaties en je wil dat ervanuit iedere subpopulatie er personen/elementen mee doen aan het onderzoek.
Dit kan op 2 manieren. Je kunt de verhouding van de populatie aanhouden. Voor de steekproef dus dezelfde verhouding als in de populatie.
Manier twee is om van die verhouding af te wijken. Als je bijvoorbeeld subpopulaties hebt die absoluut niet gelijk zijn qua grootte. Maar de onderzoeker het wel belangrijk vindt dat de mensen uit de kleinere groepen ook in de steekproef terecht komen. Dan kun je van de verhouding afwijken. Dan zeg je als onderzoeker, ik vind het belangrijk dat ik 10 mensen uit iedere subpopulatie heb bijvoorbeeld. Ook al is dat niet gelijk aan de verhouding in de populatie. Als je het dus belangrijk vindt dat iedere groep gerepresenteerd word in de steekproef en informatie kan aanleveren, maar de verhouding per grootte verschillend is. Dan kun je een gestratificeerde aselecte steekproef uitvoeren en de verhouding in de steekproef los laten en een eigen verhouding bedenken voor je steekproef.
Over de conclusie moet je goed nadenken.
Systematische steekproef
- Lijst met elementen in de populatie
- Random ‘startpunt’ selecteren; daarna selecteren met een vast interval. Dus bijvoorbeeld getal tussen de 0 en 10, je kiest 6. Vervolgens 6, 16, 26, 36, 46
- Gebruiken als volgorde van invloed kan zijn. Je hebt bijvoorbeeld een lange straat en je wil zeker weten dat je vanuit de hele straat mensen in de steekproef hebt zitten.
- Het heeft voor sommige onderzoeksvragen geen invloed, maar als jij denkt dat volgorde belangrijk is, dan is dit een goede manier.
Clustersteekproef
- Lijst uit populatie bestaat niet uit individuele elementen maar uit clusters
- Een cluster is een groep van personen en elementen.
- Soms geen lijst met individuen beschikbaar/ moeilijk te verkrijgen
- Gebruik heeft praktische voordelen. Je kan heel geclusterd naar die plekken gaan om data te verzamelen.
- Je moet wel goed nadenken over welke clusters te kiest en welke kenmerken daar belangrijk voor zijn.
Getrapte steekproef (multistage sample)
- Lijst uit populatie bestaat uit clusters
- Selecteer eerst hele clusters (bv middelbare scholen); daarna steekproef binnen clusters (je selecteert random klassen uit het cluster, of je selecteert random een aantal leerlingen aan per klas om deel te nemen aan het onderzoek.
Een getrapte steekproef, bestaat dus uit een aantal stappen. Het zijn eigenlijk een aantal steekproeven naast elkaar. Eerst een aantal clusters, vervolgens een stap met kleinere clusters en daarna nog eventueel een steekproef om individuen te selecteren.
Voorbeelden van kenmerken die onderzoekers gebruiken om de representativiteit te controleren, zijn:
leeftijd
sekse
inkomensniveau
sociale of etnische achtergrond
Representativiteit
Veel onderzoekers willen hun conclusies kunnen generaliseren naar meer mensen, dit noemen we inferentie.
De manier waarop de steekproef getrokken wordt, bepaalt of goede inferentie mogelijk is.
Bij een selecte steekproef is er geen willekeur gebruikt, hierdoor is de steekproef vaak niet representatief. Je kunt dan niet goed generaliseren.
Aselecte steekproeven zijn daarentegen beter geschikt wanneer onderzoekers willen kunnen generaliseren.
oversampling
opzettelijke bepaalde deelpopulatie(s) vaker voor laten komen in de steekproef, omdat deze anders bijvoorbeeld niet of nauwelijks in de steekproef voor zouden komen. Vaak willen onderzoekers wel gedetailleerde uitspraken over deze deelpopulaties kunnen doen. Hiermee wordt dus de kans dat een bepaalde deelpopulatie onder- of oververtegenwoordigd is verkleind.
populatieverhouding:
De steekproef wordt in dezelfde verhouding
als de populatie getrokken.
Representation:
- Sampling frame is de lijst die je nodig hebt voor het selecteren van de deelnemers uit de populatie bij de aselecte steekproef
- Sample (steekproef) dus uit de sample frame fase, worden er mensen aangewezen en die vormen onze steekproef. Dat zijn de mensen die worden uitgenodigd om deel te nemen aan het onderzoek. De sample bestaat dus uit de mensen die de uitnodiging krijgen.
- Respondents is iets anders dan sample. Respondenten zijn de mensen die uiteindelijk gaan deelnemen aan het onderzoek. Heel vaak nodig je een bepaalde groep uit om deel te nemen aan het onderzoek maar wil of kan niet iedereen deelnemen aan het onderzoek. Bij de respondenten ga je de data verzamelen en uiteindelijk de data analyseren
Measurement
heeft te maken met de inhoudelijke metingen die zullen worden uitgevoerd, bijvoorbeeld een vragenlijst. Deze kant gaat over fouten die kunnen optreden, in het proces van operationaliseren. Dus van het komen van dat theoretische begrip naar concrete vragen die we kunnen stellen en de antwoorden die respondenten kunnen geven en de interpretatie die onderzoekers daar aan kunnen geven
dekkingsfout
Als er met een aselecte steekproef wordt gewerkt, is er een lijst nodig. Dit noemen we het sampling frame. Wanneer die lijst niet compleet is, dus bepaalde elementen, bepaalde personen uit de populatie niet in die lijst voorkomen. Dan spreken we over een dekkingsfout. Dan denken we dat we op basis van de lijst een steekproef trekken uit de hele populatie. Maar dat is niet zo, we trekken een lijst uit onze sampling frame maar die lijst is niet volledig. Dus er staat een deel van de populatie op de lijst, dit deel van de populatie is gedekt tijdens het proces van steekproef trekking. Maar de personen die niet op de lijst staan zijn niet gedekt en hebben ook geen kans om in de steekproef terecht te komen. Want we trekken nu eenmaal een steekproef vanuit die lijst. Soms is het geen probleem. Het is een probleem zodra de mensen die niet op de lijst staan een specifieke groep vormen want dan kun je hen geen vragen stellen. Dit zorgt een probleem voor de conclusies die getrokken worden. Dit is de dekkingsfout
Steekproeffout:
als we vanuit onze lijst een steekproef trekken, dan kan er een steekproeffout ontstaan. Dit betekend dat de waardes die we vinden in de steekproef niet gelijk zijn aan de waardes in de populatie.
- Steekproef is niet gelijk aan populatie
o Hierdoor gingen we werken met de steekproevenverdeling, we zagen dat bij groetere steekproeven de resultaten veel dichter bij elkaar liggen. Bij grotere steekproeven is de kans klein dat het resultaat in de steekproef anders is dan het resultaat in de populatie. Bij kleine steekproeven treden grotere verschillen op. Denk aan de verschillende waardes van r die we kregen uit verschillende steekproeven (uit dezelfde populatie)
- Steekproeffout is groter bij kleine steekproeven. Het lastige hieraan is dat je niet weet of er een steekproeffout optreed want je weet niet welke waardes gelden in de populatie, daarvoor doe je onderzoek. Hier hebben we het dus over de kans op een steekproeffout. De kans op een steekproeffout is groter bij kleinere steekproeven dan bij grote steekproeven.
Non- responsfout
- In een steekproef geeft niet altijd iedereen gehoor aan een verzoek om mee te doen aan onderzoek (unit-nonrespons: als mensen niet willen meewerken)
o Je verwijdert of vergeet een e-mail over deelname naar klanttevredenheidsonderzoek: je neemt dus niet deel
o Een ouder weigert deelname van kind aan een onderzoek op de basisschool: dus dat kind maakt geen deel uit van het onderzoek -> unit0nonrespons - Mensen doen wel mee maar beantwoorden soms niet alle vragen -> item-nonrespons (kan komen door slordigheid, of omdat ze niet willen antwoorden door gevoeligheid vragen)
- Geeft problemen als het een specifieke groep is die niet wil meewerken of een specifieke groep die vragen niet beantwoordt. Want dan zullen de conclusies op verkeerde informatie gebaseerd zijn. Niet op de hele steekproef en niet representief voor de gehele populatie. Als je dan als onderzoeker een conclusie trekt dan is dit waarschijnlijk een vertekenend beeld en kun je het niet meer generaliseren naar je populatie. In je onderzoeksopzet moet je hier over na denken, zodat mensen verleid worden om de gehele vragenlijst in te vullen. Omdat je niet wil dat je informatie mist. Dit is voor statistische analyses niet goed.