Lecture 2 (Samples pt.2, Descriptive Statistics) Flashcards
Drie dingen waar je keuze voor een steekproefmethode vanaf hangen:
Samenstelling van de doelpopulatie, de onderzoeksvraag, de haalbaarheid van de te vormen steekproef
Drie kenmerken van de enkelvoudige steekproef (simple random sample)
- Elke combinatie van deelnemers heeft een even grote kans om de steekproef te vormen
- Alle participanten van de populatie zijn benaderbaar
- Vereist een groot aantal willekeurige getallen om de steekproef te bepalen
Twee kenmerken van de Systematisch aselecte steekproef (systematic random sample)
- Niet elke combinatie van deelnemers heeft een even grote kans om de steekproef te vormen
- Gemakkelijk uit te voeren met een goede representativiteit
Vier kenmerken van de gestratificeerde steekproef (stratified random sample)
- Vergelijking van expliciete groepen
- Binnen iedere groep (stratum) wordt een steekproef getrokken
- Strata kunnen (dis)proportioneel zijn
- Goede keuze bij vergelijking van groepen die verschillen in omvang
Drie kenmerken van de klustersteekproef (cluster sample)
- Niet elke combinatie van deelnemers heeft een even grote kans om de steekproef te vormen
- De steekproef bevat al bestande klusters
- Benadert alle deelnemers uit een kluster
Twee kenmerken van de getrapte steekproef (multi-stage sample)
- Bijna hetzelfde als een klustersteekproef
- Selecteert willekeurig een bepaald aantal deelnemers per kluster, in plaats van alle deelnemers uit een kluster
De drie dimensies van beschrijvende statistiek
- Centrummaten
- Spreidingsmaten
- Positiematen
Een frequentieverdeling gebruik je voor…. variabelen
categorische/numerieke
Een staafdiagram gebruik je voor…. variabelen
categorische
Een taartdiagram gebruik je voor…. variabelen
categorische
Een histogram gebruik je voor…. variabelen
numerieke
Een stam-en-blad-diagram gebruik je voor…. variabelen
numerieke
De centrummaat van categorische variabelen
De modus
De spreidingsmaat van categorische variabelen
De variantie-ratio
De centrummaten van numerieke variabelen
(Gewogen) Gemiddelde, mediaan, modus
De spreidingsmaten van numerieke variabelen
Bereik (range), standaarddeviatie, interkwartielafstand (IQR)
De meest voorkomende waarde
Modus
Het middelste getal
Mediaan
De interkwartielafstand (IQR)
De middelste 50% aan waarnemingen in een boxplot
Formule voor de IQR
Q3 - Q1
Formules voor de onder- en bovengrens van een boxplot
Q1 - (1.5 * IQR) en Q3 + (1.5 * IQR)
Statistische analysen die zich richten op één variabele
Univariate statistieken
Statistische analysen die zich richten op de associatie (samenhang) tussen twee variabelen
Multivariate statistieken