h2 theorie Flashcards
4 onderdelen statistische cyclus
de onderzoeksvraag, data verzamelen, data analyseren, conclusies trekken
causaal verband
als een gebeurtenis het directe gevolg is van een andere gebeurtenis
populatie
totale groep waarop het onderzoek zich richt
steekproef
een deel van de populatie wordt ondervraagd
een representatieve steekproef
de steekproef is voldoende groot en de steekproef is aselect
wanneer is een steekproef aselect?
als elk element van de populatie een even grote kans heeft om in een steekproef voor te komen
variabelen
dingen die onderzocht zijn
kwalitatieve variabele
geven een kwaliteit of eigenschap weer, bv beroep of godsdienst, kunnen niet worden uitgedrukt in een getal
kwantitatieve variabele
de meetbare gegevens, bv temperatuur, snelheid en gewicht, kun je wel uitdrukken in een getal
discrete variabele
kunnen niet elk getal aannemen, bv aantal kinderen in de klas, 20 maar niet 20,5, je bent beperkt tot een aantal decimalen
continue variabele
kunnen wel elk getal aannemen, bv gewicht, kan 70 kg zijn maar ook 70,34 kg, niet beperkt tot een aantal decimalen
meetniveau
bepaalt wat je wel en niet met de gegevens kunt doen
de 4 meetniveaus
nominaal, ordinaal, interval, ratio
nominale meetniveau
je deelt de variabelen in categorieën, maar er is geen vaste volgorde, bv geslacht, hier is naamgeving
ordinaal meetniveau
er is wel vaste volgorde, maar de stapgrootte is niet overal hetzelfde, bv aantal sterren van een hotel, een 5-sterren hotel is beter dan een 4-sterren hotel, naamgeving en ordening
interval meetniveau
er is wel een vaste volgorde, de stapgrootte is overal hetzelfde, maar geen natuurlijk nulpunt, bv jaartelling, naamgeving, ordening en gelijke verschillen
ratio meetniveau
er is wel een vaste volgorde, de stapgrootte is overal hetzelfde en er is een natuurlijk nulpunt, bv leeftijd, als je geboren wordt ben je 0 jaar oud (natuurlijk nulpunt), naamgeving, ordening, gelijke verschillen en natuurlijk nulpunt
populatieproportie (p)
p = aantal elementen met het kenmerk in de populatie / totaal aantal elementen in de populatie
steekproefproportie (ˆp)
^p = aantal elementen met het kenmerk in de steekproef / totaal aantal elementen in de steekproef
gemiddelde
gemiddelde = som van de waarnemingsgetallen / totale frequentie
mediaan
is het middelste getal bij oneven aantal getallen, bij even aantal getallen is de mediaan het gemiddelde van de 2 middelste getallen
modus
is het waarnemingsgetal met de hoogste frequentie
de boxplot
een diagram dat de verdeling van data in beeld brengt, het kan alleen bij kwantitatieve variabele, bestaat uit 4 groepen en zijn allemaal 25%
eerste kwartiel (Q1)
de mediaan van de 1e helft
derde kwartiel (Q3)
de mediaan van de 2e helft
spreidingsmaat
drukt de mate van spreiding van de gegevens uit in een getal, hoever de gegevens uit elkaar liggen
spreidingsbreedte
het verschil tussen het grootste en kleinste waarnemingsgetal (maximum-minimum)
(inter)kwartielafstand
de breedte van de box (Q3-Q1)
standaardafwijking σ
menu 2, alles invullen, calc -> set, list 1 of 2 goed zetten dan exit, calc -> 1-var en dan hopelijk heb je hem
klassengrenzen
de grenzen van de klasse, rechtergrens en linkergrens
klassenbreedte
klassenbreedte=linkergrens-rechtergrens
klassenmidden
klassenmidden=rechtergrens+linkergrens / 2
modale klasse
klasse met de grootste frequentie
histogram
een staafdiagram, het eerste en het laatste hokje leeg laten, als je hem maakt moet je niet vergeten de titel te melden, hz en vt as en waar de histogram over gaat
frequentiepolygoon
een lijndiagram, je begint en eindigt op de grond en weer vergeet de titels van hz en vt as en boven de polygoon
relatieve frequentiepolygoon
een frequentiepolygoon maar dan met procenten
cumulatieve frequentie(polygoon)
je telt bij de frequentie van een waarnemingsgetal ook alle voorgaande frequenties mee
relatieve cumulatieve frequentie(polygoon)
als je te maken hebt met cumulatieve frequenties in procenten
symmetrische verdeling
het gemiddelde, de mediaan en de modus vallen samen
tweetoppige verdeling
een histogram met 2 toppen
meertoppige verdeling
een histogram met meerdere toppen
rechts/links-scheve verdeling
het loopt ver aan de rechter of linker door, rechts-scheef is het aan de linkerkant heel hoog en bij links-scheef andersom
uniforme verdeling
een verdeling waarbij elk waarnemingsgetal of elke klasse dezelfde frequentie heeft