beschrijvende statistiek Flashcards
numerieke data
metingen of tellingen waarmee je zinvol kunt rekenen. (kwantitatief)
categorische data
onderverdelen in groepen van categorieën.
twee soorten categorische data
categorisch niet-geordend en categorisch geordend
frequentietabel inhoud
absolute frequentie (AF) en relatieve frequentie (RF)
som van alle absolute frequentie
is gelijk aan het totale aantal onderzochte elementen
som van de relatieve frequentie
is gelijk aan 100%
dataset
verzameling van alle gegevens uit een statistisch onderzoek
de verschillende soorten grafische voorstellingen
lijndiagram, cirkeldiagram, staafdiagram / dotplot
gegroepeerde frequentietabel of klassentabel
een tabel waarbij de gegevens gegroepeerd worden in klassen
klasse
een halfopen interval [a, b[
klassenmidden
midden van een klasse
klassenbreedte
breedte van een klasse
bij groeperen gaat er
onvermijdelijk informatie verloren
3 centrummaten
gemiddelde, mediaan en modus
voor gegroepeerde gegevens (mediaan)
mediaanklasse
voor gegroepeerde gegevens (modus)
modale klasse
uitschieters
gegevens die veel kleiner of veel groter zijn dan de rest
voor categorische geordende data
kan je de mediaan en de modus bepalen
voor categorische niet-geordende data
kun je enkel de modus bepalen
soorten spreidingsmaten (niet-gegroepeerde gegevens)
varatiebreedte, interkwartielafstand, varantie,
soorten spreidingsmaten (niet-gegroepeerde gegevens)
varatiebreedte, interkwartielafstand, varantie
kwartielen
eerste kwartiel (Q1), tweede kwartiel (Q2) = mediaan, derde kwartiel (Q3)
eerste kwartiel (Q1)
mediaan van de eerste helft van de geordende gegevensreeks
tweede kwartiel (Q2)
synoniem van mediaan van de gegevensreeks
derde kwartiel (Q3)
mediaan van de tweede helft van de geordende gegevensreeks
variatiebreedte
afstand tussen het kleinste en het grootste gegeven
variantie
spreiding van een gegevensreeks rond het gemiddelde weergeeft
voor gegroepeerde gegevens
gebruik je het klassenmidden om de interkwartielafstand, de varantie en de standaardafwijking te berekenen
voor de variatiebreedte (gegroepeerde gegevens)
gebruik je de ondergrens van de eerste klasse en de bovengrens van de laatste klasse
histogram
een grafische voorstelling die de gegevens uit een gegroepeerde frequentietabel voorstelt
histogram (assen)
verticale as = klassen
horizontale as = frequentie van de klassen
staafdiagram (welk soort data geschikt)
-categorische niet-geordende data
-categorische geordende data
-numerieke data met beperkt aantal niet gegroepeerde waarden
histogram (welk soort data geschikt)
numerieke data met groot aantal mogelijke waarden gegroepeerde in klassen
staafdiagram (ruimte tussen staven aanwezig)
ja, want de verschillende categorieën sluiten niet direct op elkaar aan
histogram (ruimte tussen staven aanwezig)
nee, want de klassen zijn aaneensluitend
boxplot
een grafische voorstelling die de mediaan, de kwartielen, de interkwartielafstand en de variatiebreedte weergeeft
boxplot gegevens verdeeld in
4 delen
elk deel van een boxplot bevat
25% van de gegevens