Statistiek 1 Flashcards
Meetniveau nominaal
Je kunt je data categoriseren door labels toe te kennen. Elk datapunt kan maar tot één label behoren en er is geen rangorde (bvb geboorteplaats, gender ..)
Meetniveau Ordinaal
Je kunt je data categoriseren en rangschikken, maar je kunt niets zeggen over de intervallen tussen de categorieën. De intervallen zijn niet te bepalen of niet betekenisvol. ( zoals top 10 sellers)
Meetniveau Interval
Je kunt de data categoriseren en rangschikken, en er zijn gelijke intervallen tussen de categorieën. Er is geen betekenisvol of absoluut nulpunt.( zoals toets score)
Meetniveau Ratio
Je kunt je data categoriseren en rangschikken, en er is sprake van gelijke intervallen tussen opeenvolgende datapunten. Ook is er een betekenisvol of absoluut nulpunt. ( zoals leeftijd, gewicht ..)
Meetniveau continue
Variabelen die gemeten worden op ratio- of intervalniveau worden continue data genoemd. De toegekende getalsmatige eigenschap kan in theorie alle mogelijke waarden krijgen. Bij continue variabelen kan wél elke waarde tussen twee meetpunten voorkomen.
Meetniveau discreet
Variabelen die ‘gemeten’ worden op nominaal of ordinaal meetniveau worden discrete data genoemd
Meetniveau dichotoom
Een nominale variabele die slechts twee waarden kan aannemen noemt men dichotoom. Bijvoorbeeld: ja of nee
Centrum maten : gemiddelde
Het gemiddelde is getallen bij elkaar opgeteld en de uitkomst gedeeld door de hoeveelheid opgetelde getallen.–> Som vd waarnemingsgetallen/ totale frequentie
Centrum maten : Mediaan
(eerst getallen op rangorde zetten) De mediaan is het middelste getal bij een oneven aantal waarnemingsgetallen, bij een even aantal word de gemiddelde van de 2 middelste getallen genomen
Centrum maten: Modus
(eerst getallen op rangorde zetten) Het meest voorkomende cijfer
Spreidingsmaten: range
Is het verschil tussen de grootse waarde en de kleinste waarde ( dus grootste waarde - kleinste waarde)
Spreidingsmaten: kwartiel
(warde op rang orde zetten en zelfde techniek gebruiken als bij mediaan) kwartiele zijn de midden tussen de eerste waarde en de mediaan (Q1) en tussen de mediaan en de laatste waarde (Q3) de mediaan is dan Q2
Spreidingsmaten: interkwartielrange
Het verschil tussen Q3 en Q1 (Q3-Q2)
Spreidingsmaten: variantie
De variantie is in de statistiek een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate waarin de waarden onderling verschillen. Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het “gemiddelde” afwijken.
hoe bereken je de variantie ?
Stap 1: bereken de gemiddelde
Stap 2: verschil meten tussen de waarde en de gemiddelde (waarde - gemiddelde)
Stap 3 : verschillen kwadrateren
Stap 4 : de som van de gekwadrateerde verschillen optellen
Stap 5 : laatste optelsom delen door N-1 (steekproef) of door N bij populatie