H2 Flashcards
Range (bereik)
Verschil tussen de laagste en hoogste meting/observatie. Grotere waarde wanneer gegevens meer variëren in de ‘distribution’
μ
Populatiegemiddelde
σ
Standaardafwijking van de populatie
Bell-shaped distribution (klokvormig)
Ongeveer symmetrisch
The empirische regel
Normal distribution (normaalverdeling)
The empirische regel
- 68% van de observaties zitten binnen s = 1 (x ̅ ±s)
- 95% van de observaties zitten binnen (x ̅ ±2s)
- Bijna alle observaties zitten binnen (x ̅ ±3s). Alles hierboven mogelijke uitschieters
- Alleen bij normaal verdeelde data
Percentiles (p)
- Deelt je data op in 100 stukken
- Gegevens moeten op volgorde staan
- Kijken hoeveel procent hoger of lager dan jij hebt gescoord
- 50% is altijd de mediaan, p=50
Quartiles
○ First quartile (Q1) p=25
○ Second quartile (Q2) p=50=mediaan
○ Third quartile (Q3) p=75
○ Kan informatie geven over de vorm. Afstand tussen Q1-Q2 en Q2-Q3. ○ ○ Hoe meer afstand hoe minder stijging
Interquartile range (IQR)
Q3-Q1
§ Hoe meer variabiliteit, hoe groter IQR (net zoals de range & s)
§ Geen effect outliers
§ Vooral handig bij scheve verdeling
§ Mogelijke outlier als Q1- (1,5 * IQR) of Q3+ (1,5 * IQR)
Box plot
- Five-number summary
- Lijnen naast de box zijn whiskers (snorharen)
○ Geen potentiële outliers, anders apart weergeven met symbool
○ Hoe langer de snorhaar, hoe schever in die richting
○ Lijn tot grens mogelijke uitschieters of bij geen uitschieters, hoogste waarde - Kan horizontaal en vertaal worden weergegeven
- Streep geeft mediaan en verdeling aan
- Geeft niet kenmerken van verdeling zo duidelijk weer als bij histogram
- Bruikbaar om outliers te identificeren en belangrijkste overeenkomsten en verschillen tussen meerdere variabelen te vergelijken
z-score
- Aantal standaarddeviaties die een waarneming van het gemiddelde afligt
- Positieve z-score: de waarneming ligt boven het gemiddelde, bij negatieve score ligt het eronder
- Bij (-)3 standaarddeviaties, dan is het een uitschieter
- Gestandaardiseerd: onafhankelijk van meetschaal
- Kijken hoe extreem een waarneming is