Les 4 Flashcards
2 soorten statistiek
- beschrijvende statistiek
- verklarende statistiek
wat is beschrijvende statistiek
- Het ordenen en beschrijven van numerieke data uit steekproeven
Beschrijvende statistiek maakt gebruikt van
- steekproefgrootheden
- parameters
wat zijn steekproefgrootheden
- Waarden die worden berekend op basis van informatie uit de steekproef
Wat zijn parameters
Waarden die worden berekend uit een onderzoek op basis van de hele populatie
Gemiddelde: parameters
μ
gemiddelde: steekproefgrootheden
X (met een horizontale streep boven de X)
variantie: parameters
σ2
variantie: steekproefgrootheden
SD2, s2
standaardafwijking: parameters
σ
standaardafwijking: steekproefgrootheden
SD, s
verklarende statistiek kunnen we ook … noemen
inductieve statistiek
wat is verklarende statistiek
- Het generaliseren van de verzamelde informatie naar een groter geheel
- Vanuit de steekproef wil men iets kunnen zeggen over de populatie
- Concluderen of het verschil dat wordt gevonden (vb tussen twee groepen) een echt verschil is of slechts toeval is ten gevolg van een niet representatieve steekproef of een andere ‘fout’.
Geef verschillende soorten centrummaten
- Frequentie
- Modus
- Mediaan
- Gemiddelde
Absolute frequentie
is het voorkomen
relatieve frequentie
het voorkomen ten opzichte van de totale groep (meestal uitgedrukt in 100)
cumulatieve frequentie
de som van alle voorgaande waarnemingen t.e.m. de waarneming of interest
Relatieve cumulatieve frequentie
de cumulatieve frequentie uitgedrukt in percentage van totaal
Percentage is
- relatieve frequentie, uitgedrukt ten opzichte van 100
- geeft de aan- of afwezigheid van een (binaire) code aan
een proportie is
is een getal dat de verhouding aangeeft tussen het aantal elementen uit een verzameling met een bepaalde eigenschap en het totale aantal elementen uit deze verzameling.
Geef de proportie weer in een formule
frequentie/totaal aantal * 100
De modus is
De modus is het gegeven met de grootste frequentie in een reeks getallen.
wanneer is er geen modus
wanneer alle gegevens evenveel voorkomen
waarvoor is de modus het meest geschikt
voor het verzamelen van kwalitatieve gegevens
De modus is de enige maat die geschikt is voor?
voor nominale data
modale klasse
categorie met de hoogste frequentie
Voor het verzamelen van welke data is de modus allemaal geschikt?
Kan ook voor ordinale, interval en ratiodata
Wat als de verdeling symmetrisch is? dan is de modus
gelijk aan de mediaan
indien 1 waarde het meest voorkomt noemen we dit
unimodaal
Indien twee waarden dezelfde hoge frequentie hebben
Bimodaal
Indien meer dan twee waarden dezelfde hoge frequentie hebben
Multimodaal
de mediaan is
De mediaan is het middelste gegeven wanneer de gegevens geordend zijn van klein naar groot.
Wat is noodzakelijk als je de mediaan wilt zoeken
om de gegevens te ordenen
nadeel mediaan
De mediaan gebruikt alleen de middelste gegevens en laat dus veel informatie verloren gaan.
Voordeel mediaan
Daar tegenover staat dat de mediaan geen last heeft van extreme gegevens.
Het gemiddelde
Het rekenkundig gemiddelde is de som van alle gegevens gedeeld door het aantal gegevens.
De notatie voor het rekenkundig gemiddelde is:
▪ μX voor de gegevens van de populatie.
▪ X voor de gegevens van een steekproef.
Nadeel gemiddelde
Houdt geen rekening met de brede van de groep
Voordeel gemiddelde
Houdt rekening met totale groep
Geef de verschillende spreidingsmaten
- Bereik of range van de gegevens
- Percentiel
- Variantie
- Standaardafwijking
- Z-score
Het bereik is
(de range) is het grootste gegeven min het kleinste
gegeven en is dus zeer eenvoudig te berekenen.
Door wat wordt het bereik bepaalt
wordt alleen bepaald door de 2 uiterste gegevens. Het
kan echter zijn dat de gegevens dicht bij mekaar liggen en de spreiding dus klein is terwijl de uiterste waarden toevallig ver van mekaar liggen.
Het percentiel
Is het punt waaronder een bepaald percentage van de waarden van de frequentieverdeling ligt.
50ste percentiel:
- 50% van de gegevens liggen onder deze waarde
- > Mediaan ligt steeds op het 50ste percentiel van de gegevens
Variantie
- bekijkt de gemiddelde kwadratische afwijking van de
gegevens ten opzichte van het rekenkundig gemiddelde. - Zij onderzoekt of de gegevens al dan niet dichtbij het gemiddelde liggen.
De populatie noteren we als (variantie)
σ2x
De steekproef noteren we als (variantie)
S2x
Het rekenkundig gemiddelde bij variantie is altijd
0
Standaardafwijking is
een maat die de gemiddelde afwijking van alle waarden van het gemiddelde aangeeft
SD betekent
Standaarddeviatie van de steekproef
σ (binnen standaardafwijking) betekent
standaarddeviatie van populatie
Wanneer gebruiken we standaardafwijking
bij interval en ratio variabelen
Z- score is
- de standaard- score
- Een score die aangeeft hoeveel standaardafwijkingen een score boven of onder het gemiddelde ligt.
Z- score heeft altijd een gemiddelde van … en een SD van …
gemiddelde van 0 en een SD van 1
Z- score bereken je door
van de score het gemiddelde af te
trekken en delen van de SD