Statistiek in 20 stappen ho 3 + ho 4 Flashcards
Wat is het rekenkundige gemiddelde?
X(streepje erop) = Som van alle waarnemingen delen door het aantal waarnemingen
Wat is de modus?
Het meest voorkomende getal in een dataset.
Wat is de mediaan?
De middelste waarneming(en)
Wat zijn de spreidingsmaten?
= Mate om informatie te krijgen over de afstand tussen datapunten.
De variatiebreedte en de standaarddeviate
Waar kijk je naar met spreidingsmaten?
Je kijkt naar de afstand tussen de verschillende uitkomsten, oftewel de spreiding.
Wat is variatiebreedte?
Variatiebreedte is het verschil tussen de grootste en de kleinste uitkomst.
Je kijkt naar de breedte van de variatie.
Wat zijn deviaties?
Deviatie houdt in deze context het verschil tussen een waarneming en het gemiddelde in.
- Bij grote deviaties spreek je van een grote spreiding, bij kleine deviaties is de spreiding gering.
- Een ander woord is ook wel “afwijking”.
Wat is variantie?
- s^2 bij steekproefgegevens, sigma^2 bij kansvariabelen
Variantie is de volgende formule:
s^2 = A/B A = De som van (waarneming - gemiddelde)^2 B = (aantal waarnemingen - 1)
Voor A moet je de stappen zo uitvoeren:
- Bereken het gemiddelde.
- Bereken de deviaties.
- Bereken het kwadraat van elke deviatie.
- Bereken de som van deze kwadraten.
Benoem een voordeel en nadeel van de geleerde maatstaven.
Voordeel:
Je kan met 1 getal iets vertellen over een grote verzameling uitkomsten.
Nadeel:
Je verliest details (informatie), doordat het antwoord in één getal wordt gegeven.
Wat is de variatiecoëfficiënt?
Een dom woord die 2 ë’s opeist.
De relatieve standaarddeviatie.
= Standaarddeviatie gedeeld door de ABSOLUTE WAARDE van het gemiddelde. Dus niet -5, maar 5 bijv.
Handig voor het vergelijken van 2 verschillende populaties.
Hoe bepaal je het rekenkundig gemiddelde bij gegroepeerde gegevens?
X (met streepje erop) = De som van de (klassemiddens maal de frequentie van die klassemiddens) delen door het aantal waarnemingen.
0 -< 5, met f. 5
5 -< 10, met f. 10
10 -< 15, met f. 20
X = (3 * 5 + 8 * 10 + 13 * 20) / (5 + 10 + 20)
Hoe bereken je de modus bij gegroepeerde gegevens?
Je berekent de frequentiedichtheid.
Je bepaalt van een klasse dat dit de “eenheid” is.
0 -< 5
5 -< 15
15 - < 30
Als je zegt dat 0 -< 5 de standaard is, dan is klasse 2 2 eenheden en klasse 3 is 3 eenheden.
Je deelt de frequentie door de eenheden.
De hoogste frequentiedichtheid is de modale klasse.
Hoe bereken je de mediaan bij gegroepeerde gegevens?
Xme = L + (r - 0,5)(b/f) b = de breedte van de mediale klasse f = het aantal waarnemingen binnen de mediale klasse r = het gezochte rangnummer binnen de klasse L = de benedengrens van de mediale klasse
Wat is het nadeel van het gemiddelde?
Het wordt enorm beïnvloed door extreme uitkomsten als deze bij de gegevens zitten.
Wat is het voordeel van de modus?
De modus wordt niet beïnvloed door extreme uitkomsten in de gegevens.