Boek H2 Flashcards
Frequency distribution (frequentieverdeling)
= smooth curve
Een manier om snel inzicht te zien in een oogblik over de dataset.
Weergave in tabel of grafiek van de frequentie van elke observatie binnen een interval.
Grouped frequency distribution table
(nederlands =?)
Frequentieverdeling met klassen, groeepn van waarden, ipv losse waarden.
B.v. 0-10, 11-20, 21-30
Proportion / Proportie definitie en formule
Relatieve frequentie van een waarde in relatie tot het totale aantal.
B.v. frequentie 1 met N van 7, p = 1/7
p = f/N
Percentage formule
Percentage = p(100) = f/N * (100)
Dus proportion deling doen * 100.
proportie van 1 van de 7 = 1/7, percentage = 1 : 7 * 100 = 14.29%
3 richtlijnen van frequency distribution table
- Minder dan 10 class intervals. 10> is meestal arbitrair
- Simpele cijfers voor breedte van de interval (b.v. 2, 5, 10, enz.) (Breedte = bereik van interval, b.v. 5-9 en 10-14)
- Laagste score van class interval moet vermenigvuldiging zijn van breedte (B.v. breedte 10 = intervals 10, 20, 30)
Hoe … het interval, hoe meer informatie verloren gaat
- Breder
- Nauwer
Breder. Nauwere intervals betekent specifiekere data
Wat is de breedte van het interval 20-24?
- Je telt 20 en 24 mee
Histogram
Een bar chart zonder ruimte tussen balken.
Data kan ook gegroepeerd zijn, b.v. bars van 44-45, 46,47 enz.
Bar graph
Een bar chart met ruimte tussen balken
Modified Histogram
Histogram balken indelen in opstapelingen van gelijke blokken
Polygons
Rechte lijn getrokken door verbonden datapunten met 2 assen
Kan bij Interval en Ratio schalen.
Bij nominal intervals gebruik je …
- Histogram
- Bar Graph
- Bar graph
Om aan te duiden dat het aparte, verschillende categorieën zijn, en niet gerelateerde of opbouwende scores.
Symmetrical distribution definitie
Spreekt voor zich.
Wanneer de verdeling symmetrisch is (hoeft niet per sé een bell curve te zijn). Ongeveer symmetrisch, nooit precies.
Skewed distribution (scheef)
Frequentieverdeling waarin scores opstapelen naar 1 kant (asymmetrisch).
Dit kan negatief (hoogste punt richting rechts) of positief (hoogste punt richting links)
Histogrammen en polygonen gebruik je bij … schalen
Ratio en Interval
Bar graphs gebruik je bij … schalen
Nominal en Ordinal
Stem-and-leaf display
Scores opknippen in losse getallen, 1e los.
Dus
1 | 1415
2 | 1266
3 | 87
4 | 55
3 heeft dan: 38 en 37.
Wanneer je … (veel/weinig) scores hebt, is een grafische weergave beter dan een frequentie tabel.
Veel.
Smooth curves worden gebruikt voor …
Populaties
Unimodale verdeling =
Symmetrische smooth curve waarin de piek het midden is
Bimodale verdeling
Symmetrische verdeling met meerdere pieken, dus midden is niet (enige) piek.
x = 1, f = 1, 1/7
x = 2, f = 3, 4/7
x = 3, f = 3, 7/7
Dit is een voorbeeld van een … frequency
Cumulatieve frequentie.
c% staat voor
Percentielscore.
Dus b.v. cumulatieve frequentie = 6, dan
6/7 * 100
Beschrijf de complicatie met cumulatieve percentages
Bij continue variabelen is de quizscore 2 alles tusssen 1,5 en 2,5. Dus dan moet je een vorm van interpolation gebruiken om specifiek te berekenen
Dus er is een ondergrens (1,5) en bovengrens (2,5) voor het getal 2. Dus c% 25% is niet alles onder en met de 2, maar alles onder de 2,5, de upper limit.
Dus als je bv specifiek tot 2 wil weten moet je 50% van de percentiel toename van het limiet van 2 (1,5 - 2,5) wegnemen.
If a frequency distribution graph is drawn as a smooth curve, it is probably showing a ______ distribution.
a. sample b. population c. skewed d. symmetrical
b. population
Een makkelijk tentamen veroorzaakt waarschijnlijk een … skew. (Positieve/negative).
Negative skew.
Interpolation =
bepaalde waarden komen niet voor in een frequency distribution table, dus je kunt ze niet aflezen.Maar je kunt ze wel inschatten met interpolation.
B.v. je weet dat 8 uur werk 60 euro is en 0 uur werk 0 euro, dan kun je inschatten op een lineaire manier wat een goede prijs zou zijn voor de tijden tussenin.
Voordeel stem & leaf display over frequency distribution table:
stem & leaf geeft je specifieke waarde, frequency distribution geeft je sneller idee van frequentie.
Tail of the distribution =
de lage kant in een asymmetrische distributie, waar het naar afzwakt.