vl2 Flashcards
jedes Maß der zentralen Tendenz (Mittelwert, Median, Modalwert) sollte immer von zwei Angaben begleitet sein:
- auf wievielen Werten (n) beruht dieses Maß?
2. wie eng (Angabe zB von sx oder IQB) gruppiert sich die gesamte Verteilung der Daten um diesen zentralen Wert herum?
Modalwert:
der häufigste einzelne Wert, die häufigste Klasse (Intervall)
das arithmetische Mittel:
(“Mittelwert”): die Summe aller Daten, dividiert durch deren Anzahl,
Vorteil vom Modalwert:
der Modalwert KOMMT in den Daten SELBST tatsächlich als Wert VOR
und kann auch bei NOMINALEN KATEGORISCHEN Daten verwendet werden
Nachteil vom Modalwert:
Bei gruppierten QUANTITATIVEN DATEN (Klassenbildung) HÄNGT sein genauer Wert allerdings von den GRENZEN und der ANZAHL der GEWÄHLTEN INTERVALLE AB.
wann kann der median berechnet werden? Voraussetzungen für die Berechnung des median?
der Median kann bei Ordinaten kategorischen (zb Laufzeiten) Daten und bei quantitativen Daten berechnet werden
Eigenschaften des Mittelwerts:
- ist weniger ausreißerresistent als der median
- benötigt quantitative Daten
- ist in der Regel selbst kein Wert der Stichprobe
Definition Varianz:
- die Varianz ist ein Maß DER ERSTRECKUNGS-BREITE DER MESSWERTE: sie gibt an, WIE ENG sich die (N) DATEN UM DEN MITTELWERT -x herum schmiegen
- die Varianz ist NIEMALS NEGATIV, und NUR genau DANN gleich NULL, WENN ALLE n
MESSWERTE xi genau GLEICH (also auch gleich x) SIND
Eigenschaften der Varianz:
- VERSCHIEBE-EIGENSCHAFT:
die ADDITION derselben Konstanten (c) ZU ALLEN MESSWERTEN: x′i = xi + c VERÄNDERT die VARIANZ NICHT. - SKALENEIGENSCHAFT:
das MULTIPLIZIEREN ALLER MESSWERTE mit dem SELBEN FAKTOR(b) : x′i = b · xi ergibt eine VER B2-FACHUNG DER VARIANZ
wenn du die alle werte mit faktor 5 mutiplizierst, dann musst du die varianz mit 5^2 multiplizieren.
bsp: wenn du die werte in cent statt in euro möchtest ( also mal 100), musst du die ausgewertete varianz mal 100^2 rechnen.
also…
die Standardab- weichung – gleichbedeutend: DIE STREUUNG – s-von-x IST die WURZEL AUS DER VARIANZ
MITTELWERT
- ist das bekannteste und informativste Zentralmaß.
- Er erfordert jedoch quantitative Daten, und ist weniger Ausreißer-resistent (robust) als der Median.
Er ist idR auch selbst kein Wert der Stichprobe (Frauen haben im Mittel 1.36 Kinder)
Graphische Darstellung der Daten: Der Boxplot zeigt für jede Gruppe separat 3 Kennwerte:
- Range (Erstreckungsbereich vom kleinsten - größten Wert): Begrenzung vertikaler Linie
- Interquartilbereich der mittleren 50% aller Daten: dargestellt durch das Rechteck
- Median: dargestellt durch den Punkt.
wovon hängt es ab wie gut der mittelwert representiert wird in seiner zuverlässigkeit?
von der varianz
Standardabweichung (Streuung) = Wurzel aus der Varianz
was sind die wichtigen eingeschaften?
- Varianz & SD spielen in fast allen Bereichen der Statistik eine zentrale Rolle
- gehören zum arithmetischen Mittel
Interquartilbereich (IQB):
Alternatives Streuungsmaß
ist jener Bereich, der die mittleren 50% einer Verteilung abdeckt, die zwischen den kleinsten & größten 25% aller Daten liegen
- gehört zum Median
jedes Maß der zentralen Tendenz (
, xmed, xmod) sollte immer von 2 Angaben begleitet sein:
- auf wie vielen Werten (n) beruht dieses Maß?
2. wie eng (sx oder IQB) gruppiert sich die gesamte Verteilung um diesen zentralen Wert