1. Univariate deskriptive Statistik Flashcards
Urliste
Matrix mit nur einer Spalte und n Zeilen; ungeordnete Liste
Lagemaße
Maße der zentralen Tendenz einer Häufigkeitsverteilung; versuchen, in einer einzigen Zahl auszudrücken, welcher Wert der repräsentativste für die gesamte Verteilung ist
Beispiel: Modalwert, Median
Dispersionsmaße
versuchen, in einer einzigen Zahl auszudrücken, wie unterschiedlich die Merkmalsausprägungen über die Merkmalsträger hinweg sind
Modalwert (Modus)
Wert der Kategorie, der die meisten Merkmalsträger angehören
– reagiert sensibel auf leichte Veränderungen der Verteilung im Gipfelbereich
– unsensibel gegen Ausreißer
– ist bei Gleichverteilungen und multimodalen Verteilungen nicht definiert
maximale Dispersion
alle Kategorien sind gleich häufig besetzt
minimale Dispersion
alle Merkmalsträger tragen den gleichen Messwert
singuläre Daten
Rangdaten; jede Person erhält (typischerweise) einen eigenen Messwert; gleiche Werte -> Rangbindung
Beispiel: Ergebnis-Liste 100-Meter-Lauf
kategoriale Daten
in Kategorien gruppierte Daten
Beispiel: Schulnoten
kumulierte Häufigkeit
Die kumulierte Häufigkeit einer Merkmalsausprägung entspricht der Menge aller Objekte, die diese oder eine kleinere Merkmalsausprägung aufweisen.
Median
Zentralwert; 50 % der Daten sind kleiner als der oder gleich dem Median, 50 % der Daten sind größer als der oder gleich dem Median
– auch bei Gleichverteilungen definiert
– unsensibel gegenüber Ausreißern
arithmetisches Mittel
Mittelwert, Durchschnitt, Durchschnittswert; Summe aller Messwerte geteilt durch deren Anzahl
– auch bei Gleichverteilungen definiert
– sensibel gegenüber Ausreißern
geometrisches Mittel
Produkt aller Werte, aus welchem dann die n-te Wurzel gezogen wird
– eignet sich als Maß der zentralen Tendenz besonders dann, wenn sich der Unterschied zweier Merkmalsausprägungen besser durch ihr Verhältnis als durch eine Differenz beschreiben lässt; Beispiel: Zuwachsraten
getrimmtes Mittel
ein bestimmter Prozentsatz der kleinsten und größten Werten wird vor der Berechnung des arithmetischen Mittels entfernt
winsorisiertes Mittel
Die unteren Extremwerte werden auf den niedrigsten, die oberen auf den höchsten „gezählten“ Wert gesetzt.
Streubereich (SB)
Wertebereich, in dem alle beobachteten Werte liegen