Quantile, Streuungsmaße und weitere Verteilungsbeschreibung Flashcards
Was ist der Nachteil der Nutzung der Spannweite?
Nutzt nur zwei Datenpunkte, d.h. ignoriert n − 2 Werte. Eignet sich nicht zum Vergleich zweier Verteilungen.
Wie ist ein p-Quantil definiert?
Jeder Wert xp mit 0 < p < 1, für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil
Was gibt ein Boxplot an?
- Erstes Quartil (x0.25) und drittes Quartil (x0.75) definieren die Box, Boxlänge ist d_Q
- Länge der Whiskers (Barthaare, Schnurrhaare): Vom Box-Ende
bis zum größten (kleinsten) Wert (xmin und xmax) - Markierung innerhalb der Box entspricht dem Median xmed.
Wie lässt sich ein Boxplott erweitern?
anstatt xmin und xmax:
* Länge der Whiskers vom Box-Ende bis zum größten (kleinsten) Wert, der höchstens 1.5 × d_Q vom dritten (ersten) Quartil entfernt ist.
* Werte, die gröÿer (oder kleiner) sind, werden als Ausreiÿer oder als Extremwerte individuell eingezeichnet.
Wie sind Ausreißer definiert?
sind Fälle, deren Merkmalsausprägung mehr als 1.5 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.
Wie sind Extremwerte definiert?
sind Fälle, deren Merkmalsausprägung mehr als 3 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.
Ab welchem Skalenniveau lohnen sich Quantile?
Quantile und darauf aufbauende Kennwerte/Grafiken sind sinnvoll für Variablen ab Ordinalskalenniveau.
Was sind Violinplots?
eine erweiterte Form von Boxplots
Was ist Simpsons normiertes D?
Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpson’s normiertes D:
Wie ist die Varianz definiert?
Wie stehen Standardabweichung und Varianz in Beziehung zueinander?
Varianz ist die quadratische Standardabweichung
Wie berechnet man die Varianz bei diskreten oder gruppierten Daten?
Wie ist die Stichprobenvarianz definiert?
Wie ist der Variationskoeffizient definiert?
Wie ist die Maßzahl für die Schiefe einer Verteilung: Momentenkoeffizient der Schiefe definiert?