Quantile, Streuungsmaße und weitere Verteilungsbeschreibung Flashcards
Was ist der Nachteil der Nutzung der Spannweite?
Nutzt nur zwei Datenpunkte, d.h. ignoriert n − 2 Werte. Eignet sich nicht zum Vergleich zweier Verteilungen.
Wie ist ein p-Quantil definiert?
Jeder Wert xp mit 0 < p < 1, für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil
Was gibt ein Boxplot an?
- Erstes Quartil (x0.25) und drittes Quartil (x0.75) definieren die Box, Boxlänge ist d_Q
- Länge der Whiskers (Barthaare, Schnurrhaare): Vom Box-Ende
bis zum größten (kleinsten) Wert (xmin und xmax) - Markierung innerhalb der Box entspricht dem Median xmed.
Wie lässt sich ein Boxplott erweitern?
anstatt xmin und xmax:
* Länge der Whiskers vom Box-Ende bis zum größten (kleinsten) Wert, der höchstens 1.5 × d_Q vom dritten (ersten) Quartil entfernt ist.
* Werte, die gröÿer (oder kleiner) sind, werden als Ausreiÿer oder als Extremwerte individuell eingezeichnet.
Wie sind Ausreißer definiert?
sind Fälle, deren Merkmalsausprägung mehr als 1.5 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.
Wie sind Extremwerte definiert?
sind Fälle, deren Merkmalsausprägung mehr als 3 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.
Ab welchem Skalenniveau lohnen sich Quantile?
Quantile und darauf aufbauende Kennwerte/Grafiken sind sinnvoll für Variablen ab Ordinalskalenniveau.
Was sind Violinplots?
eine erweiterte Form von Boxplots
Was ist Simpsons normiertes D?
Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpson’s normiertes D:
Wie ist die Varianz definiert?
Wie stehen Standardabweichung und Varianz in Beziehung zueinander?
Varianz ist die quadratische Standardabweichung
Wie berechnet man die Varianz bei diskreten oder gruppierten Daten?
Wie ist die Stichprobenvarianz definiert?
Wie ist der Variationskoeffizient definiert?
Wie ist die Maßzahl für die Schiefe einer Verteilung: Momentenkoeffizient der Schiefe definiert?
Wie berechnet man die Wölbung einer Verteilung?
Wie berechnet man den Exzess einer Verteilung?
Was tut der Exzess?
Exzess vergleicht die Wölbung einer unimodale Verteilung mit der der Normalverteilung
Soll charakterisieren, wie stark oder schwach zentrale bzw. Randbereiche der Daten besetzt sind.
Womit beschäftigt sich dir Epidemiologie?
mit Vorstufen, Folgen und der Verteilung von Erkrankungen sowie den diese Verteilung beeinflussenden Faktoren.
Aussagen über Ist-Zustand aber auch Verlauf von Erkrankungen.
Wie berechnet sich die Stichproben-Prävalenz?
Die relative Häufigkeit an Erkrankten
Wie berechnet man die kumulative Stichproben-Inzidenz?
Die neuen Erkrankten durch die ursprüngliche Menge an Gesunden
Wie berechnet man die Stichproben-Periodenprävalenz?
ursprünglich Erkrankte plus Neuerkrankte durch ursprünglich Gesunde
Welchen Prozessen sind Grundgesamtheiten im allgemeinen über die Zeit unterworfen?
Wie berechnet sich die (Gesamt-) Risikozeit?
Die Dauer, die ein Individuum i dem Risiko zu erkranken in einem bestimmten Zeitintervall ∆t ausgesetzt (und gesund) ist, sei ∆ti .