Quantile, Streuungsmaße und weitere Verteilungsbeschreibung Flashcards

1
Q

Was ist der Nachteil der Nutzung der Spannweite?

A

Nutzt nur zwei Datenpunkte, d.h. ignoriert n − 2 Werte. Eignet sich nicht zum Vergleich zweier Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie ist ein p-Quantil definiert?

A

Jeder Wert xp mit 0 < p < 1, für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was gibt ein Boxplot an?

A
  • Erstes Quartil (x0.25) und drittes Quartil (x0.75) definieren die Box, Boxlänge ist d_Q
  • Länge der Whiskers (Barthaare, Schnurrhaare): Vom Box-Ende
    bis zum größten (kleinsten) Wert (xmin und xmax)
  • Markierung innerhalb der Box entspricht dem Median xmed.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie lässt sich ein Boxplott erweitern?

A

anstatt xmin und xmax:
* Länge der Whiskers vom Box-Ende bis zum größten (kleinsten) Wert, der höchstens 1.5 × d_Q vom dritten (ersten) Quartil entfernt ist.
* Werte, die gröÿer (oder kleiner) sind, werden als Ausreiÿer oder als Extremwerte individuell eingezeichnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie sind Ausreißer definiert?

A

sind Fälle, deren Merkmalsausprägung mehr als 1.5 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie sind Extremwerte definiert?

A

sind Fälle, deren Merkmalsausprägung mehr als 3 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ab welchem Skalenniveau lohnen sich Quantile?

A

Quantile und darauf aufbauende Kennwerte/Grafiken sind sinnvoll für Variablen ab Ordinalskalenniveau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind Violinplots?

A

eine erweiterte Form von Boxplots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist Simpsons normiertes D?

A

Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpson’s normiertes D:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie ist die Varianz definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie stehen Standardabweichung und Varianz in Beziehung zueinander?

A

Varianz ist die quadratische Standardabweichung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie berechnet man die Varianz bei diskreten oder gruppierten Daten?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie ist die Stichprobenvarianz definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie ist der Variationskoeffizient definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie ist die Maßzahl für die Schiefe einer Verteilung: Momentenkoeffizient der Schiefe definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie berechnet man die Wölbung einer Verteilung?

17
Q

Wie berechnet man den Exzess einer Verteilung?

18
Q

Was tut der Exzess?

A

Exzess vergleicht die Wölbung einer unimodale Verteilung mit der der Normalverteilung
Soll charakterisieren, wie stark oder schwach zentrale bzw. Randbereiche der Daten besetzt sind.

19
Q

Womit beschäftigt sich dir Epidemiologie?

A

mit Vorstufen, Folgen und der Verteilung von Erkrankungen sowie den diese Verteilung beeinflussenden Faktoren.
Aussagen über Ist-Zustand aber auch Verlauf von Erkrankungen.

20
Q

Wie berechnet sich die Stichproben-Prävalenz?

A

Die relative Häufigkeit an Erkrankten

21
Q

Wie berechnet man die kumulative Stichproben-Inzidenz?

A

Die neuen Erkrankten durch die ursprüngliche Menge an Gesunden

22
Q

Wie berechnet man die Stichproben-Periodenprävalenz?

A

ursprünglich Erkrankte plus Neuerkrankte durch ursprünglich Gesunde

23
Q

Welchen Prozessen sind Grundgesamtheiten im allgemeinen über die Zeit unterworfen?

24
Q

Wie berechnet sich die (Gesamt-) Risikozeit?

A

Die Dauer, die ein Individuum i dem Risiko zu erkranken in einem bestimmten Zeitintervall ∆t ausgesetzt (und gesund) ist, sei ∆ti .

25
Wie berechnet man die Inzidenzdichte?
die Menge an Neuerkrankten durch die (Gesamt-) Risikozeit
26
Wie brechnet man die standardisierte Prävalenz?
27
Wie berechnet man die Standardabweichung bei gruppierten oder diskreten Daten?
28
Welches Skalenniveau setzen Varianz, Standardabweichung und mittlere quadratische Abweichung mindestens voraus?
Intervallskalenniveau
29
Löse
30
Wie transformiert man Mittelwert und Varianz linear?
31
Wie standardisiere ich Daten?
32
Welchen Mittelwert und welche Varianz besitzen standardisierte Daten?
Mittelwert: 0 Varianz: 1
33
Was ist die direkte Standardisierung?
Dabei werden Verteilungen in (Stichproben aus) unterschiedlichen Teilpopulationen vergleichbar gemacht, indem der Anteil an Erkrankungen in jeder Altersgruppe mit dem Anteil dieser Altersgruppe aus der Referenzverteilung multipliziert wird.
34
Was beschreibt die Inzidenz?
Neuerkrankungen
35
Was beschreibt die Rekurrenz?
Genesungen