Quantile, Streuungsmaße und weitere Verteilungsbeschreibung Flashcards

1
Q

Was ist der Nachteil der Nutzung der Spannweite?

A

Nutzt nur zwei Datenpunkte, d.h. ignoriert n − 2 Werte. Eignet sich nicht zum Vergleich zweier Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie ist ein p-Quantil definiert?

A

Jeder Wert xp mit 0 < p < 1, für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was gibt ein Boxplot an?

A
  • Erstes Quartil (x0.25) und drittes Quartil (x0.75) definieren die Box, Boxlänge ist d_Q
  • Länge der Whiskers (Barthaare, Schnurrhaare): Vom Box-Ende
    bis zum größten (kleinsten) Wert (xmin und xmax)
  • Markierung innerhalb der Box entspricht dem Median xmed.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie lässt sich ein Boxplott erweitern?

A

anstatt xmin und xmax:
* Länge der Whiskers vom Box-Ende bis zum größten (kleinsten) Wert, der höchstens 1.5 × d_Q vom dritten (ersten) Quartil entfernt ist.
* Werte, die gröÿer (oder kleiner) sind, werden als Ausreiÿer oder als Extremwerte individuell eingezeichnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie sind Ausreißer definiert?

A

sind Fälle, deren Merkmalsausprägung mehr als 1.5 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie sind Extremwerte definiert?

A

sind Fälle, deren Merkmalsausprägung mehr als 3 dQ von Q1 nach unten oder von Q3 nach oben entfernt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ab welchem Skalenniveau lohnen sich Quantile?

A

Quantile und darauf aufbauende Kennwerte/Grafiken sind sinnvoll für Variablen ab Ordinalskalenniveau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind Violinplots?

A

eine erweiterte Form von Boxplots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist Simpsons normiertes D?

A

Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpson’s normiertes D:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie ist die Varianz definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie stehen Standardabweichung und Varianz in Beziehung zueinander?

A

Varianz ist die quadratische Standardabweichung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie berechnet man die Varianz bei diskreten oder gruppierten Daten?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie ist die Stichprobenvarianz definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie ist der Variationskoeffizient definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie ist die Maßzahl für die Schiefe einer Verteilung: Momentenkoeffizient der Schiefe definiert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie berechnet man die Wölbung einer Verteilung?

A
17
Q

Wie berechnet man den Exzess einer Verteilung?

A
18
Q

Was tut der Exzess?

A

Exzess vergleicht die Wölbung einer unimodale Verteilung mit der der Normalverteilung
Soll charakterisieren, wie stark oder schwach zentrale bzw. Randbereiche der Daten besetzt sind.

19
Q

Womit beschäftigt sich dir Epidemiologie?

A

mit Vorstufen, Folgen und der Verteilung von Erkrankungen sowie den diese Verteilung beeinflussenden Faktoren.
Aussagen über Ist-Zustand aber auch Verlauf von Erkrankungen.

20
Q

Wie berechnet sich die Stichproben-Prävalenz?

A

Die relative Häufigkeit an Erkrankten

21
Q

Wie berechnet man die kumulative Stichproben-Inzidenz?

A

Die neuen Erkrankten durch die ursprüngliche Menge an Gesunden

22
Q

Wie berechnet man die Stichproben-Periodenprävalenz?

A

ursprünglich Erkrankte plus Neuerkrankte durch ursprünglich Gesunde

23
Q

Welchen Prozessen sind Grundgesamtheiten im allgemeinen über die Zeit unterworfen?

A
24
Q

Wie berechnet sich die (Gesamt-) Risikozeit?

A

Die Dauer, die ein Individuum i dem Risiko zu erkranken in einem bestimmten Zeitintervall ∆t ausgesetzt (und gesund) ist, sei ∆ti .

25
Q

Wie berechnet man die Inzidenzdichte?

A

die Menge an Neuerkrankten durch die (Gesamt-) Risikozeit

26
Q

Wie brechnet man die standardisierte Prävalenz?

A
27
Q

Wie berechnet man die Standardabweichung bei gruppierten oder diskreten Daten?

A
28
Q

Welches Skalenniveau setzen Varianz, Standardabweichung und mittlere quadratische Abweichung mindestens voraus?

A

Intervallskalenniveau

29
Q

Löse

A
30
Q

Wie transformiert man Mittelwert und Varianz linear?

A
31
Q

Wie standardisiere ich Daten?

A
32
Q

Welchen Mittelwert und welche Varianz besitzen standardisierte Daten?

A

Mittelwert: 0
Varianz: 1

33
Q

Was ist die direkte Standardisierung?

A

Dabei werden Verteilungen in (Stichproben aus) unterschiedlichen Teilpopulationen vergleichbar gemacht, indem der Anteil an Erkrankungen in jeder Altersgruppe mit dem Anteil dieser Altersgruppe aus der Referenzverteilung multipliziert wird.

34
Q

Was beschreibt die Inzidenz?

A

Neuerkrankungen

35
Q

Was beschreibt die Rekurrenz?

A

Genesungen