6. Deskriptive Statistik Flashcards

1
Q

Welche Skalenniveaus gibt es?

A
  • nominal
  • ordinal
  • metrisch
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Nominalskala (kategorial)?

A
  • qualitativ
  • kategorial, keine Reihenfolge
  • bei 2 Kategorien: dichotom (binär)
  • gleich oder ungleich (keine Rechenoperationen)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Beispiele für die Nominalskala?

A

Geschlecht:

  • weiblich
  • männlich
  • divers

Blutgruppe

  • A
  • B
  • AB
  • 0

Myokardinfarkt

  • ja
  • nein
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist die Ordinalskala (kategorial)?

A
  • mit Rangordnung:
    • größer/kleiner, mehr/weniger etc.
  • keine Rechenoperationen (mit den Daten)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind Beispiele für die Ordinalskalen?

A
  • Schulnoten

- Schweregrad der Erkrankung: leicht, mittel, schwer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist die metrische Skala?

A
  • kontinuierlich (Bsp. Blutdruck) oder diskret (Bsp. Anzahl kariöser Zähne)
  • Rechenoperationen möglich
  • andere Bezeichnungen: stetig, kardinal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Beispiele für die metrische Skala?

A
  • Körpergröße
  • Blutdruck
  • Überlebenszeit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Intervallskala (als metrische Skala)?

A
  • es existiert kein absoluter Nullpunkt
  • Beispiel:
    • Datum (künstlicher Nullpunkt)
    • Grad Fahrenheit (20° sind nicht doppelt so warm wie 10°F)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist die Verhältnisskala (als metrische Skala)?

A
  • absoluter Nullpunkt existiert
  • Beispiel:
    • Grad Kelvin
    • Einkommen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Inwiefern können Merkmale kategorisiert werden?

A
  • Alter: <40 / =/> 40

- Blutdruck: normal/hoch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie können metrische Daten zusammengefasst werden?

A
  • in Histogrammen (für metrische Variablen)

- Normalverteilung (meist sichtbar? -> _/_)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Mittelwert?

A
  • “Durchschnitt”

- Summe aller Werte, dividiert durch die Anzahl der Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist der Median?

A
  • alle Werte werden der Größe nach sortiert
    -> Median: Mitte der sortierten Werte
  • 50% der Daten sind kleiner (gleich) und 50% sind größer (gleich) dem Median
  • bei gerader Anzahl an Werten: Mittelwert der beiden mittleren Werte
  • von Ausreißern kaum beeinflusst
    -> kann bei schiefen, unsymmetrischen Verteilungen besser interpretiert werden
    => teilt Stichprobe in zwei gleiche Hälften
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was sind der Mittelwert und der Median bei symmetrischer Verteilung?

A
  • gleich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welche Vorteile hat der Median?

A
  • wird kaum von Ausreißern beeinflusst (Eigenschaft, kein Qualitätskriterium)
  • Median kann bei sehr schiefen Verteilung z.T. sinnvoller interpretiert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wann ist Mittelwert und wann der Median sinnvoller?

A
  • abhängig von der Verteilung der Daten
  • abhängig von der Fragestellung
  • evtl. beides betrachten/darstellen
17
Q

Was machen Quantile?

A
  • zerteilen die Daten in Abschnitte
  • dienen der Beschreibung einer nach Größe der Werte geordneten Reihe
  • z.B. 25%-Quantil: 25% der Werte sind kleiner (gleich) 75% sind größer (gleich)
  • 25%-Quantil –> Median –> 75%-Quantil (Quartile)
  • unterscheiden von: Quartil (1 Viertel aller Werte)
18
Q

Was sind Boxplots?

A
  • anhand von Quantilen können Daten zusammenfassend dargestellt werden
  • deskriptiv
  • Darstellung von 5 (bzw. 6) verschiedenen Maßzahlen
  • gut für Gruppenvergleiche
  • Whisker können bspw. 10% und 90%-Quantil abbilden
  • bieten optischen Eindruck von Lage des 1. und 3. Quartils (25. und 75. Prozentil) und des Medians sowie von Maximum, Minimum und Streuungsbreite
  • 50% der Werte einer Verteilung liegen innerhalb der Box
19
Q

Wie lässt sich das zusammenfassen?

A
  • deskriptive Statistik ist ein wichtiger Teil der Datenanalyse
  • zur deskriptiven Statistik gehören Maßzahlen und grafische Darstellungen der Daten
    . je nach Skala der Daten, passender Maßzahlen berechnen und passende Diagrammtypen zählen
  • Betrachtung von Histogrammen und Boxplots hilft bei
    -> der Auswahl von Maßzahlen
    -> dem Vergleich von Gruppen
20
Q

Wie lässt sich das zusammenfassen?

A
  • deskriptive Statistik ist ein wichtiger Teil der Datenanalyse
  • zur deskriptiven Statistik gehören Maßzahlen und grafische Darstellungen der Daten
    . je nach Skala der Daten, passender Maßzahlen berechnen und passende Diagrammtypen zählen
  • Betrachtung von Histogrammen und Boxplots hilft bei
    -> der Auswahl von Maßzahlen
    -> dem Vergleich von Gruppen
21
Q

(Quizfrage:) Das Jahreseinkommen von acht ausgewählten Personen beträgt:
20 20 20 20 30 30 30 30 [in 1000€]

A
  • der Median ist gleich dem Mittelwert
22
Q

(Quizfrage:) Ein Millinär zieht hinzu. Er verdient 400.000€ im Jahr:
20 20 20 20 30 30 30 30 400 [in 1000€].

A
  • Mittelwert und Median verändern sich
23
Q

(Quizfrage:) Die Grafik zeigt eine (theoretische) Verteilung von Blutfettwerten in der deutschen Bevölkerung. _

A
  • Verteilung ist rechtsschief
24
Q

(Quizfrage:) Die Grafik zeigt eine (theoretische) Verteilung von Blutfettwerten in der deutschen Bevölkerung. _/

A
  • Verteilung ist linksschief
25
Q

Was ist ein Histogramm?

A
  • zeigt Verteilungsform der Messwerte in stetigen Variablen (kann jeden beliebigen Wert annehmen; im Gegensatz zu diskreten Variablen)
  • vorliegende Messwerte werden in angemessene Anzahl von Klassen eingeteilt
  • > innerhalb jeder Klasse werden gemessenen Werte gezählt und als Säule in Abbildung dargestellt
  • an Histogramm lässt sich erkennen, ob Daten symmetrisch um Mittelwert verteilt sind
  • > doch wenn Form des Histogramms linksgipflig () (rechtsschief) oder rechtsgipflig (/) (linksschief), dann sind Werte schief