6. Deskriptive Statistik Flashcards
Welche Skalenniveaus gibt es?
- nominal
- ordinal
- metrisch
Was ist die Nominalskala (kategorial)?
- qualitativ
- kategorial, keine Reihenfolge
- bei 2 Kategorien: dichotom (binär)
- gleich oder ungleich (keine Rechenoperationen)
Was sind Beispiele für die Nominalskala?
Geschlecht:
- weiblich
- männlich
- divers
Blutgruppe
- A
- B
- AB
- 0
Myokardinfarkt
- ja
- nein
Was ist die Ordinalskala (kategorial)?
- mit Rangordnung:
- größer/kleiner, mehr/weniger etc.
- keine Rechenoperationen (mit den Daten)
Was sind Beispiele für die Ordinalskalen?
- Schulnoten
- Schweregrad der Erkrankung: leicht, mittel, schwer
Was ist die metrische Skala?
- kontinuierlich (Bsp. Blutdruck) oder diskret (Bsp. Anzahl kariöser Zähne)
- Rechenoperationen möglich
- andere Bezeichnungen: stetig, kardinal
Was sind Beispiele für die metrische Skala?
- Körpergröße
- Blutdruck
- Überlebenszeit
Was ist die Intervallskala (als metrische Skala)?
- es existiert kein absoluter Nullpunkt
- Beispiel:
- Datum (künstlicher Nullpunkt)
- Grad Fahrenheit (20° sind nicht doppelt so warm wie 10°F)
Was ist die Verhältnisskala (als metrische Skala)?
- absoluter Nullpunkt existiert
- Beispiel:
- Grad Kelvin
- Einkommen
Inwiefern können Merkmale kategorisiert werden?
- Alter: <40 / =/> 40
- Blutdruck: normal/hoch
Wie können metrische Daten zusammengefasst werden?
- in Histogrammen (für metrische Variablen)
- Normalverteilung (meist sichtbar? -> _/_)
Was ist der Mittelwert?
- “Durchschnitt”
- Summe aller Werte, dividiert durch die Anzahl der Werte
Was ist der Median?
- alle Werte werden der Größe nach sortiert
-> Median: Mitte der sortierten Werte - 50% der Daten sind kleiner (gleich) und 50% sind größer (gleich) dem Median
- bei gerader Anzahl an Werten: Mittelwert der beiden mittleren Werte
- von Ausreißern kaum beeinflusst
-> kann bei schiefen, unsymmetrischen Verteilungen besser interpretiert werden
=> teilt Stichprobe in zwei gleiche Hälften
Was sind der Mittelwert und der Median bei symmetrischer Verteilung?
- gleich
Welche Vorteile hat der Median?
- wird kaum von Ausreißern beeinflusst (Eigenschaft, kein Qualitätskriterium)
- Median kann bei sehr schiefen Verteilung z.T. sinnvoller interpretiert werden
Wann ist Mittelwert und wann der Median sinnvoller?
- abhängig von der Verteilung der Daten
- abhängig von der Fragestellung
- evtl. beides betrachten/darstellen
Was machen Quantile?
- zerteilen die Daten in Abschnitte
- dienen der Beschreibung einer nach Größe der Werte geordneten Reihe
- z.B. 25%-Quantil: 25% der Werte sind kleiner (gleich) 75% sind größer (gleich)
- 25%-Quantil –> Median –> 75%-Quantil (Quartile)
- unterscheiden von: Quartil (1 Viertel aller Werte)
Was sind Boxplots?
- anhand von Quantilen können Daten zusammenfassend dargestellt werden
- deskriptiv
- Darstellung von 5 (bzw. 6) verschiedenen Maßzahlen
- gut für Gruppenvergleiche
- Whisker können bspw. 10% und 90%-Quantil abbilden
- bieten optischen Eindruck von Lage des 1. und 3. Quartils (25. und 75. Prozentil) und des Medians sowie von Maximum, Minimum und Streuungsbreite
- 50% der Werte einer Verteilung liegen innerhalb der Box
Wie lässt sich das zusammenfassen?
- deskriptive Statistik ist ein wichtiger Teil der Datenanalyse
- zur deskriptiven Statistik gehören Maßzahlen und grafische Darstellungen der Daten
. je nach Skala der Daten, passender Maßzahlen berechnen und passende Diagrammtypen zählen - Betrachtung von Histogrammen und Boxplots hilft bei
-> der Auswahl von Maßzahlen
-> dem Vergleich von Gruppen
Wie lässt sich das zusammenfassen?
- deskriptive Statistik ist ein wichtiger Teil der Datenanalyse
- zur deskriptiven Statistik gehören Maßzahlen und grafische Darstellungen der Daten
. je nach Skala der Daten, passender Maßzahlen berechnen und passende Diagrammtypen zählen - Betrachtung von Histogrammen und Boxplots hilft bei
-> der Auswahl von Maßzahlen
-> dem Vergleich von Gruppen
(Quizfrage:) Das Jahreseinkommen von acht ausgewählten Personen beträgt:
20 20 20 20 30 30 30 30 [in 1000€]
- der Median ist gleich dem Mittelwert
(Quizfrage:) Ein Millinär zieht hinzu. Er verdient 400.000€ im Jahr:
20 20 20 20 30 30 30 30 400 [in 1000€].
- Mittelwert und Median verändern sich
(Quizfrage:) Die Grafik zeigt eine (theoretische) Verteilung von Blutfettwerten in der deutschen Bevölkerung. _
- Verteilung ist rechtsschief
(Quizfrage:) Die Grafik zeigt eine (theoretische) Verteilung von Blutfettwerten in der deutschen Bevölkerung. _/
- Verteilung ist linksschief
Was ist ein Histogramm?
- zeigt Verteilungsform der Messwerte in stetigen Variablen (kann jeden beliebigen Wert annehmen; im Gegensatz zu diskreten Variablen)
- vorliegende Messwerte werden in angemessene Anzahl von Klassen eingeteilt
- > innerhalb jeder Klasse werden gemessenen Werte gezählt und als Säule in Abbildung dargestellt
- an Histogramm lässt sich erkennen, ob Daten symmetrisch um Mittelwert verteilt sind
- > doch wenn Form des Histogramms linksgipflig () (rechtsschief) oder rechtsgipflig (/) (linksschief), dann sind Werte schief