Deskriptive Datenanalyse II Flashcards
Das Gesetz der großen Zahl Def
Je größer eine Stichprobe ist, desto stärker nähert sich die Verteilung der enthaltenen Daten (Häufigkeitsverteilung) der wahren Verteilung in der Population an.
Abbildungen für einzelne Variablen
- Balkendiagramme
- Abbildungen mit Fehlerbalken
- Liniendiagramme
- Boxplots
Der Zusammenhang zwischen Symmetrie, Gipfligkeit und Lagemaßen
Z-Standardisierung Formel
Zsfassung
- quantitative Daten lassen sich immer durch Häufigkeiten und Anteile darstellen
- es entstehen Häufigkeitsverteilungen (Daten einzelner Personen oder Objekte)
- Häufigkeitsverteilungen lassen sich durch ihre Lage auf der Merkmalsachse (Lagemaße) und ihre Streuung (Streuungsmaße) kennzeichnen
- Lage- und Streuungsmaße sollen die Verteilung stellvertretend repräsentieren
- in Forschungsarbeiten werden meist Mittelwert und Standardabweichung angegeben
- Gesetz der großen Zahl: Häufigkeitsverteilungen aus größeren Stichproben gleichen eher der Populationsverteilung
- Verteilungen können symmetrisch oder schief sein
- Verteilungen können unimodal, bimodal oder multimodal sein
- die meisten Variablen sind in der Population normalverteilt und lassen sich daher mit Mittelwert und Standardabweichung sinnvoll repräsentieren
- die Standardisierung führt zu vergleichbaren Werten und Kennwerten
Balken- oder Säulendiagramme (Bar Chart)
Darstellung einer Variable.
Darstellung von Unterschieden zwischen Gruppen (Auswertung über Kategorien der Gruppenvariable).
Darstellung von mehreren Variablen nebeneinander (Auswertung über mehrere Variablen)
Abbildungen mit Fehlerbalken (Error Bars
Statt eines Balkens wird ein Punkt dargestellt.
Liniendiagramme
Darstellung von Trends oder Messwiederholungen, z.B. Zeitverlauf bei klinischen Studien.
Boxplot Merkmale:
Mittelwert und SD sind idealisiert und setzen symmetrische oder normalverteilte Daten voraus.
Zur Darstellung von Auffälligkeiten (Schiefe, Ausreißer) sind Median und Interquartilsabstand (IQA) besser geeignet.
Ein Boxplot zeigt eine Verteilung basierend auf median, IQA, Whiskers und Ausreißern
Boxplot - Whiskers Bestimmung:
- Zäune bestimmen: IQA × 1,5 nach oben und unten zur Box hinzufügen.
- Nächste echte Werte auf jeder Seite der Box suchen.
- Whiskers zeigen den Bereich der Daten innerhalb dieser Grenzen.
Boxplot - Interpretation
Box: Höhe zeigt Streuung (IQA).
Median: Position innerhalb der Box zeigt Symmetrie/Schiefe.
Whiskers: Zeigen den Bereich der Daten.
Ausreißer: Werte außerhalb der Whiskers (Sterne oder Kreise)
Merkmale von Verteilungen
Gesetz der großen Zahl
Formen von Verteilungen
Normalverteilung
Das Gesetz der großen Zahl
Lage- und Streuungsmaße sind nur dann brauchbar, wenn die Stichprobe die Population gut widerspiegelt.
Je größer die Stichprobe, desto mehr nähert sich die Verteilung der Stichprobe der wahren Verteilung in der Population an.
Formen von Verteilungen
Symmetrische Verteilungen (z.B. Glockenform).
Schiefe Verteilungen (z.B. durch Ausreißer oder Decken- bzw. Bodeneffekte).
Unimodale, bimodale oder multimodale Verteilungen.
Die Normalverteilung
Symmetrisch, mit einer Glockenform (Gauß’sche Kurve).
Modus, Median und Mittelwert sind identisch.
Grundlage vieler statistischer Analyseverfahren