Deskriptive Datenanalyse II Flashcards

1
Q

Das Gesetz der großen Zahl Def

A

Je größer eine Stichprobe ist, desto stärker nähert sich die Verteilung der enthaltenen Daten (Häufigkeitsverteilung) der wahren Verteilung in der Population an.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Abbildungen für einzelne Variablen

A
  • Balkendiagramme
  • Abbildungen mit Fehlerbalken
  • Liniendiagramme
  • Boxplots
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Der Zusammenhang zwischen Symmetrie, Gipfligkeit und Lagemaßen

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Z-Standardisierung Formel

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Zsfassung

A
  • quantitative Daten lassen sich immer durch Häufigkeiten und Anteile darstellen
  • es entstehen Häufigkeitsverteilungen (Daten einzelner Personen oder Objekte)
  • Häufigkeitsverteilungen lassen sich durch ihre Lage auf der Merkmalsachse (Lagemaße) und ihre Streuung (Streuungsmaße) kennzeichnen
  • Lage- und Streuungsmaße sollen die Verteilung stellvertretend repräsentieren
  • in Forschungsarbeiten werden meist Mittelwert und Standardabweichung angegeben
  • Gesetz der großen Zahl: Häufigkeitsverteilungen aus größeren Stichproben gleichen eher der Populationsverteilung
  • Verteilungen können symmetrisch oder schief sein
  • Verteilungen können unimodal, bimodal oder multimodal sein
  • die meisten Variablen sind in der Population normalverteilt und lassen sich daher mit Mittelwert und Standardabweichung sinnvoll repräsentieren
  • die Standardisierung führt zu vergleichbaren Werten und Kennwerten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Balken- oder Säulendiagramme (Bar Chart)

A

Darstellung einer Variable.
Darstellung von Unterschieden zwischen Gruppen (Auswertung über Kategorien der Gruppenvariable).
Darstellung von mehreren Variablen nebeneinander (Auswertung über mehrere Variablen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Abbildungen mit Fehlerbalken (Error Bars

A

Statt eines Balkens wird ein Punkt dargestellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Liniendiagramme

A

Darstellung von Trends oder Messwiederholungen, z.B. Zeitverlauf bei klinischen Studien.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Boxplot Merkmale:

A

Mittelwert und SD sind idealisiert und setzen symmetrische oder normalverteilte Daten voraus.
Zur Darstellung von Auffälligkeiten (Schiefe, Ausreißer) sind Median und Interquartilsabstand (IQA) besser geeignet.
Ein Boxplot zeigt eine Verteilung basierend auf median, IQA, Whiskers und Ausreißern

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Boxplot - Whiskers Bestimmung:

A
  1. Zäune bestimmen: IQA × 1,5 nach oben und unten zur Box hinzufügen.
  2. Nächste echte Werte auf jeder Seite der Box suchen.
  3. Whiskers zeigen den Bereich der Daten innerhalb dieser Grenzen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Boxplot - Interpretation

A

Box: Höhe zeigt Streuung (IQA).
Median: Position innerhalb der Box zeigt Symmetrie/Schiefe.
Whiskers: Zeigen den Bereich der Daten.
Ausreißer: Werte außerhalb der Whiskers (Sterne oder Kreise)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Merkmale von Verteilungen

A

Gesetz der großen Zahl
Formen von Verteilungen
Normalverteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Das Gesetz der großen Zahl

A

Lage- und Streuungsmaße sind nur dann brauchbar, wenn die Stichprobe die Population gut widerspiegelt.
Je größer die Stichprobe, desto mehr nähert sich die Verteilung der Stichprobe der wahren Verteilung in der Population an.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Formen von Verteilungen

A

Symmetrische Verteilungen (z.B. Glockenform).
Schiefe Verteilungen (z.B. durch Ausreißer oder Decken- bzw. Bodeneffekte).
Unimodale, bimodale oder multimodale Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Die Normalverteilung

A

Symmetrisch, mit einer Glockenform (Gauß’sche Kurve).
Modus, Median und Mittelwert sind identisch.
Grundlage vieler statistischer Analyseverfahren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Standardisierung von Daten

A

Z-Standardisierung, um Werte aus verschiedenen Messinstrumenten vergleichbar zu machen.
Z-Werte haben immer einen Mittelwert von 0 und eine SD von 1.
Vergleichbarkeit und Interpretation durch Standardnormalverteilung.

17
Q

Boxplot - Vorteile

A

Bessere Darstellung von asymmetrischen Verteilungen im Vergleich zu Mittelwert und Standardabweichung.
Effektive Identifikation von Ausreißern und Verteilungsauffälligkeiten.

18
Q

Formen von Verteilungen - Details

A

Symmetrische Verteilung: Werte verteilen sich gleichmäßig um den Mittelwert.
Rechts-schiefe Verteilung: Werte konzentrieren sich auf der linken Seite.
Links-schiefe Verteilung: Werte konzentrieren sich auf der rechten Seite.
Unimodal: Eine Spitze in der Verteilung.
Bimodal: Zwei Spitzen in der Verteilung.
Multimodal: Mehrere Spitzen in der Verteilung.

19
Q

Verteilungen - Auswirkungen auf Lagemaße

A

M und SD sind am besten bei symmetrischen und unimodalen Verteilungen anzuwenden.
Bei schiefen oder multimodalen Verteilungen können Median und Interquartilsabstand (IQA) bessere Maße sein.

20
Q

Das Gesetz der großen Zahl - Anwendung

A

Größere Stichproben führen zu repräsentativeren Verteilungen.
Kleinere Stichproben können zu verzerrten Ergebnissen führen.
Verlassen Sie sich bei der Interpretation von Daten eher auf größere Stichproben.

21
Q

Normalverteilung - Relevanz

A

Viele statistische Tests setzen die Normalverteilung voraus.
Wenn die Daten normalverteilt sind, sind Mittelwert und Standardabweichung verlässliche Maße.
Verteilungen in der Natur und in vielen sozialen Phänomenen tendieren dazu, normalverteilt zu sein.

22
Q

Z-Standardisierung - Schritte

A

Berechnen Sie den Mittelwert (M) und die Standardabweichung (SD) der Daten.
Transformieren Sie jeden Datenpunkt (x) durch die Formel: z = (x - M) / SD.
Der resultierende z-Wert zeigt, wie viele Standardabweichungen ein Wert vom Mittelwert entfernt ist.

23
Q

Z-Standardisierung - Interpretation

A

Z-Werte ermöglichen den Vergleich von Werten aus unterschiedlichen Skalen.
Ein z-Wert von 0 entspricht dem Mittelwert, positive z-Werte liegen über, negative unter dem Mittelwert.
Z-Werte zeigen die relative Position eines Werts innerhalb einer Verteilung.

24
Q

Zusammenfassung - Lagemaße und Streuungsmaße

A

Lagemaße (z.B. Mittelwert, Median) und Streuungsmaße (z.B. Standardabweichung, IQA) sind zentrale Konzepte zur Beschreibung von Verteilungen.
Ihre Auswahl hängt von der Verteilungsform ab: symmetrisch oder schief, unimodal oder multimodal.
Bei schiefen Verteilungen sind Median und IQA oft besser geeignet als Mittelwert und SD.

25
Q

Merkmale von Verteilungen - Häufigkeitsverteilungen

A

Häufigkeitsverteilungen zeigen, wie oft jeder Wert in einem Datensatz vorkommt.
Verteilungen lassen sich durch Lagemaße (Position auf der Achse) und Streuungsmaße (Breite der Verteilung) charakterisieren.

26
Q
A