Kapitel 2: Univariate Datenanalyse Flashcards

1
Q

Häufigkeitstabelle

A
  • Gibt Übersicht über die Merkmalsausprägungen einer Variable
  • Zeigt wie häufig jede einzelne Ausprägung vorkommt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Absolute Häufigkeit

A
  • Anzahl der Fälle bei der die jeweilige Kategorie auftritt
  • Abkürzung mit “f”
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Relative Häufigkeit

A
  • Ausweisung als Anteilswerte ausgegeben
  • Abkürzung mit “p”
  • p = Absolute Häufigkeit/Fallzahl
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Prozentuale Häufigkeit

A
  • Multiplikation der relativen Häufigkeit mit 100%
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Lagemaße

A
  • Beschreiben das Zentrum bzw. typische Werte einer Verteilung
  • Wichtigste Lagemaße: Modus, Median, arithmetisches Mittel
  • Je höher Skalennivau umso mehr Lagemaße lassen sich berechnen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Modus

A
  • Auch Modalwert
  • Am häufigsten vorkommender gültiger Wert einer Verteilung
  • “h” oder “x mit Punkt”
  • Muss nicht berechnet werden, sondern Ablesen aus Tabelle möglich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Bimodale Verteilung

A
  • Zwei Ausprägungen einer Variable kommen gleich häufig vor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Median

A
  • Auch Zentralwert
  • Mittlerer Wert einer geordneten Verteilung
  • Voraussetzung: mindestens ordinalskalierte Variable
  • Teilt Verteilung in der Mitte
  • 50% der Wert kleiner-gleich dem Median und 50% größer-gleich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Arithmetisches Mittel

A
  • Mittelwert oder Durchschnittswert
  • Voraussetzung: mindest intervallskalierte oder pseudometrische Variable
  • Leicht beeinflussbar durch Extremwerte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Streuungsmaße

A
  • Bilden die Variation einer Verteilung abV
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Varianz

A
  • Durchschnittliche quadrierte Abweichung vom arithmetischen Mittel
  • Varianz 0: Es liegt keine Streuung vor
  • Je größer Varianz desto stärker streuen die einzelnen Werte um das arithmetische Mittel
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Berechnung der Varianz

A
  1. Berechnung arithmetisches Mittel
  2. Berechnung Abweichung vom arithmetischen Mittel für jeden Merkmalswert
  3. Quadrieren der Abweichung
  4. Aufsummieren für alle Fälle
  5. Empirische Varianz: /Fallzahl
  6. Korrigierte Varianz: /Fallzahl-1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Standardabweichung

A
  • Durchschnittliche Abweichung vom arithmetischen Mittel
  • Wurzel aus der Varianz
  • Kleiner Wert: Geringe Streuung der Wert in der Verteilung
  • 0: Es liegt keine Streuung vor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Normalverteilung

A
  • Gauß-Verteilung
  • Verteilung ist symmetrisch
  • Häufigkeiten nehmen links und rechts gleichermaßen ab
  • Modus, Median, arithmetisches Mittel sind identisch
  • Abweichung von der Normalverteilung: Schiefe + Wölbung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Schiefe

A
  • Maß für die horizontale Abweichung einer Verteilung von der Normalverteilung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Rechtsschiefe Verteilung

A
  • Häufigster Wert befindet sich auf der linken Seite der Verteilung
  • Auch: linkssteil
17
Q

Linksschiefe Verteilung

A
  • Häufigster Wert befindet sich auf der rechten Seite der Verteilung
  • Auch: rechtssteil
18
Q

Berechnung der Schiefe

A
  1. Bilden Abweichung jedes Wertes vom arithmetischen Mittel
  2. Differenz durch Standardabweichung dividieren und mit 3 potenzieren
  3. Summe durch Fallzahl divideren
19
Q

Interpretation der Schiefe

A
  • Schiefe < 0: Linksschiefe Verteilung
  • Schiefe = 0: Symmetrische Verteilung
  • Schiefe > 0: Rechtsschiefe Verteilung
  • Schiefe-Werte deren Beträge größer oder gleich 1 als deutliche Abweichung vom symmetrischen Verlauf der Normalverteilung
20
Q

Fechner’sche Lageregel

A
  • Symmetrische Verteilung: Modus = Median = arithmetisches Mittel
  • Rechtsschiefe Verteilung: Modus < Median < arithmetisches Mittel
  • Linksschiefe Verteilung: Modus > Median > Arithmetisches Mittel
21
Q

Wölbung

A
  • Maß der vertikalen Abweichung von der Normalverteilung
  • Flach- oder breitgipfelig: Weniger Werte in der Mitte und mehr an den Rändern
  • Hoch- oder schmalgipfelig: Mehr Werte in der Mitte und weniger an den Rändern
22
Q

Interpretation der Wölbung

A
  • Kurtosis < 0: Flachgipflige Verteilung
  • Kurtosis = 0: Normalverteilung
  • Kurtosis > 0: Hochgipflige Verteilung
23
Q

z-Transformation/z-Standardisierung

A
  • Ermöglicht vergleichen von Werten unterschiedlicher Verteilungen
  • z-Wert gibt an, wie viele Standardabweichungen ein Wert über oder unter dem Mittelwert liegt
24
Q

Säulen- und Balkendiagramme

A
  • Darstellungsform für Merkmale mit wenigen Ausprägungen
  • Eignen sich für nominale und Ordinate Variablen
25
Q

Kreisdiagramm

A
  • Darstellungsform für Merkmale mit wenigen Ausprägungen
  • Eher kritische Betrachtung in Sozialwissenschaften, da durch Darstellung die Interpretation häufig erschwert ist
26
Q

Histogramm

A
  • Darstellungsform für metrische Variablen mit vielen Ausprägungen bzw. vielen Gruppen
  • Säulen grenzen unmittelbar aneinander an
  • Bieten informativen Eindruck der empirischen Häufigkeitsverteilung
  • Leichte Erkennbarkeit von Symmetrie, Schiefe und Steilheit
27
Q

Boxplot

A
  • Darstellungsform für metrische Merkmale