Kapitel 2: Univariate Datenanalyse Flashcards
1
Q
Häufigkeitstabelle
A
- Gibt Übersicht über die Merkmalsausprägungen einer Variable
- Zeigt wie häufig jede einzelne Ausprägung vorkommt
2
Q
Absolute Häufigkeit
A
- Anzahl der Fälle bei der die jeweilige Kategorie auftritt
- Abkürzung mit “f”
3
Q
Relative Häufigkeit
A
- Ausweisung als Anteilswerte ausgegeben
- Abkürzung mit “p”
- p = Absolute Häufigkeit/Fallzahl
4
Q
Prozentuale Häufigkeit
A
- Multiplikation der relativen Häufigkeit mit 100%
5
Q
Lagemaße
A
- Beschreiben das Zentrum bzw. typische Werte einer Verteilung
- Wichtigste Lagemaße: Modus, Median, arithmetisches Mittel
- Je höher Skalennivau umso mehr Lagemaße lassen sich berechnen
6
Q
Modus
A
- Auch Modalwert
- Am häufigsten vorkommender gültiger Wert einer Verteilung
- “h” oder “x mit Punkt”
- Muss nicht berechnet werden, sondern Ablesen aus Tabelle möglich
7
Q
Bimodale Verteilung
A
- Zwei Ausprägungen einer Variable kommen gleich häufig vor
8
Q
Median
A
- Auch Zentralwert
- Mittlerer Wert einer geordneten Verteilung
- Voraussetzung: mindestens ordinalskalierte Variable
- Teilt Verteilung in der Mitte
- 50% der Wert kleiner-gleich dem Median und 50% größer-gleich
9
Q
Arithmetisches Mittel
A
- Mittelwert oder Durchschnittswert
- Voraussetzung: mindest intervallskalierte oder pseudometrische Variable
- Leicht beeinflussbar durch Extremwerte
10
Q
Streuungsmaße
A
- Bilden die Variation einer Verteilung abV
11
Q
Varianz
A
- Durchschnittliche quadrierte Abweichung vom arithmetischen Mittel
- Varianz 0: Es liegt keine Streuung vor
- Je größer Varianz desto stärker streuen die einzelnen Werte um das arithmetische Mittel
12
Q
Berechnung der Varianz
A
- Berechnung arithmetisches Mittel
- Berechnung Abweichung vom arithmetischen Mittel für jeden Merkmalswert
- Quadrieren der Abweichung
- Aufsummieren für alle Fälle
- Empirische Varianz: /Fallzahl
- Korrigierte Varianz: /Fallzahl-1
13
Q
Standardabweichung
A
- Durchschnittliche Abweichung vom arithmetischen Mittel
- Wurzel aus der Varianz
- Kleiner Wert: Geringe Streuung der Wert in der Verteilung
- 0: Es liegt keine Streuung vor
14
Q
Normalverteilung
A
- Gauß-Verteilung
- Verteilung ist symmetrisch
- Häufigkeiten nehmen links und rechts gleichermaßen ab
- Modus, Median, arithmetisches Mittel sind identisch
- Abweichung von der Normalverteilung: Schiefe + Wölbung
15
Q
Schiefe
A
- Maß für die horizontale Abweichung einer Verteilung von der Normalverteilung
16
Q
Rechtsschiefe Verteilung
A
- Häufigster Wert befindet sich auf der linken Seite der Verteilung
- Auch: linkssteil
17
Q
Linksschiefe Verteilung
A
- Häufigster Wert befindet sich auf der rechten Seite der Verteilung
- Auch: rechtssteil
18
Q
Berechnung der Schiefe
A
- Bilden Abweichung jedes Wertes vom arithmetischen Mittel
- Differenz durch Standardabweichung dividieren und mit 3 potenzieren
- Summe durch Fallzahl divideren
19
Q
Interpretation der Schiefe
A
- Schiefe < 0: Linksschiefe Verteilung
- Schiefe = 0: Symmetrische Verteilung
- Schiefe > 0: Rechtsschiefe Verteilung
- Schiefe-Werte deren Beträge größer oder gleich 1 als deutliche Abweichung vom symmetrischen Verlauf der Normalverteilung
20
Q
Fechner’sche Lageregel
A
- Symmetrische Verteilung: Modus = Median = arithmetisches Mittel
- Rechtsschiefe Verteilung: Modus < Median < arithmetisches Mittel
- Linksschiefe Verteilung: Modus > Median > Arithmetisches Mittel
21
Q
Wölbung
A
- Maß der vertikalen Abweichung von der Normalverteilung
- Flach- oder breitgipfelig: Weniger Werte in der Mitte und mehr an den Rändern
- Hoch- oder schmalgipfelig: Mehr Werte in der Mitte und weniger an den Rändern
22
Q
Interpretation der Wölbung
A
- Kurtosis < 0: Flachgipflige Verteilung
- Kurtosis = 0: Normalverteilung
- Kurtosis > 0: Hochgipflige Verteilung
23
Q
z-Transformation/z-Standardisierung
A
- Ermöglicht vergleichen von Werten unterschiedlicher Verteilungen
- z-Wert gibt an, wie viele Standardabweichungen ein Wert über oder unter dem Mittelwert liegt
24
Q
Säulen- und Balkendiagramme
A
- Darstellungsform für Merkmale mit wenigen Ausprägungen
- Eignen sich für nominale und Ordinate Variablen
25
Q
Kreisdiagramm
A
- Darstellungsform für Merkmale mit wenigen Ausprägungen
- Eher kritische Betrachtung in Sozialwissenschaften, da durch Darstellung die Interpretation häufig erschwert ist
26
Q
Histogramm
A
- Darstellungsform für metrische Variablen mit vielen Ausprägungen bzw. vielen Gruppen
- Säulen grenzen unmittelbar aneinander an
- Bieten informativen Eindruck der empirischen Häufigkeitsverteilung
- Leichte Erkennbarkeit von Symmetrie, Schiefe und Steilheit
27
Q
Boxplot
A
- Darstellungsform für metrische Merkmale