5 - Univariante Analyse Flashcards

1
Q

Was ist die univariante Analyse?

A

Analyse der Verteilungen einzelner Variablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Worauf bezieht sich die univariante Analyse

A

Sie bezieht sich auf Kollektive.

Ausprägungen und durchschnittliche Werte beschreiben somit eine Gruppe und nicht einzelne Personen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie können Verteilungen der univarianten Analyse dargestellt werden?

A

Verteilungen können in tabellarischer Form dargestellt (Häufigkeitstabellen) oder durch Grafiken illustriert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was stehen der univarianten Analyse zur Verfügung?

A
  • je nach Skalenniveau stehen ihr statistische Maßzahlen/Kennwerte zur Verfügung

Warum - zur Beschreibung der Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie lauten die 3 Gruppen der Maßzahlen?

A
  • Maße der zentralen Tendenz: zentrale Werte (Mittelwert) der Verteilung
  • Streuungsmaße: charakterisieren die Variabilität eines Merkmals und ermöglichen so Aussagen über die Homogenität/Heterogenität der Stichprobe bezüglich eines Merkmals.
  • Verteilungsmaße: Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was bedeuten Kennwerte auch immer?

A

= Inforeduktion,

daher stets die Häufigkeitstabelle heranziehen und je Variable vergleichen!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind die Kennwerte der zentralen Tendenz?

A

Kennzeichnung der Lage des Zentrums (Mittelwerte) einer (Häufigkeits‐)Verteilung

  • Modus (größte Häufigkeit - nominal)
  • Median (mittlere Position)
    …. ordinal)
  • Mittelwert bzw. arithmetisches Mittel (Zentralität der Werte -metrisch)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die nützlichste Funktion des Modus?

A

nützlichste Funktion des Modus ist die Charakterisierung bi‐ und multimodaler Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was macht der Median?

A

Sie teilt die Menge der gereihten Messwerte in zwei gleich große Hälften, d.H.
- bei metrischen Daten: 50% niedrigere Werte, 50% höhere Werte

  • bei ordinalen Daten: „Medianklasse“ (d.H. in welcher Kategorie 50% erreicht wurden, bezieht sich auf die kummulierten Prozent)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was repräsentiert der Median bei geraden und ungeraden Anzahlen bei Fällen?

A

ungerade Anzahl an Fällen: Median repräsentiert tatsächlich vorhandenen Wert

gerade Anzahl von Fällen: Median ist der halbierte Wert der mittleren beiden Fälle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist der Vorteil eines Medians

A

im Vergleich zum Mittelwert: er ist relativ robust gegen Ausreißer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Mittelwert?

A

Gängiges Maß zur durchschnittlichen Berechnung von Ergebnissen.

Immer auch die Standardabweichung erwähnen!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist ein Nachteil beim Mittelwert?

A

Mittelwert ist anfällig für Ausreißer und kann bei Extremwerten und bei asymmetrischen Verteilungen verzerrt
sein.
Daher bei Verzerrungen innerhalb der Daten besser Median verwenden!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist ein Streuungsmaß?

A

Charakterisierung der Variabilität eines Merkmals anhand der Heterogenität/Homogenität der Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nenne die unterschiedlichen ordinalen Streuungsmaße?

A
  • Min, Max., Range

- Quartile und Quartilabstand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Beschreibe Minimum, Maximum und Range.

A
  • Range (Spannweite) ist die Differenz zwischen dem größten (max.) und kleinsten (min.) Messwert innerhalb der Verteilung.
17
Q

Was ist ein Quartil?

A
  • Quartile bilden Schnittpunkte zw. den Vierteln einer Verteilung
  • Teilt man eine Verteilung in Quartile, trennen diese die oberen und unteren 25% von den mittleren 50% der Verteilung.
18
Q

Was ist ein Quartilabstand?

A

= Interquartilsbereich:

  • die mittleren 50% der Verteilung (zwischen dem 1. und 3. Quartil bzw. 25 und 75 %) d.H. die unteren und oberen 25% der Verteilung werden ignoriert.

Der Wert ist wiederum (ähnlich wie der Median) eher bei extremen Verteilungen relevant.

  • Analysegrafik: Boxplot
19
Q

Was ist die metrische Streuungsmaße?

A

= berücksichtigen alle Messwerte der Verteilung (nicht nur zwei Messwerte wie bei Quartilsabstand und Range)

20
Q

Was beinhaltet die metrische Streuungsmaße?

A
  • Varianz

- Standardabweichung

21
Q

Beschreibe die Varianz?

A
  • Kann nicht interpretiert werden.
  • Würde man die Summe der Abweichungen jedes einzelnen Messwertes vom arithmetischen Mittelwert berechnen, würde man 0 erhalten -> daher für Varianzberechnung - quadrierten Abweichungen.

Varianz = Vor(berechnungs)stufe der Standardabweichung.

22
Q

Beschreibe die Standardabweichung!

A
  • Wurzel aus der Varianz
  • Kennwert in der Einheit der Variable (wie z.B. Skalenpunkte, Alter, …)
  • exakte Aussage bzw. Beurteilung über Streuung nur durch Vergleich von Verteilungen mit gleicher Skalierung.
  • weil je nach Skalierung der Variable unterschiedlich große Streuungswerte entstehen.
23
Q

Welche Formen von Verteilungen gibt es?

A
  • Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
  • Abstraktion: von konkreter Verteilung zu „Verteilungstypen“
  • nur für metrisches Skalenniveau
24
Q

Welche Faustregeln der Interpretation gibt es?

A
  • Standardfehler (Standard Error) verdoppeln
  • Wert mit Wölbung (Kurtosis) bzw. Schiefe (Skewness) vergleichen

Interpretation:
- „signifikant“, wenn
Wert höher als ihr verdoppelter Standardfehler von der Normalverteilung (sonst normalverteilt)

  • „starke Streuung“ nur
    bei flacher Wölbung
  • Vorzeichen (spielt beim Vergleich mit dem Standardfehler keine Rolle
25
Q

Was verursachen die Vorzeichen bei einer Verteilung?

A

+ rechtsschief bzw. linkssteil ->steile Wölbung

  • linksschief bzw. rechtssteil –>flache Wölbung
26
Q

Was ist bei schiefen Verteilungen zu beachten?

A
  • kennzeichnen Modus und Median die zentrale Tendenz häufig besser als das arithmetische Mittel.
  • Ausreißer“ beeinflussen den Mittelwert stärker als Median oder Modus
27
Q

Inwiefern ist die Normalverteilung von Bedeutung?

A
  • sozialwissenschaftliche Daten weichen häufig vom Ideal der symmetrischen Verteilung ab.
  • biologische, naturwissenschaftlichen Daten (wie Körpergröße, ‐gewicht, IQ, …) sind meist normalverteilt (d.H. unimodal und symmetrisch)
28
Q

Was sind die Eigenschaften einer Normalverteilung?

A
  • Glockenförmiger Verlauf
  • Symmetrische Verteilung
  • Modus, Median und Mittelwert fallen zusammen
    und bilden Gipfel der Verteilung
  • Verteilung nähert sich asymptotisch der x‐Achse
29
Q

Warum sind Häufigkeitsverteilungen von Bedeutung?

A

Häufigkeitstabellen sind eine Strategie, eine Übersicht über die Daten zu bekommen.

Man erhält eine Auszählung, wie häufig die Messwerte pro Ausprägung waren.

Werte können erst ab Ordinalskalenniveau interpretiert werden.

30
Q

Wie wird die Häufigkeit dargestellt?

A
  • Bei ungleichen Klassenbreiten erfolgt die Darstellung der Häufigkeit nicht mehr über die Höhe der Balken, sondern über die Fläche.
  • Für jede Klasse muss die Höhe des zu errichtenden Balkens errechnet werden (Häufigkeit/Klassenbreite = Häufigkeitsdichte).
  • Im SPSS besteht keine Möglichkeit, Klassen unterschiedlicher Breite zu definieren. Darstellung der Häufigkeit über die Höhe ist somit nur bei gleichen Klassenbreiten möglich.
31
Q

Was ist die Kategorienbildung?

A

Zusammenfassen von Ausprägungen oder Wertebereichen

32
Q

Nach welchen Kategorien soll eingeteilt werden?

A

Setzung der Klassengrenzen bzw. welche Ausprägungen sollen gruppiert werden?

• Kategorienbildung bei unterschiedlichen Skalenniveaus:
o Nominal: inhaltlich ähnlich
o Ordinal: benachbarte Ausprägungen
o Metrisch: Wertebereiche (Intervalle)

33
Q

Wieviele Kategorien sollen gebildet werden?

A

Inhaltliche Kriterien: häufig ergeben sich natürliche Grenzen
(z.B. Aufenthaltsdauer in Wochen, Ausbildungs‐, Pensionsgrenzen bei Alter)
o Formale Kriterien: Gleiche Klassenbreite bei metrischen Daten; in den Klassen sollten auch annähernd gleiche Häufigkeiten sein