Sitzung 6: Eindimensionale Häugkeitsverteilungen und Maßzahlen Flashcards

1
Q

Das Skalenniveau gibt an, wie viel …….. in einer Variable steckt.

A

Informationsgehalt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

A) Jedes statistische Verfahren erfordert ein bestimmtes …………
B) Je höher das Skalenniveau eines Merkmals ist, umso mehr ……………. Stehen zur Verfügung.

A

A) Skalenniveau
B) statistische Verfahren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Eindimensional

A

Univariat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist ein Beispiel, wie man nominalskalierte Merkmale darstellen kann?

A

Strichliste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist der erste Schritt der quanitativen Datenanalyse?

A

Das Auszählen der Untersuchungsfälle in den Rohdaten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wann spricht man von eindimensionalen (univariaten) Häufigkeitsverteilungen?

A

Wenn nur ein Merkmal betrachtet wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was bedeutet kumuliert?

A

= AUFADDIERT In der Statistik bedeutet “kumuliert” die Summierung oder Anhäufung von Werten über einen bestimmten Zeitraum oder eine bestimmte Anzahl von Ereignissen. Kumulierte Daten zeigen die Gesamtsumme oder den kumulierten Effekt an, indem sie kontinuierlich die vorherigen Werte aufaddieren. Dies kann beispielsweise bei kumulierten Häufigkeiten oder kumulierten Prozenten der Fall sein, wenn man schrittweise Daten akkumuliert, um den Gesamteffekt zu veranschaulichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der Unterschied von relativer und absoluter Wahrscheinlichkeit?

A

absolute Wahrscheinlichkeit = konkrete Zahlen

relative Wahrscheinlichkeit = das Verhältnis von Wahrscheinlichkeiten zweier Ereignisse darstellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was gibt * an?

A

Dass es sich um klassierte Daten handelt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist ein Histogramm?

A

Ein Histogramm ist eine grafische Darstellung der Verteilung von Daten. Es zeigt die Häufigkeit oder Anzahl von Datenpunkten in bestimmten Intervallen, die als Bins bezeichnet werden.
Histogramme werden oft verwendet, um die Verteilung von Daten zu visualisieren, um Muster, Trends oder Ausreißer leichter zu erkennen. Sie sind besonders nützlich bei kontinuierlichen Daten, wie beispielsweise Altersgruppen oder Einkommensklassen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was wird in der Regel zur Konstruktion von Histogrammen verwendet?

A

Konstante Klassenbreiten
- Klassenanzahl sollte nicht zu groß (unübersichtlich) aber auch nicht zu klein (Informationsverlust - z.B. Einkommen von 0-10000€ in einer Klasse) sein
Daumenregel für die Anzahl an Klassen K = Wurzel aus n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wann sind unterschiedliche Klassenbreiten sinnvoll?

A

Unterschiedliche Klassenbreiten sind sinnvoll, sofern die Daten sehr stark variieren und dadurch keine sinnvolle feste Klassenbreiten gefunden werden kann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Stem-and-leaf Diagramme?

A

Ein Stem-and-Leaf Diagramm (Stängel-und-Blatt-Diagramm) ist eine Methode der Datenvisualisierung, die insbesondere für kleinere Datensätze verwendet wird. Es ist eine einfache Möglichkeit, die Verteilung und die einzelnen Datenpunkte darzustellen. Hier ist, wie es funktioniert:

  1. Stämme (Stems):
    • Die ersten Ziffern der Daten bilden die Stämme. Zum Beispiel, wenn deine Daten zwischen 12 und 45 liegen, sind die Stämme 1, 2, 3, und 4.
  2. Blätter:
    • Die letzten Ziffern der Daten bilden die Blätter. Diese werden neben den entsprechenden Stämmen platziert.
  3. Anordnung:
    • Du ordnest die Blätter in aufsteigender Reihenfolge neben ihren jeweiligen Stämmen an.

Ein Beispiel:
~~~
Stamm: 2
Blätter: 4 5 7

Stamm: 3
Blätter: 1 4 7

Stamm: 4
Blätter: 0 3 5
~~~

Dies repräsentiert Daten wie 24, 25, 27, 31, 34, 37, 40, 43, 45.

Stem-and-Leaf Diagramme sind besonders nützlich, um schnell einen Eindruck von der Verteilung der Daten zu bekommen und gleichzeitig die genauen Werte zu sehen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist ein Vorteil von Stem and Leaf Diagrammen?

A

Genaue Information steht im Diagramm und wir können die Information gleichzeitig anhand einer Kurve vergleichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was beschrieben Maßzahlen?

A

Bestimmte Eigenschaften der Daten durch eine Zahl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind Arten von Maßzahlen?

A
  • Verhältniszahlen
  • Indexzahlen
  • Verteilungszahlen
17
Q

Was ermöglichen Maßzahlen?

A
  • eine Reduzierung der Komplexität des Datenmaterials
  • einen schnelleren Überblick über die Daten
  • den einfachen Vergleich mit anderen Verteilungen
18
Q

Was ist der Modus bei diskreten Daten?

A

Merkmalswert, für den die relative Häufigkeit ihr Maximum annimmt. (Häufigster Wert)

19
Q

Was sit der Modus bei stetigen Merkmalen?

A

Die Klasse mit der größten Häufigkeitsdichte heißt modale Klasse, ihre Klassenmitte definiert man als Modalwert.

20
Q

Was ist der Median?

A

Der Median ist der Wert, oberhalb und unterhalb dessen je 50 % der Merkmalswerte liegen.

21
Q

Ab wann ist das geometrische Mittel berechenbar?

A

Ab Verhältnisskalenniveau

22
Q

Wozu wird das geometrische Mittel unter anderem verwendet?

A

Zur Berechnung von Wachstumsraten

23
Q

Mittelwerte

A
  • Modus
  • Median
  • arithmetisches Mittel
  • Geometrisches Mittel
24
Q

Mittelwerte im Vergleich

A

Modus:
- anschaulich, einfach zu vermitteln
- nicht durch Extremwerte beeinflusst
- schlechtes Maß für die zentrale Tendenz bei sehr schiefen Verteilungen

Median:
- robust gegenüber Ausreißern
- für schiefe Verteilungen recht gut geeignet

Arithmetisches Mittel:
- empfindlich gegenüber Ausreißern
- Verteilung sollte möglichst symmetrisch sein
- Basis für einen Großteil der schließenden Statistik

Geometrisches Mittel:
- robust gegenüber Ausreißern und schiefen Verteilungen
- vergleichsweise komplexe Interpretation = selten verwendet

25
Q

Was ist der Unterschied von Modus, Median und arithmetischen Mittel?

A
  1. Modus:
    Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt. Ein Datensatz kann mehrere Modi haben (bimodal, trimodal usw.) oder keinen Modus, wenn alle Werte einzigartig sind.
    1. Median:
      Der Median ist der mittlere Wert in einem sortierten Datensatz. Wenn die Anzahl der Werte ungerade ist, ist der Median der Wert in der Mitte. Bei einer geraden Anzahl wird der Median durch Durchschnitt der beiden mittleren Werte berechnet.
    2. Arithmetisches Mittel:
      Das arithmetische Mittel, auch Durchschnitt genannt, wird berechnet, indem man die Summe aller Werte durch die Anzahl der Werte teilt. Es ist die gebräuchlichste Form des Durchschnitts.
26
Q

Streuungsmaße

A

(auch Dispersions- oder Verteilungsmaße) geben an, ob die Merkmalswerte einer Verteilung eng beieinander liegen oder weit über die Skala verteilt sind.

27
Q

Was ist die Spannweite

A

Die Differenz zwischen dem größten und dem kleinsten Merkmalswert

28
Q

Ab wann sind Quantile berechenbar?

A

Ab Ordinalskalenniveau

29
Q

Was ist der Quartilabstand?

A

QA (interquartile range)
Differenz zwischen dem dritten und dem ersten Quartal

QA = Q3-Q1

30
Q

Was ist eine weitere Möglichkeit, Verteilungen darzustellen?

A

Boxplot

31
Q

Vorteile Boxplot

A
  • Besonders geeignet zum Vergleich der Verteilung von Werten in Gruppen.
  • Lage des Medians innerhalb der Box indiziert Symmetrie bzw. Asymmetrie der Verteilung.
32
Q

Wie kann man Schiefe und Wölbung berechnen?

A

Über zentrale Momente

33
Q

Wann werden Messzahlen verwendet?

A

Um Vergleiche im Zeitverlauf durchzuführen

34
Q

Interpretation alpha (Schiefe/Wölbung)

A

Alpha = 0 - symmetrisch
Alpha = + - rechtsschief
Alpha = - - linksschief

35
Q

Variationskoeffizient Interpretation

A

Die Streuung beträgt …% des arithmetischen Mittels.

36
Q

Was brauche ich alles für einen Boxplot?

A
  • Q1, Q3
  • Median
  • größter und kleinster Wert
37
Q

Was mache ich wenn es keinen Modus gibt?

A

Klassen breite bestimmen, gucken wo mehr Merkmalsträger sind, modale Klasse bestimmen

38
Q

Berechnung Wachstumsfaktoren

A

(Aktueller Wert - Alter Wert) / alter Wert