Deskriptive Statistik - Fragen Flashcards

1
Q

Was sind Vorteile und Nachteile einer Vollerhebung?

A

Vorteile:
- präzise/ fehlerfreie Daten

Nachteil:
- aufwendig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Warum werden Daten manchmal gruppiert?

A

bei vielen Ausprägungen eines Merkmals dient das der Übersichtlichkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie groß ist die Summe aller absoluten Häufigkeiten? Wie groß ist die Summe aller relativen Häufigkeiten?

A

absolute Häufigkeiten: gleich dem Stichprobenumfang n

relative Häufigkeiten: gleich 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie hängen Verteilungen und Verteilungsfunktion bei einem diskreten und bei einem stetigen Merkmal zusammen?

A
  • innerhalb der Verteilungsfunktion eines diskreten Merkmals ist die Verteilung aufsummiert
  • die Verteilungsfunktion liegt immer auf der Balkenmitte des Histogramms, der Flächeninhalt der Verteilungsfunktion ergibt 1 —> die Verteilung wird durch die flächentreue des Histogramms angeben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die geeignete Darstellungsform bei einem stetigen Merkmal?

A

Histogramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Gegeben sei ein diskretes Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

A

Man muss die aufsummierten Realisierungen voneinander abziehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Gegeben sei ein stetiges Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

A

Man muss beim Histogramm die Fläche durch die Breite teilen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die geeignete Darstellungsfrom für die Verteilungsfunktion bei einem diskreten Merkmal?

A

Säulendiagramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie sieht jede Verteilungsfunktion vom Verlauf her im wesentlichen aus ?

A

steigend/ progressiv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Warum wird bei Gruppierungen von stetigen Daten auf gleiche Klassenbreiten geachtet ?

A

Wenn die Klassenbreite gleich groß ist, muss nicht darauf geachtet werden, dass die Säulen des Histogramms unterschiedlich groß werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche Eigenschaften der Lorenzkurve dienen der „leichten optischen“ Erfassung von Informationen?

A

Wenn ein Wert eine große Konzentration hat, weicht die Lorentkurve stark von der Winkelhalbierenden ab

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Warum wird die Steigung der Lorenzkurve in jedem Abschnitt größer?

A

Weil immer eine Realisierung dazu genommen wird und sich die Realisierungen in ihrem Wert unterscheiden (gleicher Realisierungswert = gleiche Steigung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie wird der Gini-Koeffizient berechnet?

A

G = Fläche zwischen der Diagonalen und Lorenzkurve / Fläche zwischen Diagonalen und u-Achse (x-Achse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Warum wird der Gini Koeffinzient nicht ganz 1?

A

Damit der Gini Koeffizinet 1 wird, müsste die vollständige Konzentration bei einem Merkmalsträger liegen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wann wird der Gini Koeffizient 0?

A

bei kompletter Gleichverteilung, die Lorenzkurve liegt auf der Winkelhalbierenden (Gleichverteilung unter allen Merkmalsträgern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was besagt die Zentraleigenschaft des arithmetischem Mittels?

A

Summe aller Abweichungen vom arithmetischen Mittel ergibt null

17
Q

Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie verändert sich das arithmetische Mittel?

18
Q

Was ist ein Vorteil und was ist ein Nachteil des arithmetischen Mittels?

A

Nachteil:
- anfällig für Ausreißerdaten

Vorteil:
- gute Übersicht über Konzentration der Daten

19
Q

Welche Kennzahl ist für ordinal skalierte Merkmale am ehesten geeignet, um einen Mittelwert anzugeben?

20
Q

Wann wenden sie das arithmetische im Unterschied zum harmonischen Mittel an ?

A

Wenn sich die Gewichtung der einzelnen Werte auf die Zählergröße bezieht —> harmonisches Mittel

Wenn sich die Gewichtung der einzelnen Werte auf die Nennergröße bezieht —> arithmetisches Mittel

21
Q

Warum werden Daten manchmal getrimmt ?

A

um ein besseres Bild des Hauptdurchschnittes zu bekommen werden Ausreißerdaten weggelassen

22
Q

Wie werden Daten getrimmt ?

A

Nimmt man den höchsten Wert weg, muss auch der niedrigste wegfallen (und umgekehrt)

23
Q

Welchen Vorteil bietet der Median im Vergleich zum arithmetischen Mittel ?

A

Er ist nicht so anfällig für Ausreißerdaten

24
Q

Welche Kennzahlen benötigen sie, um die Lage einer Verteilung zu beschreiben ?

A

Median, Modus und arithmetisches Mittel

25
Bei welchen Daten wird das geometrische Mittel angewendet?
Auch ‚mittleres Wachstum‘. | Findet Anwendung in Finanzwirtschaft/ Mikroökonomie; Realsierungen x1,...,xn sind dabei die Wachstumsfaktoren
26
Bei welchen Kennzahlen müssen die Daten in eine Rangfolge von klein nach groß gebracht werden?
Median
27
Was ist das wichtigste Streuungsmaß?
Varianz
28
Wann wird die Spannweite null ?
Wenn es nur eine Realisierung gibt
29
Wie verändert sich die Spannweite, wenn weitere Daten hinzukommen?
Wird größer
30
Geben sie einen Vorteil und einen Nachteil der Kennzahl ‚Spannweite‘.
Vorteil: - man kann sehen ob es eine hohe/ niedrige Konzentration der Daten gibt Nachteil: - keine Resistenz gegen Ausreißerdaten
31
Inwieweit kann die Varianz bzw. Die Standardabweichung das arithmetische Mittel bei der Charakterisierung von Daten ergänzen?
die Werte geben an wie weit die Daten um das arithmetische Mittel gestreut sind
32
Was besagt der Interquartilabstand?
Besagt Abstand zwischen oberen und unterem Quartil, resistent gegen Ausreißerdaten
33
Worin liegt die Bedeutung der 5-Punkte-Zusammenfassung?
Besteht aus: Xmin; X0,25; Xmed; X0,75; Xmax Man kann daraus auf linkssteile/ rechtssteile Verteilung schließen Wenn Verteilung annähernd symmetrisch zum Median ist, sind X0,25 und X0,75 etwa gleich vom Median entfernt
34
Führen sie den Beweis für die Gleichheit der beiden Varianzformeln ohne nachzuschauen
Ja
35
Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie ändert sich die Varianz?
Sie bleibt gleich
36
Gegeben sind mehrere Datengruppen mit jeweils ihren arithmetischen Mitteln und ihren Varianzen. Kann man die jeweiligen Kennzahlen vergleichen? Begründen sie.
Arithmetische Mittel kann man vergleichen. Standardabweichungen müssen normiert werden durch Berechnung des Variationskoeffizienten