Deskriptive Statistik - Fragen Flashcards

1
Q

Was sind Vorteile und Nachteile einer Vollerhebung?

A

Vorteile:
- präzise/ fehlerfreie Daten

Nachteil:
- aufwendig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Warum werden Daten manchmal gruppiert?

A

bei vielen Ausprägungen eines Merkmals dient das der Übersichtlichkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie groß ist die Summe aller absoluten Häufigkeiten? Wie groß ist die Summe aller relativen Häufigkeiten?

A

absolute Häufigkeiten: gleich dem Stichprobenumfang n

relative Häufigkeiten: gleich 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie hängen Verteilungen und Verteilungsfunktion bei einem diskreten und bei einem stetigen Merkmal zusammen?

A
  • innerhalb der Verteilungsfunktion eines diskreten Merkmals ist die Verteilung aufsummiert
  • die Verteilungsfunktion liegt immer auf der Balkenmitte des Histogramms, der Flächeninhalt der Verteilungsfunktion ergibt 1 —> die Verteilung wird durch die flächentreue des Histogramms angeben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die geeignete Darstellungsform bei einem stetigen Merkmal?

A

Histogramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Gegeben sei ein diskretes Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

A

Man muss die aufsummierten Realisierungen voneinander abziehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Gegeben sei ein stetiges Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

A

Man muss beim Histogramm die Fläche durch die Breite teilen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die geeignete Darstellungsfrom für die Verteilungsfunktion bei einem diskreten Merkmal?

A

Säulendiagramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie sieht jede Verteilungsfunktion vom Verlauf her im wesentlichen aus ?

A

steigend/ progressiv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Warum wird bei Gruppierungen von stetigen Daten auf gleiche Klassenbreiten geachtet ?

A

Wenn die Klassenbreite gleich groß ist, muss nicht darauf geachtet werden, dass die Säulen des Histogramms unterschiedlich groß werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche Eigenschaften der Lorenzkurve dienen der „leichten optischen“ Erfassung von Informationen?

A

Wenn ein Wert eine große Konzentration hat, weicht die Lorentkurve stark von der Winkelhalbierenden ab

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Warum wird die Steigung der Lorenzkurve in jedem Abschnitt größer?

A

Weil immer eine Realisierung dazu genommen wird und sich die Realisierungen in ihrem Wert unterscheiden (gleicher Realisierungswert = gleiche Steigung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie wird der Gini-Koeffizient berechnet?

A

G = Fläche zwischen der Diagonalen und Lorenzkurve / Fläche zwischen Diagonalen und u-Achse (x-Achse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Warum wird der Gini Koeffinzient nicht ganz 1?

A

Damit der Gini Koeffizinet 1 wird, müsste die vollständige Konzentration bei einem Merkmalsträger liegen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wann wird der Gini Koeffizient 0?

A

bei kompletter Gleichverteilung, die Lorenzkurve liegt auf der Winkelhalbierenden (Gleichverteilung unter allen Merkmalsträgern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was besagt die Zentraleigenschaft des arithmetischem Mittels?

A

Summe aller Abweichungen vom arithmetischen Mittel ergibt null

17
Q

Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie verändert sich das arithmetische Mittel?

A

um 5

18
Q

Was ist ein Vorteil und was ist ein Nachteil des arithmetischen Mittels?

A

Nachteil:
- anfällig für Ausreißerdaten

Vorteil:
- gute Übersicht über Konzentration der Daten

19
Q

Welche Kennzahl ist für ordinal skalierte Merkmale am ehesten geeignet, um einen Mittelwert anzugeben?

A

Median

20
Q

Wann wenden sie das arithmetische im Unterschied zum harmonischen Mittel an ?

A

Wenn sich die Gewichtung der einzelnen Werte auf die Zählergröße bezieht —> harmonisches Mittel

Wenn sich die Gewichtung der einzelnen Werte auf die Nennergröße bezieht —> arithmetisches Mittel

21
Q

Warum werden Daten manchmal getrimmt ?

A

um ein besseres Bild des Hauptdurchschnittes zu bekommen werden Ausreißerdaten weggelassen

22
Q

Wie werden Daten getrimmt ?

A

Nimmt man den höchsten Wert weg, muss auch der niedrigste wegfallen (und umgekehrt)

23
Q

Welchen Vorteil bietet der Median im Vergleich zum arithmetischen Mittel ?

A

Er ist nicht so anfällig für Ausreißerdaten

24
Q

Welche Kennzahlen benötigen sie, um die Lage einer Verteilung zu beschreiben ?

A

Median, Modus und arithmetisches Mittel

25
Q

Bei welchen Daten wird das geometrische Mittel angewendet?

A

Auch ‚mittleres Wachstum‘.

Findet Anwendung in Finanzwirtschaft/ Mikroökonomie; Realsierungen x1,…,xn sind dabei die Wachstumsfaktoren

26
Q

Bei welchen Kennzahlen müssen die Daten in eine Rangfolge von klein nach groß gebracht werden?

A

Median

27
Q

Was ist das wichtigste Streuungsmaß?

A

Varianz

28
Q

Wann wird die Spannweite null ?

A

Wenn es nur eine Realisierung gibt

29
Q

Wie verändert sich die Spannweite, wenn weitere Daten hinzukommen?

A

Wird größer

30
Q

Geben sie einen Vorteil und einen Nachteil der Kennzahl ‚Spannweite‘.

A

Vorteil:
- man kann sehen ob es eine hohe/ niedrige Konzentration der Daten gibt

Nachteil:
- keine Resistenz gegen Ausreißerdaten

31
Q

Inwieweit kann die Varianz bzw. Die Standardabweichung das arithmetische Mittel bei der Charakterisierung von Daten ergänzen?

A

die Werte geben an wie weit die Daten um das arithmetische Mittel gestreut sind

32
Q

Was besagt der Interquartilabstand?

A

Besagt Abstand zwischen oberen und unterem Quartil, resistent gegen Ausreißerdaten

33
Q

Worin liegt die Bedeutung der 5-Punkte-Zusammenfassung?

A

Besteht aus:
Xmin; X0,25; Xmed; X0,75; Xmax

Man kann daraus auf linkssteile/ rechtssteile Verteilung schließen

Wenn Verteilung annähernd symmetrisch zum Median ist, sind X0,25 und X0,75 etwa gleich vom Median entfernt

34
Q

Führen sie den Beweis für die Gleichheit der beiden Varianzformeln ohne nachzuschauen

A

Ja

35
Q

Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie ändert sich die Varianz?

A

Sie bleibt gleich

36
Q

Gegeben sind mehrere Datengruppen mit jeweils ihren arithmetischen Mitteln und ihren Varianzen. Kann man die jeweiligen Kennzahlen vergleichen? Begründen sie.

A

Arithmetische Mittel kann man vergleichen. Standardabweichungen müssen normiert werden durch Berechnung des Variationskoeffizienten