Deskriptive Statistik - Fragen Flashcards
Was sind Vorteile und Nachteile einer Vollerhebung?
Vorteile:
- präzise/ fehlerfreie Daten
Nachteil:
- aufwendig
Warum werden Daten manchmal gruppiert?
bei vielen Ausprägungen eines Merkmals dient das der Übersichtlichkeit
Wie groß ist die Summe aller absoluten Häufigkeiten? Wie groß ist die Summe aller relativen Häufigkeiten?
absolute Häufigkeiten: gleich dem Stichprobenumfang n
relative Häufigkeiten: gleich 1
Wie hängen Verteilungen und Verteilungsfunktion bei einem diskreten und bei einem stetigen Merkmal zusammen?
- innerhalb der Verteilungsfunktion eines diskreten Merkmals ist die Verteilung aufsummiert
- die Verteilungsfunktion liegt immer auf der Balkenmitte des Histogramms, der Flächeninhalt der Verteilungsfunktion ergibt 1 —> die Verteilung wird durch die flächentreue des Histogramms angeben
Was ist die geeignete Darstellungsform bei einem stetigen Merkmal?
Histogramm
Gegeben sei ein diskretes Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?
Man muss die aufsummierten Realisierungen voneinander abziehen
Gegeben sei ein stetiges Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?
Man muss beim Histogramm die Fläche durch die Breite teilen
Was ist die geeignete Darstellungsfrom für die Verteilungsfunktion bei einem diskreten Merkmal?
Säulendiagramm
Wie sieht jede Verteilungsfunktion vom Verlauf her im wesentlichen aus ?
steigend/ progressiv
Warum wird bei Gruppierungen von stetigen Daten auf gleiche Klassenbreiten geachtet ?
Wenn die Klassenbreite gleich groß ist, muss nicht darauf geachtet werden, dass die Säulen des Histogramms unterschiedlich groß werden
Welche Eigenschaften der Lorenzkurve dienen der „leichten optischen“ Erfassung von Informationen?
Wenn ein Wert eine große Konzentration hat, weicht die Lorentkurve stark von der Winkelhalbierenden ab
Warum wird die Steigung der Lorenzkurve in jedem Abschnitt größer?
Weil immer eine Realisierung dazu genommen wird und sich die Realisierungen in ihrem Wert unterscheiden (gleicher Realisierungswert = gleiche Steigung)
Wie wird der Gini-Koeffizient berechnet?
G = Fläche zwischen der Diagonalen und Lorenzkurve / Fläche zwischen Diagonalen und u-Achse (x-Achse)
Warum wird der Gini Koeffinzient nicht ganz 1?
Damit der Gini Koeffizinet 1 wird, müsste die vollständige Konzentration bei einem Merkmalsträger liegen
Wann wird der Gini Koeffizient 0?
bei kompletter Gleichverteilung, die Lorenzkurve liegt auf der Winkelhalbierenden (Gleichverteilung unter allen Merkmalsträgern)
Was besagt die Zentraleigenschaft des arithmetischem Mittels?
Summe aller Abweichungen vom arithmetischen Mittel ergibt null
Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie verändert sich das arithmetische Mittel?
um 5
Was ist ein Vorteil und was ist ein Nachteil des arithmetischen Mittels?
Nachteil:
- anfällig für Ausreißerdaten
Vorteil:
- gute Übersicht über Konzentration der Daten
Welche Kennzahl ist für ordinal skalierte Merkmale am ehesten geeignet, um einen Mittelwert anzugeben?
Median
Wann wenden sie das arithmetische im Unterschied zum harmonischen Mittel an ?
Wenn sich die Gewichtung der einzelnen Werte auf die Zählergröße bezieht —> harmonisches Mittel
Wenn sich die Gewichtung der einzelnen Werte auf die Nennergröße bezieht —> arithmetisches Mittel
Warum werden Daten manchmal getrimmt ?
um ein besseres Bild des Hauptdurchschnittes zu bekommen werden Ausreißerdaten weggelassen
Wie werden Daten getrimmt ?
Nimmt man den höchsten Wert weg, muss auch der niedrigste wegfallen (und umgekehrt)
Welchen Vorteil bietet der Median im Vergleich zum arithmetischen Mittel ?
Er ist nicht so anfällig für Ausreißerdaten
Welche Kennzahlen benötigen sie, um die Lage einer Verteilung zu beschreiben ?
Median, Modus und arithmetisches Mittel
Bei welchen Daten wird das geometrische Mittel angewendet?
Auch ‚mittleres Wachstum‘.
Findet Anwendung in Finanzwirtschaft/ Mikroökonomie; Realsierungen x1,…,xn sind dabei die Wachstumsfaktoren
Bei welchen Kennzahlen müssen die Daten in eine Rangfolge von klein nach groß gebracht werden?
Median
Was ist das wichtigste Streuungsmaß?
Varianz
Wann wird die Spannweite null ?
Wenn es nur eine Realisierung gibt
Wie verändert sich die Spannweite, wenn weitere Daten hinzukommen?
Wird größer
Geben sie einen Vorteil und einen Nachteil der Kennzahl ‚Spannweite‘.
Vorteil:
- man kann sehen ob es eine hohe/ niedrige Konzentration der Daten gibt
Nachteil:
- keine Resistenz gegen Ausreißerdaten
Inwieweit kann die Varianz bzw. Die Standardabweichung das arithmetische Mittel bei der Charakterisierung von Daten ergänzen?
die Werte geben an wie weit die Daten um das arithmetische Mittel gestreut sind
Was besagt der Interquartilabstand?
Besagt Abstand zwischen oberen und unterem Quartil, resistent gegen Ausreißerdaten
Worin liegt die Bedeutung der 5-Punkte-Zusammenfassung?
Besteht aus:
Xmin; X0,25; Xmed; X0,75; Xmax
Man kann daraus auf linkssteile/ rechtssteile Verteilung schließen
Wenn Verteilung annähernd symmetrisch zum Median ist, sind X0,25 und X0,75 etwa gleich vom Median entfernt
Führen sie den Beweis für die Gleichheit der beiden Varianzformeln ohne nachzuschauen
Ja
Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie ändert sich die Varianz?
Sie bleibt gleich
Gegeben sind mehrere Datengruppen mit jeweils ihren arithmetischen Mitteln und ihren Varianzen. Kann man die jeweiligen Kennzahlen vergleichen? Begründen sie.
Arithmetische Mittel kann man vergleichen. Standardabweichungen müssen normiert werden durch Berechnung des Variationskoeffizienten