Deskriptive Statistik - Fragen Flashcards by Emily Steiger

Was sind Vorteile und Nachteile einer Vollerhebung?

Vorteile:
- präzise/ fehlerfreie Daten

Nachteil:
- aufwendig

How well did you know this?

Not at all

Perfectly

Warum werden Daten manchmal gruppiert?

bei vielen Ausprägungen eines Merkmals dient das der Übersichtlichkeit

How well did you know this?

Not at all

Perfectly

Wie groß ist die Summe aller absoluten Häufigkeiten? Wie groß ist die Summe aller relativen Häufigkeiten?

absolute Häufigkeiten: gleich dem Stichprobenumfang n

relative Häufigkeiten: gleich 1

How well did you know this?

Not at all

Perfectly

Wie hängen Verteilungen und Verteilungsfunktion bei einem diskreten und bei einem stetigen Merkmal zusammen?

innerhalb der Verteilungsfunktion eines diskreten Merkmals ist die Verteilung aufsummiert
die Verteilungsfunktion liegt immer auf der Balkenmitte des Histogramms, der Flächeninhalt der Verteilungsfunktion ergibt 1 —> die Verteilung wird durch die flächentreue des Histogramms angeben

How well did you know this?

Not at all

Perfectly

Was ist die geeignete Darstellungsform bei einem stetigen Merkmal?

Histogramm

How well did you know this?

Not at all

Perfectly

Gegeben sei ein diskretes Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

Man muss die aufsummierten Realisierungen voneinander abziehen

How well did you know this?

Not at all

Perfectly

Gegeben sei ein stetiges Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?

Man muss beim Histogramm die Fläche durch die Breite teilen

How well did you know this?

Not at all

Perfectly

Was ist die geeignete Darstellungsfrom für die Verteilungsfunktion bei einem diskreten Merkmal?

Säulendiagramm

How well did you know this?

Not at all

Perfectly

Wie sieht jede Verteilungsfunktion vom Verlauf her im wesentlichen aus ?

steigend/ progressiv

How well did you know this?

Not at all

Perfectly

Warum wird bei Gruppierungen von stetigen Daten auf gleiche Klassenbreiten geachtet ?

Wenn die Klassenbreite gleich groß ist, muss nicht darauf geachtet werden, dass die Säulen des Histogramms unterschiedlich groß werden

How well did you know this?

Not at all

Perfectly

Welche Eigenschaften der Lorenzkurve dienen der „leichten optischen“ Erfassung von Informationen?

Wenn ein Wert eine große Konzentration hat, weicht die Lorentkurve stark von der Winkelhalbierenden ab

How well did you know this?

Not at all

Perfectly

Warum wird die Steigung der Lorenzkurve in jedem Abschnitt größer?

Weil immer eine Realisierung dazu genommen wird und sich die Realisierungen in ihrem Wert unterscheiden (gleicher Realisierungswert = gleiche Steigung)

How well did you know this?

Not at all

Perfectly

Wie wird der Gini-Koeffizient berechnet?

G = Fläche zwischen der Diagonalen und Lorenzkurve / Fläche zwischen Diagonalen und u-Achse (x-Achse)

How well did you know this?

Not at all

Perfectly

Warum wird der Gini Koeffinzient nicht ganz 1?

Damit der Gini Koeffizinet 1 wird, müsste die vollständige Konzentration bei einem Merkmalsträger liegen

How well did you know this?

Not at all

Perfectly

Wann wird der Gini Koeffizient 0?

bei kompletter Gleichverteilung, die Lorenzkurve liegt auf der Winkelhalbierenden (Gleichverteilung unter allen Merkmalsträgern)

How well did you know this?

Not at all

Perfectly

Was besagt die Zentraleigenschaft des arithmetischem Mittels?

Summe aller Abweichungen vom arithmetischen Mittel ergibt null

Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie verändert sich das arithmetische Mittel?

um 5

Was ist ein Vorteil und was ist ein Nachteil des arithmetischen Mittels?

Nachteil:
- anfällig für Ausreißerdaten

Vorteil:
- gute Übersicht über Konzentration der Daten

Welche Kennzahl ist für ordinal skalierte Merkmale am ehesten geeignet, um einen Mittelwert anzugeben?

Median

Wann wenden sie das arithmetische im Unterschied zum harmonischen Mittel an ?

Wenn sich die Gewichtung der einzelnen Werte auf die Zählergröße bezieht —> harmonisches Mittel

Wenn sich die Gewichtung der einzelnen Werte auf die Nennergröße bezieht —> arithmetisches Mittel

Warum werden Daten manchmal getrimmt ?

um ein besseres Bild des Hauptdurchschnittes zu bekommen werden Ausreißerdaten weggelassen

Wie werden Daten getrimmt ?

Nimmt man den höchsten Wert weg, muss auch der niedrigste wegfallen (und umgekehrt)

Welchen Vorteil bietet der Median im Vergleich zum arithmetischen Mittel ?

Er ist nicht so anfällig für Ausreißerdaten

Welche Kennzahlen benötigen sie, um die Lage einer Verteilung zu beschreiben ?

Median, Modus und arithmetisches Mittel

Bei welchen Daten wird das geometrische Mittel angewendet?

Auch ‚mittleres Wachstum‘. | Findet Anwendung in Finanzwirtschaft/ Mikroökonomie; Realsierungen x1,...,xn sind dabei die Wachstumsfaktoren

Bei welchen Kennzahlen müssen die Daten in eine Rangfolge von klein nach groß gebracht werden?

Median

Was ist das wichtigste Streuungsmaß?

Varianz

Wann wird die Spannweite null ?

Wenn es nur eine Realisierung gibt

Wie verändert sich die Spannweite, wenn weitere Daten hinzukommen?

Wird größer

Geben sie einen Vorteil und einen Nachteil der Kennzahl ‚Spannweite‘.

Vorteil: - man kann sehen ob es eine hohe/ niedrige Konzentration der Daten gibt Nachteil: - keine Resistenz gegen Ausreißerdaten

Inwieweit kann die Varianz bzw. Die Standardabweichung das arithmetische Mittel bei der Charakterisierung von Daten ergänzen?

die Werte geben an wie weit die Daten um das arithmetische Mittel gestreut sind

Was besagt der Interquartilabstand?

Besagt Abstand zwischen oberen und unterem Quartil, resistent gegen Ausreißerdaten

Worin liegt die Bedeutung der 5-Punkte-Zusammenfassung?

Besteht aus: Xmin; X0,25; Xmed; X0,75; Xmax Man kann daraus auf linkssteile/ rechtssteile Verteilung schließen Wenn Verteilung annähernd symmetrisch zum Median ist, sind X0,25 und X0,75 etwa gleich vom Median entfernt

Führen sie den Beweis für die Gleichheit der beiden Varianzformeln ohne nachzuschauen

Gegeben sei eine statistische Reihe von Euro Beträgen. Jeder Euro Betrag wird um 5 erhöht. Wie ändert sich die Varianz?

Sie bleibt gleich

Gegeben sind mehrere Datengruppen mit jeweils ihren arithmetischen Mitteln und ihren Varianzen. Kann man die jeweiligen Kennzahlen vergleichen? Begründen sie.

Arithmetische Mittel kann man vergleichen. Standardabweichungen müssen normiert werden durch Berechnung des Variationskoeffizienten