Deskriptive Statistik - Fragen Flashcards
Was sind Vorteile und Nachteile einer Vollerhebung?
Vorteile:
- präzise/ fehlerfreie Daten
Nachteil:
- aufwendig
Warum werden Daten manchmal gruppiert?
bei vielen Ausprägungen eines Merkmals dient das der Übersichtlichkeit
Wie groß ist die Summe aller absoluten Häufigkeiten? Wie groß ist die Summe aller relativen Häufigkeiten?
absolute Häufigkeiten: gleich dem Stichprobenumfang n
relative Häufigkeiten: gleich 1
Wie hängen Verteilungen und Verteilungsfunktion bei einem diskreten und bei einem stetigen Merkmal zusammen?
- innerhalb der Verteilungsfunktion eines diskreten Merkmals ist die Verteilung aufsummiert
- die Verteilungsfunktion liegt immer auf der Balkenmitte des Histogramms, der Flächeninhalt der Verteilungsfunktion ergibt 1 —> die Verteilung wird durch die flächentreue des Histogramms angeben
Was ist die geeignete Darstellungsform bei einem stetigen Merkmal?
Histogramm
Gegeben sei ein diskretes Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?
Man muss die aufsummierten Realisierungen voneinander abziehen
Gegeben sei ein stetiges Merkmal und die dazu gehörende Verteilungsfunktion. Wie kann man hieraus die Verteilung ermitteln?
Man muss beim Histogramm die Fläche durch die Breite teilen
Was ist die geeignete Darstellungsfrom für die Verteilungsfunktion bei einem diskreten Merkmal?
Säulendiagramm
Wie sieht jede Verteilungsfunktion vom Verlauf her im wesentlichen aus ?
steigend/ progressiv
Warum wird bei Gruppierungen von stetigen Daten auf gleiche Klassenbreiten geachtet ?
Wenn die Klassenbreite gleich groß ist, muss nicht darauf geachtet werden, dass die Säulen des Histogramms unterschiedlich groß werden
Welche Eigenschaften der Lorenzkurve dienen der „leichten optischen“ Erfassung von Informationen?
Wenn ein Wert eine große Konzentration hat, weicht die Lorentkurve stark von der Winkelhalbierenden ab
Warum wird die Steigung der Lorenzkurve in jedem Abschnitt größer?
Weil immer eine Realisierung dazu genommen wird und sich die Realisierungen in ihrem Wert unterscheiden (gleicher Realisierungswert = gleiche Steigung)
Wie wird der Gini-Koeffizient berechnet?
G = Fläche zwischen der Diagonalen und Lorenzkurve / Fläche zwischen Diagonalen und u-Achse (x-Achse)
Warum wird der Gini Koeffinzient nicht ganz 1?
Damit der Gini Koeffizinet 1 wird, müsste die vollständige Konzentration bei einem Merkmalsträger liegen
Wann wird der Gini Koeffizient 0?
bei kompletter Gleichverteilung, die Lorenzkurve liegt auf der Winkelhalbierenden (Gleichverteilung unter allen Merkmalsträgern)