Grafische Darstellung von Merkmalsverteilungen Flashcards
Boxplot
- Dient der gleichzeitigen Veranschaulichung von zentraler Tendenz und Variabilität einer Verteilung.
- Reagiert robust auf Ausreißer, da die mittleren 50% einer Verteilung durch die „Box“, also den Bereich Q1 bis Q3, repräsentiert werden, in der sich ebenso der Median befindet. Des Weiteren wäre es möglich das arithmetische Mittel abzutragen.
- Weitere Daten (je 25%) werden durch „Whisker“ repräsentiert (Werte außerhalb der Whisker (Min, Max) sind Ausreißer)
Histogramm und Polygon
Beide Darstellungsformen werden zur Darstellung der Häufigkeitsverteilung eines metrischen Merkmals verwendet.
Das Histogramm setzt die Kategorisierung wie bei einer Häufigkeitstabelle voraus. Das Histogramm stellt die Kategorienhäufigkeit grafisch dar. Da kein Abstand zwischen den Balken gegeben ist, handelt es sich um eine metrische Verteilung.
Anhand des Polygons ist es möglich die Verteilungsform zu beschreiben. Der sogenannte Polygonzug, verbindet die Kategorienmitten miteinander, woraus sich eine Form ergibt.
Verteilungsformen
- Symmetrisch/ asymmetrisch
- Unimodal (eingepflig) oder bimodal (zweigipflig)
- Links- oder rechtssteil/ links- oder rechtsschief
- U-förmig oder abfallend
Zentrales Grenzwerttheorem (zentraler Grenzwertsatz)
Das zentrale Grenzwerttheorem (zentraler Grenzwertsatz) besagt, dass die Verteilung von Mittelwerten aus Stichproben des Umfanges n, die einer beliebig verteilten Grundgesamtheit entnommen werden, einer Normalverteilung entspricht – vorausgesetzt, n ist genügend groß (mindestens n ≥ 30).