3. Univariate deskriptive Statistik Streumaße Flashcards
Was sind Streumaße bzw. Dispersionsmaße?
drücken in einer Zahl aus wie unterschiedlich die Merkmalsausprägungen über die Merkmalsträger hinweg sind
Welches Streumaß gibt es bei der nominalen Skala?
relativer Informationsgehalt H
Was sagt der relative Informationsgehalt aus und welche Werte kann er annehmen?
H = 1 -> maximale Streuung (Gleichverteilung, alle Kategorien gleich besetzt)
H = 0 -> minimale Streuung (alle Kategorien bis auf eine unbesetzt )
Wertebereich 0-1
Wie berechnet man den relativen Informationsgehalt
siehe Formelsammlung
Welche Streumaße gibt es bei der ordinalen Skala?
- relativer Informationsgehalt H
(jedoch berücksichtigt er hier nicht die Ordnung der Merkmalsausprägungen) - empirischer Interquartilsbereich
- Variationsbreite/Spannweite (range)
- Streuungsbereich
- Semiquartilsabstand
- Deziverhältnis
- mittlere Abweichung
- absolute Medianabweichung
Was versteht man unter dem empirischen Interquartilsbereich?
der Bereich der Werte zwischen dem 1. und dem 3. Quartil
-> ist diese Bereich sehr breit = starke Streuung
Wie ermittelt man den Interquartilsbereich?
in dem man die Quartile bestimmt
Wie bestimmt man die Quartile?
siehe Formelsammlung
Was gibt der Streuungsbereich an?
gibt den Wertebereich an, in dem alle beobachteten Werte liegen SB=[xmin;xmax]
Was versteht man unter der Variationsbreite/Spannweite (range) ?
gibt die Breite des Streubereichs an v= xmax-xmin (anfälliger für Ausreißer)
Was gibt der Semiquartilsabstand an?
halber Interquartilsabstand, gibt an in welchem Abstand zum Verteilungszentrum das obere und untere Viertel der Verteilung durchschnittlich liegen
Was wird durch das Deziverhältnis beschrieben?
gibt an um viel größer der Messwert des Merkmalstägers ist, der die oberen 10% der Verteilung abschneidet, als der Messwert des Merkmalsträgers, der die unteren 10% der Verteilung markiert
Was ist die mittlere Abweichung?
durchschnittliche Differenz der Messwerte von ihrem Mittelwert
Was ist die absolute Medianabweichung?
die durchschnittliche Abweichung aller Einzelwerte vom Median
Wann wird die absolute Medianabweichung verwendet?
wird verwendet wenn der Median dem Mittelwert vorgezogen wurde, etwa weil Ausreißer den Mittelwert stark beeinflussen würden oder die Verteilung sehr schief ist