Deskriptive Statistik – univariate Verteilungen Flashcards
Auf was greifen empirisch ableitende Wissenschaften zurück?
- auf umfangreiche Daten in Form von Stichproben
- Um Sachverhalte oder Theorien zu prüfen
- In der Pschologie liegen den Stichproben Menschen zugrunde
Um Stichproben adäquat zu beschreiben, werden ebenfalls …
… soziodemografische Daten benötigt
Was ist das Gute an der deskriptiven Statistik?
- Sie reduziert den Umfang der Daten
> Um mit möglichst wenig Kennzahlen eine adäquate Beschreibung der Merkmale einer Stichprobe zu erhalten
Was ist eine univariate Verteilung?
- Betrachtung von nur einer Wertemenge eines Merkmals (eine Variable)
- Lässt sich bereits mithilfe eines Lagemaßes und eines Streuungsmaßes hinreichend genau beschreiben
Was ist eine Deskriptive Statistik?
- Daten beschreibende Statistik
- Lässt noch keine logischen Schlüsse zu
Was sind Lagemaße?
- auch Maße der zentralen Tendenz genannt
- Geben den zentralen Wert einer Wertemenge an, der diese am besten repräsentieren soll
- Datenmenge wird mit einer einzigen Kennzahl beschrieben
Was ist der Mittelwert?
- Das bekannteste Lagemaß
- Arithmetrische Mittel
- Summe aller Werte geteilt durch die Anzahl der Werte
- Es lässt sich genau eine Kennzahl berechnen, die die Einzelwerte repräsentiert
> Komplexität mehrerer Werte wird auf einen einfach kommunizierbaren und vergleichbaren Wert gebracht
Wann muss ein Skalenniveau bestimmt werden?
z.B. wenn das Alter bei der Mittelwertberechnung in Altersgruppen und nicht in Einzelwerte erfasst wird
Was ist ein Skalenniveau?
Gibt die Menge an Informationen an, die in den gemessenen Daten enthalten sind
Skalenniveaus werden unterschieden in …
… norminal, ordinal, intervall
norminales Skalenniveau
- Einfachstes Skalenniveau
- Prüfen, ob zwei Daten gleich/ungleich sind
ordinales Skalenniveau
- Ordnung der Merkmale nach Größe
Beispiele:
- Ranglisten
- unspezifisiche Häufigkeiten wie “nie”, “oft”
- subjektive Einschätzungen wie “schlecht”, “mittel”, “gut”
Internvallskalenniveau
- Abstände berechnen
- z.B. Alter, Anzahl Freunde, Blutwerte
Skalenniveaus und ihre erlaubten Operationen (Schaubild)
Besonderheiten der Skalenniveaus
- Ein Forschungsdatensatz enthält üblicherweise eine Mischung aus allen drei Daten
- Nachträglich lassen sich höhere Skalenniveaus auf niedrigere Skalenniveaus reduzieren (Informationsverlust)
Was ist Invarianz?
- Unveränderlichkeit eines Wertes (robust)
- Inwieweit darf sich die Wertemenge ändern, ohne dass sich das berechnete Lagemaß ändert
- Der Mittelwert einer Wertemenge verändert sich nicht, sofern das Gewicht der Werte oberhalb und unterhalb des Mittelwertes ausgeglichen ist
Was ist eine Ratingskala?
- Wird oft in psychologischen Fragebögen verwendet
- Aussagen werden anhand mehrerer vorgegebener Merkmalsausprägungen beurteilt
- Abstände zwischen zwei Merkmalen oft nicht bestimmbar
- Jede Person definiert Begriffe anders
Beispiele für Ratingskalen (Schaubild)
Was ist der Median?
- Alle Werte werden der Größe nach sortiert
- Der Werte in der Mitte dieser Rangfolge ist der Median
- Unter dem Median liegen genauso viele Werte wie über dem Median
Beispiel zum Median bei sieben Einzelwerten einer fünfstufigen Ratingskala (Schaubild)
Der Median lässt sich auch bei …
… höheren Skalenniveaus oder bei Intervallskalenniveaus berechnen
> die Operationen der vorhergehenden Skalenniveaus werden übernommen
Median Beispiel gerade/ungerade Anzahl von Merkmalen (Schaubild)
Medianberechnung bei einer geraden Anzahl von Werten
Entweder
- Wird der Mittelwert der beiden mittleren Werte berechnet
oder
- es wird einer der beiden mittleren Werte ausgewählt
Der Median einer Wertemenge verändert sich nicht, sofern …
… die Anzahl der Werte unterhalb und oberhalb des Medians gleichbleibt
> Invarianz genannt
Was ist der Modus?
- Der am häufigsten vorkommende Wert
- auch Modalwert genannt
- Ist der Wert, den man am wahrscheinlichsten erhält, wenn man zufällig einen Wert aus der Wertemenge zieht
- Es kann einen, zwei oder mehrere Modalwerte geben
> unimodalen, bimodalen, multimodalen Verteilungen
Beispiele für unimodale, bimodale und multimodale Verteilungen (Schaubild)
Beispiele zum Modus (Schaubild)
Bei nominalskalierten Daten lässt sich nur prüfen, ob …
… zwei Werte gleich sind oder sich unterscheiden
> Die Ordnung nach Größe oder die Berechnung des Abstandes ist nicht möglich!
Invarianz vom Modus
- Modus einer Wertemenge verändert sich nicht, wenn die anderen Werte in ihrer Ausprägung oder Häufigkeit verändert werden
- Solange die Häufigkeit des Modus von KEINEM ANDEREN WERT erreicht wird
> Ein und derselbe Modus kann bei beliebig vielen Wertemengen auftreten
Beispiel für unterschiedliche Wertemengen mit Modus 1 (Schaubild)