Deskriptive Datenanalyse I Flashcards
Deskriptive Statistik vs. Inferenzstatistik
Deskriptive Statistik: Beschreibt, bereitet auf und fasst Daten zusammen mithilfe von Kennwerten, Tabellen und Abbildungen.
Inferenzstatistik: Verallgemeinert Kennwerte und Analyseergebnisse auf die Population.
Wichtige Kennwerte in psychologischen Studien
Anteile/Häufigkeiten
Lagemaße: Modus, Median, Mittelwert
Streuungsmaße: Spannweite, Interquartilsabstand, Varianz, Standardabweichung
Unterschiede
Zusammenhänge
Anteile und Häufigkeiten
Skalenniveau: Bestimmt das Datenformat und die mathematische Verwertbarkeit.
Nominalskalenniveau: Ermöglicht Bestimmung von Anteilen und Häufigkeiten.
Darstellung: Kreisdiagramm, Häufigkeitsdiagramm.
Verteilung von Daten
Verteilung: Daten verteilen sich auf die möglichen Ausprägungen einer Variable.
Information: Verteilung liefert wertvolle Informationen über die Variabilität von Merkmalen.
Darstellung: Häufigkeitsverteilungen zeigen Werte einzelner Personen.
Lagemaße - Übersicht
Zentrale Tendenz: Daten konzentrieren sich bei bestimmten Ausprägungen.
Lagemaße: Modus, Median, Mittelwert.
Bedeutung: Bestimmen die “Lage” einer Verteilung auf der Achse der Merkmalsausprägungen.
Modus (Modalwert)
Definition: Die Merkmalsausprägung, die am häufigsten vorkommt.
Skalenniveau: Sinnvoll ab Nominalskalenniveau.
Anwendung: Nützlich bei der Analyse von Nominaldaten.
Median
Definition: Die Merkmalsausprägung, die in der Mitte der Verteilung liegt.
Skalenniveau: Sinnvoll ab Intervallskalenniveau.
Vorteil: Robuster gegenüber schiefen Verteilungen.
Berechnung des Medians
1.Werte der Größe nach sortieren.
2.Median ist der mittlere Wert.
3.Liegt die Mitte zwischen zwei Werten, ist der Median der Mittelwert dieser beiden.
Formel: Tiefe (Median) = (N+1):2.
Mittelwert (Arithmetisches Mittel)
Definition: Die mathematische Mitte der Verteilung.
Berechnung: Summe aller Einzelwerte, geteilt durch die Anzahl der Werte.
Skalenniveau: Sinnvoll ab Intervallskalenniveau.
Vorteil: Exakteste Angabe der Lage einer Verteilung.
Anfälligkeit des Mittelwerts
Anfällig für: Ausreißer und schiefe Verteilungen.
Alternative: Der Median kann robuster und manchmal sinnvoller sein.
Der Sinn der Lagemaße
Ziel: Zusammenfassung von Verteilungen, repräsentieren die zentrale Tendenz.
Fokus: Mittelwert wird oft für weitere Berechnungen (z.B. Gruppenunterschiede) genutzt.
Streuungsmaße - Übersicht
Wichtiger Hinweis: Traue keinem Lagemaß ohne Streuungsmaß!
Skalenniveau: Streuungsmaße sind sinnvoll ab Intervallskalenniveau.
Arten: Spannweite, Interquartilsabstand, Varianz, Standardabweichung.
Spannweite (Range)
Definition: Differenz zwischen dem kleinsten und dem größten Wert.
Berechnung: Range = x(max) - x(min).
Anwendung: Gibt die Gesamtstreuung der Werte an.
Interquartilsabstand (IQA)
Definition: Differenz zwischen dem 75%- und dem 25%-Quartil.
Berechnung: IQA = Q(75%) - Q(25%).
Vorteil: Lässt Ausreißer unberücksichtigt, wird oft zusammen mit dem Median angegeben.
Berechnung des Interquartilsabstands
1.Werte der Größe nach sortieren.
2.Zahlenreihe in vier gleich große Abschnitte teilen (Quartile).
3.Der IQA ergibt sich aus den Werten bei 25% und 75%.