Deskriptive Datenanalyse III Flashcards
Korrelation Zsfassung
- Korrelationen sind Zusammenhangs-Analysen
- je stärker zwei Variablen gleichsinnig variieren (ko-variieren), desto höher ist ihre Korrelation
- die Stärke der Korrelation lässt sich durch einen Korrelationskoeffizienten ausdrücken
- die Pearson-Korrelation r wird für Intervall-Daten verwendet, Spearmans Rho und Kendalls Tau für Ordinaldaten
- die Pearson-Korrelation unterstellt immer einen linearen Zusammenhang – dieser muss also mit Hilfe eines Streudiagramms erst geprüft werden
- die inhaltliche Bedeutsamkeit der Korrelation hängt vom Inhaltsbereich, der Fragestellung und den Messinstrumenten ab
Unterschiede - Allgemeines
Unterschiede beziehen sich auf die Messergebnisse der abhängigen Variable (AV) bei verschiedenen Messungen.
Unterschiede können sich auf unabhängige (between) oder abhängige (within) Messungen beziehen.
Unterschiede können zwischen 2 oder mehr Messungen analysiert werden.
Meistens werden Unterschiede zwischen Lagemaßen (Mittelwert, Median) analysiert.
Prüfung der Verteilungen vor Analyse
Überprüfen Sie die Verteilungen in den Gruppen/Bedingungen mit einem Histogramm.
Prüfen Sie, ob die Verteilungen hinreichend normalverteilt sind.
Normalverteilung gegeben: Mittelwert als Lagemaß sinnvoll.
Keine Normalverteilung: Median oder gar kein Lagemaß verwenden.
Histogramm
Ein Histogramm (Dichtediagramm) teilt die Ausprägungen einer Variable in gleich große Intervalle und stellt die Häufigkeiten dar.
Unterschiede zwischen zwei unabhängigen Gruppen
Differenz der Lagemaße analysieren.
Mit Mittelwerten: Differenz der Mittelwerte M1-M2 = 0,37.
Mit Medianen: Differenz der Mediane Mdn1-Mdn2 = -1.
Unterschiede bei abhängigen Messungen
Mittlere Differenz über alle Personen hinweg betrachten (jede Person ist in beiden Verteilungen enthalten).
Verteilung der Differenzen (nicht der Rohwerte) auf Normalverteilung prüfen.
Unterschiede bei mehr als zwei Messungen
Histogramme der einzelnen Gruppen/Bedingungen prüfen.
Variabilität der Mittelwerte beurteilen (Varianz der Mittelwerte).
Möglichkeit: Vergleichen von jeweils zwei Gruppen.
Interpretation von Unterschieden
Die Bedeutsamkeit von Unterschieden hängt vom Inhaltsbereich, der Fragestellung, den Messinstrumenten und der praktischen Relevanz ab.
Forscher/in beurteilt die Größe und Bedeutsamkeit.
Vorsicht bei Konventionen (z. B. nach Cohen)!
Zusammenhänge
Thema: Kovarianz und Korrelation
Pearson-Korrelation
Voraussetzungen für die Berechnung
Die Höhe der Korrelation
Korrelation und Kausalität
Rangkorrelationen
Phi-Koeffizient
Korrelation
Korrelation misst die Stärke des linearen Zusammenhangs zwischen zwei Variablen.
Grundlage für die Korrelation ist die Kovarianz.
Kovarianz
Kovarianz ist das gleichsinnige Variieren (ko-variieren) von Merkmalen.
Problem: Kovarianz ist abhängig von der Skalierung der Variablen.
Lösung: Standardisierung führt zur Korrelation.
Pearson-Korrelation
Die Pearson-Korrelation (r) relativiert die Kovarianz an der Streuung (Standardisierung).
Wertebereich: -1 (perfekter negativer Zusammenhang) bis +1 (perfekter positiver Zusammenhang).
Höhere Dichte der Punktewolke bedeutet eine stärkere Korrelation.
Höhe der Korrelation
Die Höhe der Korrelation hängt nur von der Dichte der Punktewolke ab, nicht von der Neigung der Gerade.
Größe und Bedeutsamkeit der Korrelation hängen vom Inhaltsbereich, der Fragestellung und den Messinstrumenten ab.
Voraussetzungen für die Pearson-Korrelation
Intervallskalenniveau der beiden Variablen.
Hinreichend lineare Zusammenhänge.
Keine deutlichen Ausreißer.
Korrelation und Kausalität
Eine Korrelation bedeutet, dass eine Variable aus der anderen statistisch vorhergesagt werden kann.
Eine Korrelation bedeutet jedoch nicht, dass die Variablen kausal miteinander verbunden sind.
Korrelationen können durch Drittvariablen verursacht werden (Scheinkorrelation).
Rangkorrelationen
Alternative zur Pearson-Korrelation, geeignet für Ordinaldaten.
Daten werden in Ränge umgewandelt, Zusammenhang muss monoton sein.
Zwei Methoden: Spearmans Rho (ρ) und Kendalls Tau (τ).
Phi-Koeffizient
Für den Spezialfall, dass beide Variablen nur zwei Ausprägungen haben.
Darstellbar in einer Vierfeldertafel.
Phi-Koeffizient wird ähnlich wie die Pearson-Korrelation interpretiert.
Streudiagramme (Scatterplots)
Visualisierung von Zusammenhängen zwischen Variablen.
Punktewolke im Diagramm zeigt die Stärke und Richtung des Zusammenhangs.
„Dünnere“ Punktewolke bedeutet einen stärkeren Zusammenhang.
Bubble-Plot
Eine dritte Variable kann durch die Größe der Punkte in Streudiagrammen dargestellt werden.
Diese Darstellung wird als Bubble-Plot bezeichnet.
Varianz in der Statistik
Schlüsselkonzept:
Varianz (Streuung) von Erleben und Verhalten ist zentral in der Statistik.
Ziel: Varianz erklären, vorhersagen und verändern (Varianzaufklärung).
Korrelation und Regression sind zentrale Instrumente dafür.
Zusammenfassung - Korrelation
Kernpunkte:
Korrelationen analysieren Zusammenhänge zwischen Variablen.
Die Stärke der Korrelation wird durch einen Korrelationskoeffizienten ausgedrückt.
Pearson-Korrelation für Intervall-Daten, Spearmans Rho und Kendalls Tau für Ordinaldaten.
Die Bedeutsamkeit der Korrelation hängt vom Inhaltsbereich, der Fragestellung und den Messinstrumenten ab.
Diese Karteikarten bieten eine strukturierte Übersicht ü
Unterschiede zwischen unabhängigen Gruppen
Analyse von Unterschieden in den Lagemaßen (z.B. Mittelwert, Median) zwischen zwei unabhängigen Gruppen.
Wichtig, vor der Analyse die Normalverteilung der Daten zu prüfen.
Interpretation der Unterschiede hängt von der theoretischen und praktischen Relevanz ab.
Unterschiede zwischen abhängigen Messungen
Abhängige Messungen beinhalten die Analyse von Daten, bei denen die gleichen Personen in mehreren Bedingungen gemessen wurden.
Wichtig: Verteilung der Differenzen zwischen den Messungen auf Normalverteilung prüfen.
Unterschiede bei mehr als zwei Gruppen
Analyse der Variabilität der Lagemaße (z.B. Varianz der Mittelwerte) über alle Gruppen hinweg.
Möglichkeit, paarweise Gruppenvergleiche durchzuführen, um spezifische Unterschiede zu identifizieren.
Interpretation der Unterschiedsgröße
Die Größe und Bedeutsamkeit eines Unterschieds ist kontextabhängig.
Forscher/in entscheidet über die Relevanz der Unterschiede.
Vorsicht bei der Verwendung von Konventionen, wie z.B. Cohens d, ohne Berücksichtigung des spezifischen Forschungskontextes.
Korrelation und Streudiagramme
Streudiagramme helfen, visuelle Zusammenhänge zwischen zwei Variablen zu erkennen.
Die Dichte und Anordnung der Punkte im Diagramm zeigen die Stärke und Richtung des Zusammenhangs.
Korrelation und Drittvariablen
Achtung:
Korrelationen können durch Drittvariablen verursacht werden, was zu Scheinkorrelationen führt.
Es ist wichtig, potenzielle Drittvariablen zu identifizieren und zu kontrollieren, um valide Schlussfolgerungen zu ziehen.
Berechnung der Pearson-Korrelation
- Berechnen der Kovarianz der beiden Variablen.
- Kovarianz durch das Produkt der Standardabweichungen der beiden Variablen teilen.
- Ergebnis ist der Korrelationskoeffizient r, der zwischen -1 und +1 liegt.
Interpretation der Pearson-Korrelation
r = +1: Perfekter positiver Zusammenhang.
r = -1: Perfekter negativer Zusammenhang.
r = 0: Kein linearer Zusammenhang.
Interpretation abhängig von der Dichte der Punktewolke und dem Kontext der Daten.
Spearmans Rho vs. Kendalls Tau
Unterschiede:
Spearmans Rho (ρ): Einfachere Formel, basiert auf Rangdifferenzen.
Kendalls Tau (τ): Robuster, besonders geeignet für kleine Stichproben.
Beide messen die Stärke eines monotonen Zusammenhangs bei ordinalen Daten.
Phi-Koeffizient - Anwendung
Der Phi-Koeffizient wird verwendet, wenn beide Variablen dichotom (zwei Ausprägungen) sind.
Berechnung erfolgt anhand einer Vierfeldertafel, ähnlich der Pearson-Korrelation.
Korrelation und Regression
Korrelation misst die Stärke des Zusammenhangs, Regression analysiert die Richtung und Vorhersagekraft.
Regression verwendet die Korrelation, um Vorhersagen über den Zusammenhang zwischen unabhängiger und abhängiger Variable zu machen.
Interpretation von Streudiagrammen
Identifizieren Sie die Richtung des Zusammenhangs (positiv, negativ, keiner).
Beurteilen Sie die Dichte der Punktewolke, um die Stärke des Zusammenhangs zu bewerten.
Prüfen Sie auf nicht-lineare Muster, die auf eine komplexere Beziehung hinweisen könnten.
Varianz und Varianzaufklärung
Varianz misst, wie stark Datenpunkte um den Mittelwert streuen.
Ziel der Statistik: Varianz zu erklären und vorherzusagen (Varianzaufklärung).
Korrelation und Regression sind zentrale Methoden, um Varianz zu analysieren und zu erklären.
Lineare Zusammenhänge
Kovarianz Formel
Korrelation Formel
Die Höhe der Korrelation ist nur von der Dichte der Punktewolke abhängig, nicht von der Neigung der Gerade
Monotonic/Non-Monotonic
Phi-Koeffizient
Bubble-Plot