Deskriptive Datenanalyse III Flashcards
Korrelation Zsfassung
- Korrelationen sind Zusammenhangs-Analysen
- je stärker zwei Variablen gleichsinnig variieren (ko-variieren), desto höher ist ihre Korrelation
- die Stärke der Korrelation lässt sich durch einen Korrelationskoeffizienten ausdrücken
- die Pearson-Korrelation r wird für Intervall-Daten verwendet, Spearmans Rho und Kendalls Tau für Ordinaldaten
- die Pearson-Korrelation unterstellt immer einen linearen Zusammenhang – dieser muss also mit Hilfe eines Streudiagramms erst geprüft werden
- die inhaltliche Bedeutsamkeit der Korrelation hängt vom Inhaltsbereich, der Fragestellung und den Messinstrumenten ab
Unterschiede - Allgemeines
Unterschiede beziehen sich auf die Messergebnisse der abhängigen Variable (AV) bei verschiedenen Messungen.
Unterschiede können sich auf unabhängige (between) oder abhängige (within) Messungen beziehen.
Unterschiede können zwischen 2 oder mehr Messungen analysiert werden.
Meistens werden Unterschiede zwischen Lagemaßen (Mittelwert, Median) analysiert.
Prüfung der Verteilungen vor Analyse
Überprüfen Sie die Verteilungen in den Gruppen/Bedingungen mit einem Histogramm.
Prüfen Sie, ob die Verteilungen hinreichend normalverteilt sind.
Normalverteilung gegeben: Mittelwert als Lagemaß sinnvoll.
Keine Normalverteilung: Median oder gar kein Lagemaß verwenden.
Histogramm
Ein Histogramm (Dichtediagramm) teilt die Ausprägungen einer Variable in gleich große Intervalle und stellt die Häufigkeiten dar.
Unterschiede zwischen zwei unabhängigen Gruppen
Differenz der Lagemaße analysieren.
Mit Mittelwerten: Differenz der Mittelwerte M1-M2 = 0,37.
Mit Medianen: Differenz der Mediane Mdn1-Mdn2 = -1.
Unterschiede bei abhängigen Messungen
Mittlere Differenz über alle Personen hinweg betrachten (jede Person ist in beiden Verteilungen enthalten).
Verteilung der Differenzen (nicht der Rohwerte) auf Normalverteilung prüfen.
Unterschiede bei mehr als zwei Messungen
Histogramme der einzelnen Gruppen/Bedingungen prüfen.
Variabilität der Mittelwerte beurteilen (Varianz der Mittelwerte).
Möglichkeit: Vergleichen von jeweils zwei Gruppen.
Interpretation von Unterschieden
Die Bedeutsamkeit von Unterschieden hängt vom Inhaltsbereich, der Fragestellung, den Messinstrumenten und der praktischen Relevanz ab.
Forscher/in beurteilt die Größe und Bedeutsamkeit.
Vorsicht bei Konventionen (z. B. nach Cohen)!
Zusammenhänge
Thema: Kovarianz und Korrelation
Pearson-Korrelation
Voraussetzungen für die Berechnung
Die Höhe der Korrelation
Korrelation und Kausalität
Rangkorrelationen
Phi-Koeffizient
Korrelation
Korrelation misst die Stärke des linearen Zusammenhangs zwischen zwei Variablen.
Grundlage für die Korrelation ist die Kovarianz.
Kovarianz
Kovarianz ist das gleichsinnige Variieren (ko-variieren) von Merkmalen.
Problem: Kovarianz ist abhängig von der Skalierung der Variablen.
Lösung: Standardisierung führt zur Korrelation.
Pearson-Korrelation
Die Pearson-Korrelation (r) relativiert die Kovarianz an der Streuung (Standardisierung).
Wertebereich: -1 (perfekter negativer Zusammenhang) bis +1 (perfekter positiver Zusammenhang).
Höhere Dichte der Punktewolke bedeutet eine stärkere Korrelation.
Höhe der Korrelation
Die Höhe der Korrelation hängt nur von der Dichte der Punktewolke ab, nicht von der Neigung der Gerade.
Größe und Bedeutsamkeit der Korrelation hängen vom Inhaltsbereich, der Fragestellung und den Messinstrumenten ab.
Voraussetzungen für die Pearson-Korrelation
Intervallskalenniveau der beiden Variablen.
Hinreichend lineare Zusammenhänge.
Keine deutlichen Ausreißer.
Korrelation und Kausalität
Eine Korrelation bedeutet, dass eine Variable aus der anderen statistisch vorhergesagt werden kann.
Eine Korrelation bedeutet jedoch nicht, dass die Variablen kausal miteinander verbunden sind.
Korrelationen können durch Drittvariablen verursacht werden (Scheinkorrelation).
Rangkorrelationen
Alternative zur Pearson-Korrelation, geeignet für Ordinaldaten.
Daten werden in Ränge umgewandelt, Zusammenhang muss monoton sein.
Zwei Methoden: Spearmans Rho (ρ) und Kendalls Tau (τ).