Inferentielle Datenanalyse III Flashcards
Inferentielle Datenanalyse - Konfidenzintervalle (KI)
Konfidenzintervalle: Schätzungen für Populationsparameter (z. B. Mittelwerte, Anteile).
Grundlage: Standardfehler, Normalverteilung (z-Verteilung) oder t-Verteilung bei kleinen Stichproben.
Berechnung: KI = M ± (z-Wert × SE), z. B. 95%-KI für Mittelwert M = 108,4 mit SE = 2,88: [102,8; 114,0].
t-Verteilung
Charakteristik: Mittelwert = 0, Varianz > 1, abhängig von der Stichprobengröße.
Anwendung: Geeignet für kleine Stichproben und unbekannte Populationsvarianz.
Vergleich: Geht ab etwa N = 30 in die Normalverteilung über.
Signifikanztests - Grundprinzip
Ziel: Entscheidung zwischen Nullhypothese und Alternativhypothese.
Beurteilung: Ist der Effekt in der Population Null (Ja/Nein)?
Berechnung: Vergleich von Mittelwerten mittels t-Test, Signifikanzbestimmung abhängig vom Studiendesign.
Signifikanztests für Unterschiede - Einstichproben-Test
Anwendung: Vergleich einer Stichprobe mit einem theoretischen Wert.
Berechnung: t = (M - μ) / SE, Freiheitsgrade = N - 1.
Beispiel: Prüfung, ob der Mittelwert von IQ = 108,4 signifikant von 100 abweicht.
Signifikanztests für Unterschiede - Zwei unabhängige Stichproben
Fall 1: Gleiche Varianzen und gleiche Stichprobengröße - Student t-Test.
Fall 2: Ungleiche Varianzen oder Stichprobengrößen - Welch t-Test (bevorzugt).
Berechnung: t = ΔM / SE der Differenz, mit entsprechenden Freiheitsgraden.
Voraussetzungen für t-Tests
Datenanforderungen: Intervallskalierte Daten, Normalverteilung der Populationen.
Varianzgleichheit: Erforderlich beim Student t-Test.
Empfehlung: Vermeidung spezieller Tests auf Normalverteilung; stattdessen subjektive Beurteilung der Daten.
Darstellung von Signifikanztests
Empfohlene Angabe: Beide Mittelwerte, Mittelwertsunterschied, Konfidenzintervall, t-Statistik, Effektgröße.
Beispiel: „Der Unterschied zwischen Gruppe 1 (M = …, SD = …) und Gruppe 2 (M = …, SD = …) beträgt 4,52, 95% KI [4,02; 5,02], t(df) = 1,24 (p = .031), d = 0,51.“
Zusammenhang von Effektgrößen und Signifikanztests
Hauptpunkte:
- Schätzung des Standardfehlers des Effektes.
- Angabe eines Konfidenzintervalls für den Effekt.
- Berechnung der Prüfgröße t und Prüfung auf Signifikanz.
Signifikanztests für Zusammenhänge
Anwendung: t-Test für Korrelations- und Regressionskoeffizienten.
Formeln:
Korrelationskoeffizient: t = r / SE_r.
Regressionskoeffizient: t = b / SE_b.
Frequentistische Inferenzstatistik - Überblick
Zentrale Methoden:
Konfidenzintervalle für Lagemaße, Streuungsmaße, Anteile.
Signifikanztests für Zusammenhänge und Unterschiede.
Ziel: Schlussfolgerungen über Populationen basierend auf Stichprobendaten.
Konfidenzintervalle für Streuungsmaße
Definition: Bereich, in dem der wahre Wert eines Streuungsparameters (z. B. Standardabweichung) mit einer bestimmten Wahrscheinlichkeit liegt.
Berechnung: Ähnlich wie bei Lagemaßen, basierend auf dem Standardfehler und der Stichprobenverteilung.
Signifikanztests für Anteile
Anwendung: Testen, ob ein beobachteter Anteil in der Stichprobe signifikant von einem erwarteten Anteil abweicht.
Berechnung: Nutzung der Normalverteilung oder t-Verteilung, abhängig von der Stichprobengröße und dem bekannten oder geschätzten Populationsanteil.
Signifikanztests für Zusammenhänge
Ziel: Überprüfung, ob ein beobachteter Zusammenhang (z. B. Korrelation) in der Population existiert.
Berechnung: Umrechnung des Korrelationskoeffizienten in einen t-Wert und Prüfung auf Signifikanz.
Voraussetzungen für Signifikanztests
Normalverteilung: Stichproben sollten annähernd normalverteilt sein.
Intervallskalierung: Daten sollten auf Intervallskalen gemessen werden.
Unabhängigkeit: Beobachtungen sollten unabhängig voneinander sein.
Konfidenzintervalle für Unterschiede
Definition: Bereich, in dem der wahre Unterschied zwischen zwei Gruppen mit einer bestimmten Wahrscheinlichkeit liegt.
Berechnung: Mittels Standardfehler der Differenz und einer Prüfverteilung (z- oder t-Verteilung).
Nullhypothese vs. Alternativhypothese
Nullhypothese (H0): Es gibt keinen Effekt oder Unterschied in der Population.
Alternativhypothese (H1): Es gibt einen Effekt oder Unterschied in der Population.
Ziel des Tests: Entscheidung, ob H0 verworfen werden kann zugunsten von H1.
t-Test für abhängige Stichproben
Anwendung: Vergleich von Mittelwerten innerhalb derselben Stichprobe zu zwei Zeitpunkten oder unter zwei Bedingungen.
Berechnung: t = Mittelwertsdifferenz / Standardfehler der Differenz.
Freiheitsgrade: N - 1 (für die Anzahl der Paare)
Darstellung von Konfidenzintervallen in Abbildungen
Methoden:
Angabe im Fließtext (z. B. „95% KI [102,8; 114,0]“).
Grafische Darstellung als Fehlerbalken in Diagrammen.
Interpretation: Ein KI, das die 0 nicht enthält, weist auf einen signifikanten Unterschied hin.
Power und Testwahl
Testwahl: Der Welch t-Test sollte immer bevorzugt werden, da er robust gegenüber ungleichen Varianzen und Stichprobengrößen ist.
Power: Die Wahrscheinlichkeit, einen tatsächlichen Effekt zu erkennen, wenn er existiert. Vergleichbar bei beiden Tests (Student- und Welch t-Test).
Konfidenzintervalle für Korrelationen
Umrechnung: Korrelationen werden in sog. Fisher-z-Werte umgerechnet.
Berechnung: KI für die Fisher-z-Werte wird ermittelt und dann wieder in Korrelationen umgerechnet.
Hypothesentests bei Signifikanztests
Zweck: Nicht die Verlässlichkeit einer Schätzung, sondern die Überprüfung von Hypothesen.
Ergebnis: Entscheidung, ob die Nullhypothese abgelehnt wird zugunsten der Alternativhypothese.
Zusammenhang von Konfidenzintervallen und Signifikanztests
Prinzip: Ein Konfidenzintervall, das die 0 nicht enthält, zeigt einen signifikanten Unterschied.
Einsatz: 90%-KI für einseitige Tests, 95%-KI für zweiseitige Tests.
Grundlagen des t-Tests
Formel: t = (M - μ) / SE.
Standardfehler (SE): Maß für die Genauigkeit, mit der der Mittelwert der Stichprobe den Populationsmittelwert schätzt.
t-Verteilung: Verwendet bei kleineren Stichproben oder unbekannter Populationsvarianz.
Konfidenzintervalle für alle Parameter
Signifikanztest für Unterschiede: Einstichprobentest
Signifikanztest für Unterschiede: 2 unabhängige Stichproben
Signifikanztest für Unterschiede: 2 unabhängige Stichproben, Fall 1 & 2
Signifikanztest für Unterschiede: 2 abhängige Stichproben
Signifikanztests für Zusammenhänge