5 T-Test Flashcards
Was benötigt man um Behauptung zu überprüfenn?
Hypothese und Hypothesenpaar
H0
(Nullhypothese): Das mittlere Gewicht von Äpfeln
beträgt 160g.
H1
(Alternativhypothese):
Das mittlere Gewicht von Äpfeln unterscheidet sich von 160g.
Stichprobe
Mit Hilfe einer Stichprobe sammeln wir Indizien gegen die Nullhypothese.
Wenn die Indizien stark genug gegen H0 (bzw. für H1 ) sprechen
so verwerfen wir H0 (bzw. entscheiden uns für H1 )
Wenn die Indizien nicht stark genug gegen H0 sprechen
dann behalten wir H0 bei
Schließende Statistik
T-Test und Konfidenzintervalle
Konfidenzintervalle
Wir versuchen basierend auf dem Mittelwert einer
Stichprobe Rückschlüsse auf den Mittelwert der
Grundgesamtheit (Erwartungswert μ) zu ziehen.
Das kann mit einem statistischen Test (zB T-Test)
oder/und mit Konfidenzintervallen erfolgen.
T-Test für eine Stichprobe
Sei μ der wahre Mittelwert der Grundgesamtheit
eines metrisch skalierten Merkmals.
• Wir erheben eine Stichprobe der Größe n.
• Aus der Stichprobe ermitteln wir den Mittelwert und
die Standardabweichung
Signifikanzniveau
Wir testen auf dem Signifikanzniveau α
Teststatistik
Je größer der Betrag der Teststatistik |T| ist
desto eher stützt dies die Alternativhypothese H1
|T| ist (tendenziell) umso größer je
– weiter von c entfernt ist,
– größer die Stichprobengröße n ist und
– je kleiner die Standardabweichung s ist.
Wir verwerfen H0 falls gilt:
Fehler 1. Art und das Signifikanzniveau α
• Wenn wir H0
verwerfen, so besteht immer ein Risiko,
dass wir dies fälschlicherweise getan haben.
• Wir begehen einen Fehler 1. Art, wenn wir H0
verwerfen, obwohl H0
zutrifft.
• Das Risiko, einen Fehler 1. Art zu begehen, wollen wir
beschränken.
• Dies geschieht mit dem Signifikanzniveau α.
• Übersteigt also |T| den kritischen Wert, so ist die
Wahrscheinlichkeit, einen Fehler 1. Art zu begehen,
höchstens α, also klein genug, um H0
zu verwerfen.
• Je kleiner das Signifikanzniveau α, desto größer wird
der kritische Wert beim T-Test, das heißt wir müssen
stärkere Indizien gegen H0
sammeln.
• Häufig wird α = 0.05 = 5% gewählt.
• In zweiseitigen Tests wird α in der Regel
gleichermaßen auf beide Enden aufgeteilt
Folgende Aussagen wären falsch
„Die Nullhypothese konnte daher bewiesen werden.“
– „Das mittlere Gewicht von Äpfeln beträgt daher 160g.
Wir gehen immer davon aus, dass H0 stimmt und müssen mit Hilfe der Daten aus der Stichprobe genügend Indizien gegen H0 sammeln.
• Folglich wäre folgende Aussage unsauber:
– „H1 kann daher verworfen werden.“
• Empfohlene Formulierungen:
– H0 kann (nicht) verworfen werden.
– Entscheidung für H0 /H1
Konfidenzintervall für den Einstichprobenfall
Das (1 – α)-Konfidenzintervall
enthält das wahre μ (Mittelwert der Grundgesamtheit) mit einer Wahrscheinlichkeit von (1 – α)·100%.
Zusammenhang Konfidenzintervall mit dem Einstichproben-T-Test:
– Liegt der Referenzwert c in diesem Intervall, kann H0 nicht
verworfen werden.
– Liegt der Referenzwert c nicht in diesem Intervall, so kann H0
verworfen werden.
Das Konfidenzintervall wird für ein gegebenes α kleiner
wenn die Stichprobengröße n größer wird.
• Die Auswahl des Quantils erfolgt wie beim
Einstichproben-T-Test.
Hypothesen bsp
– H0 (Nullhypothese): Weibliche und männliche Studierende
der Ernährungswissenschaften sind gleich groß.
– H1 (Alternativhypothese): Weibliche und männliche
Studierende der Ernährungswissenschaften sind nicht
gleich groß
T-Test für zwei unabhängige Stichproben
Wir wollen wissen, ob sich die Mittelwerte eines
metrisch skalierten Merkmals von zwei Gruppen
unterscheiden.
• Seien μ1 und μ2 die wahren Mittelwerte der 1 und μ2 die wahren Mittelwerte der
Grundgesamtheit der ersten und zweiten Gruppe.
• In der Stichprobe sind n1 Daten der 1. Gruppe und n2
Daten der 2. Gruppe.
• Wir bestimmen aus der Stichprobe den Mittelwert
und die Standardabweichung für jede Gruppe:
Wenn die Daten beider Gruppen normalverteilt und unabhängig sind
so ist unter H0 die Teststatistik t-verteilt mit n1 + n2 – 2 Freiheitsgraden.
Konfidenzintervall für den Zweistichprobenfall
: Das (1 – α)-Konfidenzintervall enthält die wahre Differenz μ1 - µ2 mit einer Wahrscheinlichkeit von (1 – α)·100%.
Zusammenhang mit dem T-Test für zwei unabhängige Stichproben:
– Liegt der Wert 0 in diesem Intervall, kann H0 nicht
verworfen werden.
– Liegt der Wert 0 nicht in diesem Intervall, so kann H0
verworfen werden.
Konfidenzintervall für den Zweistichprobenfall wird für ein gegebenes α kleiner
wenn die Stichprobengrößen n1 und n2 größer werden
Wann darf der T-Test angewendet werden?
Voraussetzung ist, dass die Daten (beider Gruppen) normalverteilt sind
Optische Tests auf Normalverteilung
– Histogramm mit Normalverteilungskurve
– QQ-Plot
Es gibt auch statistische Tests auf Normalverteilung, diese werden wir jedoch nicht besprechen
Histogramm mit Normalverteilungskurve
Wenn die Kurve schön über dem Histogramm liegt, dann können wir Normalverteilung annehmen
QQ-Plot:
Wenn die Linie schön durch die Punkte geht, können wir Normalverteilung annehmen
Optischer Test: Histogramm
• Die Normalverteilungskurve liegt “relativ”
schön über den Daten.
• Es spricht nicht allzu viel
gegen die Normalverteilung.
Optischer Test: QQ-Plot
• Die Punkte verlaufen recht schön entlang der Geraden, was für die Normalverteilung
spricht.
• Eine winzig kleine systematische
Abweichung von der
Geraden ist erkennbar
Der T-Test ist robust gegenüber Abweichungen
von der Normalverteilungsannahme
Faustregel für den Einstichprobenfall:
Wenn die Daten keine bzw. nicht zu viele (extreme) Ausreißer
haben und nicht allzu schief verteilt sind, kann der T-Test auch für nicht normalverteilte Daten ab einer
Stichprobengröße von n = 30 verwendet werden.
Faustregel für den Zweistichprobenfall
Sofern die Daten beider Gruppen keine bzw. nicht zu viele
(extreme) Ausreißer haben und nicht allzu schief
verteilt sind, kann der T-Test auch für nicht
normalverteilte Daten ab einer Stichprobengröße
von jeweils 30 verwendet werden.
– Darüber hinaus sollten beide Gruppen ungefähr gleich
groß sein.
Der QQ-Plot ist tendenziell einfacher zu interpretieren
insbesondere für kleine Stichprobengrößen.
T-Test für verbundene Stichproben
Gegeben sind zwei Variablen, meist in Form von Vorher-Nachher-Messungen
• Wichtig: Die beiden Messungen müssen für die
selben Beobachtungseinheiten vorhanden sein!
• Der Zweistichproben-T-Test, wie wir ihn oben
besprochen haben, ist so nicht zulässig, da die
beiden Stichproben nicht unabhängig sind.
• Stattdessen gibt es den T-Test für verbundene
Stichproben.
T-Test für verbundene Stichproben Synonyme
– T-Test für zwei abhängige Stichproben
– T-Test für zwei gepaarte Stichproben
Der T-Test für verbundene Stichproben lässt sich auf einen T-Test für eine Stichprobe zurückführen
– Wir bilden die Differenzen zwischen der 2. und der 1.
Messung. Also zB den Cholesterinspiegel nach der Diät –
Cholesterinspiegel vor der Diät (in SPSS mittels
Transformieren/Variable berechnen).
– Positive Werte bedeuten, dass der Cholesterinspiegel nach
der Diät größer ist als vor der Diät und umgekehrt.
– Mit diesen Differenzen führen wir einen T-Test für eine Stichprobe durch (Referenzwert c = 0)