t-Tests Flashcards
t-Tests
- t-Tests gehören zu den einfachsten und meist verbreiteten Verfahren der Inferenzstatistik
- t-Tests treffen Aussagen über Mittelwerte:
- ob sich ein Populationsmittelwert von einem vorgegebenen Wert unterscheidet
- ob sich zwei Populationsmittelwerte signifikant unterscheiden (dabei macht es einen Unterschied, ob die entsprechenden zwei Stichproben abhängige oder unabhängige Messungen enthalten)
- t-Tests gehören zu den parametrischen Verfahren, sind also an gewisse Voraussetzungen gebunden:
- die abhängige Variable muss intervallskaliert sein (Mittelwerte können erst ab Intervallskalenniveau berechnet werden)
- die Werte in der Population müssen normalverteilt sein
- t-Test für unabhängige Stichproben setzt zusätzlich noch voraus, dass
- die Messungen (stochastisch) unabhängig voneinander sind
- die Varianzen der Populationen gleich sind
Die t-Verteilung
- Auch studentsche t-Verteilung oder Student-t-Verteilung genannt
- William S. Gosset (a.k.a. Student) zeigte 1908, dass für kleine Stichprobengrößen die Stichprobenverteilung systematisch von der Standardnormalverteilung (z) abweicht. Die t-Verteilung beschreibt die Stichprobenverteilung dann besser
- Im Unterschied zur z-Verteilung ist die t-Verteilung abhängig von der Stichprobengröße (für n gegen unendlich geht die t-Verteilung in die z-Verteilung über). Allerdings rechnet man nicht mit n selbst, sondern mit Freiheitsgraden
- In der t-Verteilung sind extreme Werte etwas wahrscheinlicher als in der z-Verteilung
Schritt für Schritt:
- t ist nicht nur von der Stichprobenverteilung der Mittelwerte, sondern auch von der Stichprobenverteilung der Standardabweichungen abhängig
- Die Stichprobenverteilung der Standardabweichungen bzw. Varianzen folgt der Chi-Quadrat-Verteilung (nur positive Werte)
- Die Chi-Quadrat-Verteilung ergibt sich aus der Summe von n quadrierten normalverteilten Zufallsvariablen
- Bei geringer Anzahl an df ist die Verteilung rechtsschief
- Bei hoher Anzahl an df greift der zentrale Grenzwertsatz und die Chi-Quadrat-Verteilung nähert sich der Normalverteilung an
- t lässt sich als Quotient aus z und Chi-Quadrat darstellen
t-Test für eine Stichprobe
Voraussetzungen:
- Intervallskalenniveau
- Normalverteilung in der Population
Vorgehen:
- Standardfehler = geschätzte Populationsvarianz geteilt durch Wurzel(n)
-
Prüfgröße (der tatsächliche t-Wert) =
- die Differenz des Mittelwerts meiner Stichprobe vom in der H0 postulierten Populationsmittelwert (und damit auch dem postulierten Mittelwert der Stichprobenverteilung) in Standardfehlern
- df = n - 1
- Danach in der t-Verteilung nachsehen, welcher t-Wert meinem Kriterium alpha entspricht
- Prüfgröße (tatsächlichen t-Wert) und kritischen t-Wert vergleichen
- ist die Prüfgröße weiter vom H0-Populationsmittelwert entfernt als der kritische Wert (bzw in die richtige Richtung extremer) –> signifikant!
Achtung! Ist die Alternativhypothese gerichtet (einseitiger t-Test) oder ungerichtet (zweiseitiger t-Test)?
- alpha 5% einseitiger Test –> bei 0,95 nachsehen
- alpha 5% zweiseitiger Test –> alpha wird auf beide Seiten aufgeteilt! –> bei 0,975 nachsehen
t-Test für unabhängige Stichproben
z.B. Vergleich zweier Stichproben womöglich unterschiedlicher Größe; between-subjects-design
Voraussetzungen:
- Intervallskalenniveau
- Normalverteilung in der Population
- Unabhängigkeit der Gruppen
- Gleiche Varianzen in den Populationen
Vorgehen:
- Die geschätzten Populationsvarianzen beider Stichproben jeweils einzeln bestimmen. Danach…
- Standardfehler = eine mit der Stichprobengröße gewichtete Summe der einzelnen Standardfehler der beiden Mittelwertsverteilungen
-
Prüfgröße (der tatsächliche t-Wert) =
- Differenz der Mittelwerte minus die Differenz der Populationsmittelwerte in der Nullhypothese geteilt durch den Standardfehler
- df = nA + nB – 2
Woher weiß ich überhaupt, dass die Varianzgleichheit erfüllt ist? –> F-Test oder Levene-Test
Falls Varianzgleichheit nicht erfüllt –> t-Test für heterogene Varianzen durchführen
- Anpassung der Freiheitsgrade durch Welch-Korrektur
- Dadurch niedrigere Anzahl an df –> konservativerer Test durch relativ höheren kritischen Wert
t-Test für abhängige Stichproben
Within-subjects-design. Die beiden Messwertpaare korrelieren häufig und n ist bei beiden Stichproben gleich groß.
Voraussetzungen:
- Intervallskalenniveau
- Normalverteilung der Differenzen in der Population
Vorgehen:
- Die Addition der beiden Standardfehler von unabhängigen Mittelwertziehungen ist hier nicht okay. Der Standardfehler würde überschätzt werden (bei positiver Korrelation)
- Stattdessen für jedes einzelne Wertepaar die Differenz bilden und einfach mit dieser soeben konstruierten dritten Variable exakt so vorgehen wie beim t-Test für eine Stichprobe