t-Tests Flashcards

1
Q

t-Tests

A
  • t-Tests gehören zu den einfachsten und meist verbreiteten Verfahren der Inferenzstatistik
  • t-Tests treffen Aussagen über Mittelwerte:
    • ob sich ein Populationsmittelwert von einem vorgegebenen Wert unterscheidet
    • ob sich zwei Populationsmittelwerte signifikant unterscheiden (dabei macht es einen Unterschied, ob die entsprechenden zwei Stichproben abhängige oder unabhängige Messungen enthalten)
  • t-Tests gehören zu den parametrischen Verfahren, sind also an gewisse Voraussetzungen gebunden:
    • die abhängige Variable muss intervallskaliert sein (Mittelwerte können erst ab Intervallskalenniveau berechnet werden)
    • die Werte in der Population müssen normalverteilt sein
  • t-Test für unabhängige Stichproben setzt zusätzlich noch voraus, dass
    • die Messungen (stochastisch) unabhängig voneinander sind
    • die Varianzen der Populationen gleich sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Die t-Verteilung

A
  • Auch studentsche t-Verteilung oder Student-t-Verteilung genannt
  • William S. Gosset (a.k.a. Student) zeigte 1908, dass für kleine Stichprobengrößen die Stichprobenverteilung systematisch von der Standardnormalverteilung (z) abweicht. Die t-Verteilung beschreibt die Stichprobenverteilung dann besser
  • Im Unterschied zur z-Verteilung ist die t-Verteilung abhängig von der Stichprobengröße (für n gegen unendlich geht die t-Verteilung in die z-Verteilung über). Allerdings rechnet man nicht mit n selbst, sondern mit Freiheitsgraden
  • In der t-Verteilung sind extreme Werte etwas wahrscheinlicher als in der z-Verteilung

Schritt für Schritt:

  • t ist nicht nur von der Stichprobenverteilung der Mittelwerte, sondern auch von der Stichprobenverteilung der Standardabweichungen abhängig
  • Die Stichprobenverteilung der Standardabweichungen bzw. Varianzen folgt der Chi-Quadrat-Verteilung (nur positive Werte)
  • Die Chi-Quadrat-Verteilung ergibt sich aus der Summe von n quadrierten normalverteilten Zufallsvariablen
  • Bei geringer Anzahl an df ist die Verteilung rechtsschief
  • Bei hoher Anzahl an df greift der zentrale Grenzwertsatz und die Chi-Quadrat-Verteilung nähert sich der Normalverteilung an
  • t lässt sich als Quotient aus z und Chi-Quadrat darstellen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

t-Test für eine Stichprobe

A

Voraussetzungen:

  • Intervallskalenniveau
  • Normalverteilung in der Population​

Vorgehen:

  • Standardfehler = geschätzte Populationsvarianz geteilt durch Wurzel(n)
  • Prüfgröße (der tatsächliche t-Wert) =
    • die Differenz des Mittelwerts meiner Stichprobe vom in der H0 postulierten Populationsmittelwert (und damit auch dem postulierten Mittelwert der Stichprobenverteilung) in Standardfehlern
  • df = n - 1
  • Danach in der t-Verteilung nachsehen, welcher t-Wert meinem Kriterium alpha entspricht
  • Prüfgröße (tatsächlichen t-Wert) und kritischen t-Wert vergleichen
  • ist die Prüfgröße weiter vom H0-Populationsmittelwert entfernt als der kritische Wert (bzw in die richtige Richtung extremer) –> signifikant!

Achtung! Ist die Alternativhypothese gerichtet (einseitiger t-Test) oder ungerichtet (zweiseitiger t-Test)?

  • alpha 5% einseitiger Test –> bei 0,95 nachsehen
  • alpha 5% zweiseitiger Test –> alpha wird auf beide Seiten aufgeteilt! –> bei 0,975 nachsehen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

t-Test für unabhängige Stichproben

A

z.B. Vergleich zweier Stichproben womöglich unterschiedlicher Größe; between-subjects-design

Voraussetzungen:

  • Intervallskalenniveau
  • Normalverteilung in der Population
  • Unabhängigkeit der Gruppen
  • Gleiche Varianzen in den Populationen

Vorgehen:

  • Die geschätzten Populationsvarianzen beider Stichproben jeweils einzeln bestimmen. Danach…
  • Standardfehler = eine mit der Stichprobengröße gewichtete Summe der einzelnen Standardfehler der beiden Mittelwertsverteilungen
  • Prüfgröße (der tatsächliche t-Wert) =
    • Differenz der Mittelwerte minus die Differenz der Populationsmittelwerte in der Nullhypothese geteilt durch den Standardfehler
  • df = nA + nB – 2

Woher weiß ich überhaupt, dass die Varianzgleichheit erfüllt ist? –> F-Test oder Levene-Test

Falls Varianzgleichheit nicht erfüllt –> t-Test für heterogene Varianzen durchführen

  • Anpassung der Freiheitsgrade durch Welch-Korrektur
  • Dadurch niedrigere Anzahl an df –> konservativerer Test durch relativ höheren kritischen Wert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

t-Test für abhängige Stichproben

A

Within-subjects-design. Die beiden Messwertpaare korrelieren häufig und n ist bei beiden Stichproben gleich groß.

Voraussetzungen:

  • Intervallskalenniveau
  • Normalverteilung der Differenzen in der Population

Vorgehen:

  • Die Addition der beiden Standardfehler von unabhängigen Mittelwertziehungen ist hier nicht okay. Der Standardfehler würde überschätzt werden (bei positiver Korrelation)
  • Stattdessen für jedes einzelne Wertepaar die Differenz bilden und einfach mit dieser soeben konstruierten dritten Variable exakt so vorgehen wie beim t-Test für eine Stichprobe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly