Tests Flashcards
t-Test: Voraussetzungen an die Daten
- Normalverteilt
- Varianzhomogenität: Messwerte in allen Gruppen haben selbe (theoretische) Varianz
- Unabhängigkeit: Messwerte hängen nicht von einander ab
t-Test Hypothesen
einseitig (pos.):
H0 : µx ≤ µy (µx − µy ≤ 0)
HA : µx > µy (µx − µy > 0)
einseitig (neg.):
H0 : µx ≥ µy (µx − µy ≥ 0)
HA : µx < µy (µx − µy < 0)
zweiseitig:
H0 : µx = µy (µx − µy = 0)
HA : µx ungleich µy (µx − µy ungleich 0)
t-Test; Ablehnen von H0, wenn
einseitig (pos.): T > tdf ,1−α
einseitig (neg.): T < tdf ,α
zweiseitig: T < tdf ,α/2 oder T > tdf ,1−α/2
⇒ d.h. |T| > tdf ,1−α/2
Was ist der p-Wert und wann lehnt man H0 ab?
Fehlerwahrscheinlichkeit mit der H0 abgelehnt werden kann
Wenn p-Wert < α –> H0 ablehnen
Was passiert mit dem p-Wert, wenn wir zweiseitig testen
p-Werte zweiseitiger Tests sind (i.d.R.) doppelt so groß wie die
entsprechender einseitiger Tests
Testentscheidung mittels KI
einseitig (pos.): H0 : µx ≤ µy
KI = [δ(u), ∞)
einseitig (neg.): H0 : µx ≥ µy
KI = (-∞, δ(o)]
zweiseitig: H0 : µx = µy
KI = [δ(u), δ(o)]
Ablehnen von H0, wenn 0 kein Element des KIs ist!!!!
Voraussetzungen an Welch-t-Test (3)
- Normalverteilung
- Varianzheterogenität (bei Zweifel über Varianz lieber Welch-t-Test nehmen)
- Unabhängigkeit der Daten
Testentscheidung bei Welch-t-Test
Ablehnen von H0, wenn:
einseitig (pos.): T > tdf Welch,1−α
einseitig (neg.): T < tdf Welch,α
zweiseitig: T < tdf Welch,α/2 oder T > tdf Welch,1−α/2
⇒ d.h. |T| > tdf Welch,1−α/2
Was passiert mit Freiheitsgrad, wenn exakter Wert nicht in Quantiltabelle gegeben ist
Abrunden
Robust / nicht robust gegenüber? (Welch-t-Test) (5)
- absolut robust gegenüber homogenen Varianzen: i.d.R. leicht konservativ → geringere Gute (etwas größere p-Werte)
- robust gegenüber symmetrischer Nicht-Normalverteilung
- relativ robust gegenüber schiefen Verteilungen, insbesondere bei nicht zu kleinen Fallzahlen (> 10)
- wenig robust gegenüber diskreten Verteilungen, insbesondere bei vielen Bindungen (gleich große Werte, ties) und kleinen Fallzahlen,
z.B. Bonituren: 2,2,4,5 - nicht robust gegenüber Ausreißern
t-Test für abhängige Daten (Voraussetzungen)
- Normalverteilung
- Messwerte jeweils vom selben Messobjekt, Abhängigkeit (Stichproben
hängen voneinander ab) - Balanciertheit: selbe Fallzahlen (keine fehlenden Werte)
Was muss beim t-Test für abhängige Daten geschehen, bevor Teststatistik berechnet werden kann
- Umwandlung des ursprünglichen Zweistichprobenproblems in ein Einstichprobenproblem
Freiheitsgrad berechnen (t-Test für abhängige Daten)
df = n - 1
Freiheitsgrad berechnen (t-Test)
df = nx + ny − 2
Hypothesen beim t-Test für abhängige Daten
einseitig (pos.):
H0 : µx ≤ µy (µD ≤ 0)
HA : µx > µy (µD > 0)
einseitig (neg.):
H0 : µx ≥ µy (µD ≥ 0)
HA : µx < µy (µD < 0)
zweiseitig:
H0 : µx = µy (µD = 0)
HA : µx ungleich µy (µD ungleich 0)
Wozu dient der WMW-U-Test, welche Varianten gibt es, parametrisch / nichtparametrisch?
ein nichtparametrischer Test zum Vergleich von Verteilungsfunktionen bzw. relativen Effekten
- Wilcoxon-Rangsummentest
- U-Test
Voraussetzungen an die Daten (Wilcoxon-Rangsummentest und U-Test)
- stetige Daten
- lediglich schwache Voraussetzung, oft nicht erfüllt
–> mindestens quantitativer oder qualitativer ordinaler Variablentyp
- lediglich schwache Voraussetzung, oft nicht erfüllt
- Varianzhomogenität
- Unabhängigkeit
Hypothesen (Wilcoxon-Rangsummentest und U-Test)
zweiseitig:
H0 : FX (z) = FY (z) (P(x > y) = 0.5)
HA : FX (z) ungleich FY (z) (P(x > y) ungleich 0.5)
einseitig (pos.):
H0 : FX (z) ≥ FY (z) (P(x > y) ≤ 0.5)
HA : FX (z) < FY (z) (P(x > y) > 0.5)
einseitig (neg.):
H0 : FX (z) ≤ FY (z) (P(x > y) ≥ 0.5)
HA : FX (z) > FY (z) (P(x > y) < 0.5)
Testentscheidung (Wilcoxon-Rangsummentest)
Ablehnen von H0, wenn
zweiseitig: WX < Wnx ,ny ,α/2 oder WX > Wnx ,ny ,1−α/2
einseitig (pos.): WX > Wnx ,ny ,1−α
einseitig (neg.): WX < Wnx ,ny ,α
Welche Werte lese ich ab für Quantiltabelle (Wilcoxon-Rangsummentest)
Erste Fallzahl für Spalte (n1)
Zweite Fallzahl für Reihe (n2)
Testentscheidung (U-Test)
Ablehnen von H0, wenn
zweiseitig: UX < Unx ,ny ,α/2 oder UX > Unx ,ny ,1−α/2
einseitig (pos.): UX > Unx ,ny ,1−α
einseitig (neg.): UX < Unx ,ny ,α
Wann brauche ich die alternative Variante zum Wilcoxon- und U-Test
Approximation für große Fallzahlen (ca. n >20
Was sind Bindungen (beim Wilcoxon-Rangsummentest und U-Test)
- gleich große Werte
- im Prinzip Verletzung der Stetigkeitsannahme
- nur kritisch, wenn zwischen beiden Stichproben
Was passiert mit Bindungen und was muss eventuell angewandt werden
==> beide bekommen halben Rang höher (z.B. beide 1 –> beide 1.5)
- ab ca. 20% der Messwerte sind Bindungen
–> Bindungskorrektur
χ2-Test parametrisch/nichtparametrisch
nichtparametrischer Test
Welche Arten des χ2-Test gibt es
- Anpassungstest (Vergleich einer empirischen mit bekannten Verteilung)
- Homogenitätstest (Vergleich zweier Multinomialverteilungen
(Spezialfall des Unabhängigkeitstests)
Voraussetzung an die Daten ( χ2-Anpassungstestest) (2)
Multinomialverteilung
Wievielmal von insg. N trat Ereignis i = 1, . . . , k ein?
z.B.: N-maliges Würfeln, ¨ i = 1, . . . , 6
Unabhängigkeit (der Einzelmesswerte)
Hypothesen (χ2-Anpassungstest)
zweiseitig: H0 : FX (z) = F0(z) vs. HA : FX (z) ungleich F0(z)
einseitig: nicht sinnvoll, da nicht auf Lokation verglichen wird
Berechnung Freiheitsgrad (χ2-Test)
Anzahl der Kategorien (Unterschiedliche Messstellen, die vergleichen werden)
-1
(Bsp. 4 Erbsenarten, wie häufig sie vorkommen => 4-1 = df = 3
Voraussetzung an die Daten (χ2-Homogenitätstest)
- Binomialverteilung
- Unabhängigkeit (der Einzelmesswerte)
Hypothesen (χ2-Homogenitätstest)
zweiseitig: H0 : πx = πy vs. HA: πx ungleich πy
einseitig (pos.): H0 : πx ≤ πy vs. HA: πx > πy
einseitig (neg.): H0 : πx ≥ πy vs. HA: πx < πy