13 Alternative Verfahren Flashcards
Standardverfahren
(Voraussetzungen t-test & ANOVA, lin. Regr., Alternativverf.)
- t-Test & ANOVA setzen voraus 1. gleiche Varianz, 2. Normalverteilung (mit Q-Q Plot, Shapiro-Wilk-Test o.ä.)
- lineare Regr. setzt normalverteilte Residuen mit gleicher Varianz voraus
–> Alternativverfahren machen weniger Annahmen –> robuster
Rangstatistiken:
U-Test (2x Name, Hinweis, 3 Nachteile)
Spearman
Grundlogik
U-Test
- Mann-Whitney-U bzw Wilcoxon (signed rank) Test
- wenn p-Wert stark von dem im Standardverfahren abweicht, Hinweis, dass dort Voraussetzungen nicht zutreffen
- Nachteil:
– Drittvariablen können nicht berücksichtigt werden
– Unterschied nicht quantifizierbar –> AUC nutzen
– nicht bei gewichteten Daten/komplexen Stichproben verwendbar
Spearman Korrelation
–> robust gegenüber Ausreißern/Extremwerten, da “nur” Rang, aber nicht der absolute Wert betrachtet wird
Robuste Schätzung des SE der Regressionskoeffizienten
(3 Namen, 3 Voraussetzungen, 5, 1 Nachteil)
- Sandwich-Matrix, Linearisierungsmethode, Taylor-Methode
- Voraussetzungen: Modell entspricht Daten, große 100+ Stichprobe, mind. 10-20 Beob. pro Parameter
- NICHT robust gegenüber Extremwerten, ABER Fehlerverteilung und Varianz EGAL
- verändert beta nicht, aber SE, KI und p-Werte
- bei jeder Art von Regressionmodell möglich
- Kompromiss aus zu starken (mit) und zu schwachen (ohne) Annahmen –> “Sandwich”
- auch bei gewichteten/korrelierten Daten möglich –> verschiedene Sandwich-Methoden
- Nachteil: falls Modellannahmen doch stimmen: SE (p-Werte, KI) unterschätzt
Bootstrapping
(Def., 2x berechnete Maße, Wdh., Design (2), ungelöstes Problem, 2 Nachteile und 2 Lösungen, Alternative)
- simuliert Verteilung durch neues Stichprobenziehen mit Zurücklegen aus originaler Stichprobe
- berechnet p-Wert und KI aus simulierter Verteilung
- für viele Maßzahlen verwendbar, fast keine Annahmen (kritisch für zu “glatte” Daten, Median)
- 2000 Wiederholungen meist ausreichend
- Ziehung muss Design der originalen Stichprobe spiegeln (feste Gruppengröße, geclusterte Stichprobe)
!! löst nicht Problem von Extremwerten
Nachteil: Rechenzeit länger, vom Zufall anhängig
- Lösung 1: mehr Wiederholungsstichproben
- Lösung 2: Startwert (Datum/Uhrzeit) angeben, dann replizierbar
- Alternative: Jackknife - lässt bei Wiederholungsstichprobe z.B. 1 Fall weg, k < N
Robuste (lineare) Regression
(Voraussetzung, Grundidee, Ergebnisse, wann funktioniert’s (nicht))
- Voraussetzung: X-Y Zusammenhang linear
- Grundidee: Ausreißer (bei Residuen) weglassen/heruntergewichten, Daten werden so getrimmt und lineare Regr. Voraussetzungen erfüllt
- Ergebnisse robust und breiter interpretierbar, unabhängiger von Einzelbeobachtungen
- funktioniert in kleinen ABER NICHT in komplexen Stichproben oder wenn Zusammenhang nicht linear
GLM (2 Versionen)
- Gamma Regression und Linkfunktion ln
- Logarithmieren berücksichtigt evtl. Extremwerte nicht ausreichend - Gamma Regression und Linkfunktion 1/y
- auch hier Extremwerte nicht ausreichend berücksichtigt
Box-Cox Transformation
(Idee, Formel, Problem, Nachteil & Lösung)
- Idee: Y so transformieren, dass Verteilung nicht mehr schief
- G(Y) = (Y^L - 1) / L –> L wird aus Daten geschätzt damit Schiefe = 0 –> normalverteilt
- Problem: Großteil in Stichprobe auf Minimalwert, das bleibt nach jeder Tranformation bestehen
- Nachteile: beta kaum noch interpretierbar, da Skala unverständlich/unpraktisch, besser: nach Transformation standardisieren (Skala bekannt)
Übersicht zu 6 Alternativverfahren
(Name, Robustheit gegenüber Ausreißern, bessere Varianzschätzung, Nachteil)
Name, Robustheit gegenüber Ausreißern, bessere Varianzschätzung, Nachteil
U-Test Y / Y / nicht in komplexen Stichproben
Sandwich N / Y / nur in großer Stichprobe
Bootstrapping N / Y / keine
rob. lin. Regr. Y / Y / nur bei linearem Zusammenhang
GLM YN / Y wenn Modell =^Daten / nur in großer Stichprobe
Box-Cox (Y) / meistens Y / Skala kompliziert
Empfohlene Anwendungsheuristik
- Analyse mit Standard- und Alternativverfahren durchführen
- andere Ergebnisse: Alternat. verwenden, da weniger Annahmen
- gleiche Ergebnisse: Standardverf. verwenden
Tests und Alternativen
t-Test > U-Test
ANOVA > Kruskal-Wallis
lin- Regr. > lin. Regr. mit rob. SE Schätzung / lin. Reg. mit Bootstrapping / rob. lin. Regr. / GLM / Box-Cox
Pearson > Spearman/Rankkorrelation
Chi^2 > exakter Test von Fisher
Meta fixed effects > random effects Modell
Sensitivitätsanalysen
- Standard und Alternative ausprobieren, z.B. Extremwerte reinnehmen oder rauslassen
- no difference: Standard verwenden
- difference: Entscheidung erwähnen und begründen