13 Alternative Verfahren Flashcards

1
Q

Standardverfahren

(Voraussetzungen t-test & ANOVA, lin. Regr., Alternativverf.)

A
  • t-Test & ANOVA setzen voraus 1. gleiche Varianz, 2. Normalverteilung (mit Q-Q Plot, Shapiro-Wilk-Test o.ä.)
  • lineare Regr. setzt normalverteilte Residuen mit gleicher Varianz voraus
    –> Alternativverfahren machen weniger Annahmen –> robuster
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Rangstatistiken:

U-Test (2x Name, Hinweis, 3 Nachteile)

Spearman

Grundlogik

A

U-Test
- Mann-Whitney-U bzw Wilcoxon (signed rank) Test
- wenn p-Wert stark von dem im Standardverfahren abweicht, Hinweis, dass dort Voraussetzungen nicht zutreffen
- Nachteil:
– Drittvariablen können nicht berücksichtigt werden
– Unterschied nicht quantifizierbar –> AUC nutzen
– nicht bei gewichteten Daten/komplexen Stichproben verwendbar

Spearman Korrelation

–> robust gegenüber Ausreißern/Extremwerten, da “nur” Rang, aber nicht der absolute Wert betrachtet wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Robuste Schätzung des SE der Regressionskoeffizienten

(3 Namen, 3 Voraussetzungen, 5, 1 Nachteil)

A
  • Sandwich-Matrix, Linearisierungsmethode, Taylor-Methode
  • Voraussetzungen: Modell entspricht Daten, große 100+ Stichprobe, mind. 10-20 Beob. pro Parameter
  • NICHT robust gegenüber Extremwerten, ABER Fehlerverteilung und Varianz EGAL
  • verändert beta nicht, aber SE, KI und p-Werte
  • bei jeder Art von Regressionmodell möglich
  • Kompromiss aus zu starken (mit) und zu schwachen (ohne) Annahmen –> “Sandwich”
  • auch bei gewichteten/korrelierten Daten möglich –> verschiedene Sandwich-Methoden
  • Nachteil: falls Modellannahmen doch stimmen: SE (p-Werte, KI) unterschätzt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Bootstrapping

(Def., 2x berechnete Maße, Wdh., Design (2), ungelöstes Problem, 2 Nachteile und 2 Lösungen, Alternative)

A
  • simuliert Verteilung durch neues Stichprobenziehen mit Zurücklegen aus originaler Stichprobe
  • berechnet p-Wert und KI aus simulierter Verteilung
  • für viele Maßzahlen verwendbar, fast keine Annahmen (kritisch für zu “glatte” Daten, Median)
  • 2000 Wiederholungen meist ausreichend
  • Ziehung muss Design der originalen Stichprobe spiegeln (feste Gruppengröße, geclusterte Stichprobe)

!! löst nicht Problem von Extremwerten

Nachteil: Rechenzeit länger, vom Zufall anhängig
- Lösung 1: mehr Wiederholungsstichproben
- Lösung 2: Startwert (Datum/Uhrzeit) angeben, dann replizierbar

  • Alternative: Jackknife - lässt bei Wiederholungsstichprobe z.B. 1 Fall weg, k < N
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Robuste (lineare) Regression

(Voraussetzung, Grundidee, Ergebnisse, wann funktioniert’s (nicht))

A
  • Voraussetzung: X-Y Zusammenhang linear
  • Grundidee: Ausreißer (bei Residuen) weglassen/heruntergewichten, Daten werden so getrimmt und lineare Regr. Voraussetzungen erfüllt
  • Ergebnisse robust und breiter interpretierbar, unabhängiger von Einzelbeobachtungen
  • funktioniert in kleinen ABER NICHT in komplexen Stichproben oder wenn Zusammenhang nicht linear
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

GLM (2 Versionen)

A
  1. Gamma Regression und Linkfunktion ln
    - Logarithmieren berücksichtigt evtl. Extremwerte nicht ausreichend
  2. Gamma Regression und Linkfunktion 1/y
    - auch hier Extremwerte nicht ausreichend berücksichtigt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Box-Cox Transformation

(Idee, Formel, Problem, Nachteil & Lösung)

A
  • Idee: Y so transformieren, dass Verteilung nicht mehr schief
  • G(Y) = (Y^L - 1) / L –> L wird aus Daten geschätzt damit Schiefe = 0 –> normalverteilt
  • Problem: Großteil in Stichprobe auf Minimalwert, das bleibt nach jeder Tranformation bestehen
  • Nachteile: beta kaum noch interpretierbar, da Skala unverständlich/unpraktisch, besser: nach Transformation standardisieren (Skala bekannt)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Übersicht zu 6 Alternativverfahren

(Name, Robustheit gegenüber Ausreißern, bessere Varianzschätzung, Nachteil)

A

Name, Robustheit gegenüber Ausreißern, bessere Varianzschätzung, Nachteil

U-Test Y / Y / nicht in komplexen Stichproben
Sandwich N / Y / nur in großer Stichprobe
Bootstrapping N / Y / keine
rob. lin. Regr. Y / Y / nur bei linearem Zusammenhang
GLM YN / Y wenn Modell =^Daten / nur in großer Stichprobe
Box-Cox (Y) / meistens Y / Skala kompliziert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Empfohlene Anwendungsheuristik

A
  • Analyse mit Standard- und Alternativverfahren durchführen
  • andere Ergebnisse: Alternat. verwenden, da weniger Annahmen
  • gleiche Ergebnisse: Standardverf. verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Tests und Alternativen

A

t-Test > U-Test
ANOVA > Kruskal-Wallis
lin- Regr. > lin. Regr. mit rob. SE Schätzung / lin. Reg. mit Bootstrapping / rob. lin. Regr. / GLM / Box-Cox
Pearson > Spearman/Rankkorrelation
Chi^2 > exakter Test von Fisher
Meta fixed effects > random effects Modell

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Sensitivitätsanalysen

A
  • Standard und Alternative ausprobieren, z.B. Extremwerte reinnehmen oder rauslassen
  • no difference: Standard verwenden
  • difference: Entscheidung erwähnen und begründen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly