ANCOVA Flashcards
Was ist die Grundidee der ANCOVA?
- eine ANOVA in der für Drittvariablen (Kovariate) kontrolliert wird
- es wird ein idealisierter Zustand modelliert
- was-wenn alle Personen gleiche Ausprägung in Drittvariable hätten? -> eliminiert confounding und erlaubt Einschätzung der Größe d Einfluss der Drittvariable
Was ist ein Confounder? Wie können diese Variablen untersucht werden?
Confounder (Z) haben kausalen Effekt auf X und Y also auf Prädiktor und Outcome
mittels Randomisierung kann der Effekt von Z auf Prädiktor konstant gehalten werden -> Confounder wird zur Kovariate
Was ist der Effekt einer korrekt angewandten ANCOVA?
Kovariate wird kontrolliert
Residualvarianz wird verringert
eliminiert Konfundierung im Outcome
-> Effektschätzer wird größer (besser sichtbar)
-> Testmacht steigt
-> p Wert sinkt
-> Standardfehler sinkt
NUR wenn Kovariate nicht mit Prädiktor korreliert
ANCOVA stellt KEINE Vergleichbarkeit der Gruppen an sich her!
Welche theoretische Voraussetzung hat die ANCOVA? Was ist wenn die Voraussetzung verletzt wird?
UV und Kovariate sing unkorreliert
durch Randomisierung kontrollierbar (besser je größer N)
->Kovariate ist nur mit Outcome assoziiert
wenn doch korreliert:
ANCOVA führt zu einer relativen Verringerung des Effekts und damit der Teststärke
Welche Konsequenzen hat es, wenn eine ANCOVA mit nicht-randomisierter Gruppenzuteilung berechnet wird?
= multiple lineare Regression
sowohl Residualvarianz als auch von UV erklärte Varianz verringert
-> Effekte idR kleiner, idR kein Powergewinn
Validität des F-Tests kann beeinträchtigt sein
- Teststatistik folgt eigentlich einer nicht-zentralen F-Verteilung
- herkömmlicher F test führt zu erhöhter Typ 1 Fehlerrate ud Powerverlusten
—> Empfehlung F-Test der ANOVA für Testung der UV verwenden
Wie werden adjustierte Effekte in der ANCOVA geschätzt? Was passiert mit der Kovariate? Was passiert mit den Mittelwerten?
- durch statistisches Konstanthalten des confounders im Outcome
- mittels adjustierte Mittelwerte
-) Mittelwert des Confounders in Regressionsgleichung aufgenommen
-) Adjustierte Mittelwerte und deren Differenz neu bestimmt
–> Was-wäre-wenn Analyse: Was wenn alle Personen den gleichen Wert (=Mittelwert) in der Kovariate gehabt hätten -> idealisiert, modellbasiert geschätzte Mittelwerte
Welche Arten von Zusammenhängen sind für ANCOVA geeignet?
nur confounder, der für Prädiktor konstant gehalten werden kann
nicht zielführend ist eine Analyse mit:
- collider
- Mediator
- Proxy
Wie kann Vergleichbarkeit von Gruppen hergestellt werden?
- nicht durch ANCOVA
- Matching
- Propensity Score Matching
= nachträgliche Ziehung von geeigneten Teilgruppen um Unabhängigkeit von UV und Drittvariable herzustellen - Approximierte Randomisierung (a posteriori, kann Bias enthalten)
- Stratifikation:
Drittvariable in Strata geteilt (zB Altersabschnitt)
Effekt der UV in jedem Stratum ermittelt -> dh unbeeinflusst von Effekten in anderen Strata & Interaktionen
–> Strata ein weiterer Faktor -> factorial ANOVA
—-> Wechselwirkung zwischen UV und Statum-Faktor belegt konfundierenden Einfluss der Drittvariable auf Effektschätzer der UV
Welche Vorteile hat die ANCOVA ggü mixed ANOVA?
Output ist übersichtlicher
interessierender Effekt ist Haupteffekt, statt Wechselwirkung bzw. simple effects analyse
ANCOVA bringt präzisere Schätzung, kleinerer Standardfehler
–> ANCOVA größerer Effekt, größere Power
aber nur wenn Voraussetzung erfüllt!
Wie kann die Richtung des Effekts der Kovariate überprüft werden?
- Betrachtung des Slope Parameters
- Produkt-Moment-Korrelation von Outcome und Kovariate
typisch: positiver Zusammenhang von Outcome (T1) und Kovariate (T0 baseline) in treatmentstudien und Interventionsdesigns (Prä und Post)
-> Rangreihung von Personen mit unterschiedlicher Symptombelastung bleiben meist konstant in Raincloud Plot
In welchen Designs wird die ANCOVA typischerweise angewandt?
- klassische Anwendung in RCTs wo in der kausaler Effekt von Prädiktor auf Outcome von Interesse ist (zB efficacy studie: wollen reinen treatment effect)
- Zusammenhang confounder Z mit Prädiktoren wird durch Randomisierung konstant gehalten -> zB alte Menschen Limo, junge Kaffee -> randomisierung -> keine systematische Gruppenunterschiede mehr in Alter
Welche Effektmaße werden für ANCOVA verwendet?
zB partielles Eta quadrat, Eta quadrat, Omega quadrat, …. Besser: d als Maß der Differenz
t-Werte der Kontrasttests (dichothome Mittelwertsvgl) können in r und d umgerechnet werden
Welche Voraussetzungen hat die ANCOVA?
- Kategoriale UV, metrische AV, metrische oder dichotome Kovariate
- Homoskedastizität
- NVT der Residuen
- Unabhängigkeit
- Linearität des Zusammenhangs
- Multikollinearität
- Additivität
- Modellspezifikation korrekt
Nur ANCOVA:
*) Homogenität der Steigung der Regressionsgeraden
*)mehrfaktorielle Designs:
mehr Voraussetzungen:
Sphärizität, Zentrierung
Welche Konsequenzen hat eine Verletzung der Homogenitätsannahme in der ANCOVA? Wie ist das prüfbar?
Typ-1 Fehler steigt
Testmacht sinkt
prüfbar mittels Wechselwirkung
Voraussetzungstest
wenn signifikant -> Ausweichen auf andere Methoden zB Multilevel Modelle
-> oft kann Wechselwirkung ignoriert werden
auch: Descriptives Plots, halbwegs parallele Regressionsgeraden für die beiden Gruppen
Welche Konsequenzen hat es für eine ANCOVA wenn UV und Drittvariable nicht unabhängig sind?
- Auswirkung auf Ergebnisinterpretation:
Effekt der UV zwar adjustiert aber nicht mit erhofftem Powergewinn
inhaltliche Interpretation ist eingeschränkt
Andere Methoden zielführender
überprüfbar:
2 Gruppen in UV: Produkt-Moment-Korrelation oder t-Test mit Drittvariable as AV
>2 Gruppen in UV: einfaktorielle ANOVA mit Drittvariable als AV