4 Bias Flashcards
Zufälliger Fehler (Entstehung und Verhalten)
- entsteht durch zufällige Stichprobe oder Gruppeneinteilung
- größere Stichprobe > wird kleiner (siehe Standardfehler & KI Interval)
Systematischer Fehler (= Bias)
(Formel, Über-/Unterschätzung, Gesamtfehler, Zielscheibe, praktisches Problem, wann ist Bias groß (5), je 1 Verringerungsmethode für zufälligen und systematischen Fehler)
Bias = E(theta Hut) - theta
(= Erwartungswert von Durchschnittsschätzung - wahrer Parameter in Zielpopulation)
Bias > 0 Überschätzung
Bias < 0 Unterschätzung
Gesamtfehler = Bias + zufälliger Fehler (MSE = Bias^2 + Varianz)
Zielscheibenanalogie mit 4 Varianten
praktisches Problem: Bias unbekannt und kaum untersuchbar
Bias groß wenn: Stichprobe nicht repräsentativ, keine Randomisierung, schlecht gemessen, Vorzeitigkeit unklar, aber geringer bei Assoziation (wo Randomisierung egal!)
MSE verringern:
1. zufälliger Fehler: größere Stichprobe
2. system. Fehler: Studiendesign
3 Bias Ursachen (& für welche Art des Zusammenhangs)
confounding (spezifisch für kausale Schlüsse)
&
Selektion
Messfehler
(beide auch bei Assoz.)
Confounding variables
(Def x2, Bsp, Methode bei vielen Z)
gemeinsame Ursachen von X & Y (wenn danach adjustiert der Effekt von X auf Y verringert ist)
gibt keine korrekte Definition zur empirischen Anwendung
meist gemeinsame vorausgehende Faktoren, z.B. Kindheitstrauma -> Depr. & soz. Phobie (Z* = alpha1 * alpha2)
» nur vorausgehende Faktoren betrachten und danach adjustieren
bei vielen Z-Variablen: directed acyclic graphs (DAGs), non-parametische Methode, macht Annahmen darüber, wie Z Variablen untereinander und auf X und Y wirken -> bestimmt Auswahl an zu berücksichtigen Z Variablen
Statistische Modelle, um confounder zu berücksichtigen (2: 4 + 1)
between:
- Regressionsmethoden (am gröbsten)
- Propensity-Score-Verfahren (macht X von Z unanhängig durch Adjustieren)
- Statistisches Matching (basierend auf Prop.-Score-V.)
- Doubly robust estimation (versucht ersten beiden, 2x Chance auf richtiges Modell)
within:
innerhalb der Individuen über Zeit -> mehrere Messungen durchführen: Y(t1) - Y(t0) -> eliminiert Einfluss von confounding variable
Selektion (4 Ursachen + 2 Bsp, Rand)
Ursachen: Quell =/ Zielpopulation, praktische Restriktion, Nichtteilnahme/Dropouts, fehlende Werte
Bsp: Prävalenz von Agoraphobie ohne Panikstörung -> Stichprobe aus Klinik, Probanden kommen aber erst durch/mit Panikstörung in die Klinik (vorher anders diagnostiziert o.ä.)
Bsp: Raucherentwöhnung mit KVT; Selektionsbias durch Aufhörbereitschaft
> > Randomisierung stellt nur sicher, dass beide Gruppen aus gleicher Population!
Messfehler
(Def, 11 Einflüsse)
Messung stimmt nicht mit zu messendem Phänomen überein (gemessen wird ohnehin nur Projektion der Realität)
beeinflusst durch: Instrument, Person, Wahrnehmung, Kognition, Erinnerung, Interaktion, soziale Erwünschtheit (Bsp. Penisgröße), Tageseinfluss, Angabebereitschaft, Untersuchungsdauer, Trauma etc.
Sensitivität & Spezifität
Sensitivität: erkennt Fälle als Fälle
Spezifität: erkennt nicht-Fälle als nicht-Fälle
Messfehler bei intervallskaliertem Y (Formel + 2 Typen)
Y* = Y + Messfehler
> nichtdifferentielle Messfehler: von X unabhängig, in beiden Gruppen gleich groß -> Y Differenz unverändert
> differentielle Messfehler: in einem X größer, dadurch Über-/Unterschätzung
Messfehler bei intervallskaliertem X (2 Typen + Bsp)
> unabhängig von X: kein Bias, gleicher Anstieg der Regressionsgeraden
> abhängig von X: veränderter Anstieg -> Bias!
Bsp. Test schlechter bei Älteren
Messfehler bei kategorialen Variablen
(S+S, 2 Typen, which S worse)
“Fehlklassifikation”
Richtung/Größe von Bias bestimmt durch Sensitivität und Spezifität
> nichtdifferentielle Fehlklassifikation: Messfehler nur in X, S+S von Y unabhängig -> Unterschätzung
> differentielle Fehlklassifikation: S+S von Y abhängig
Bsp. Depression bei Kindern wird bei selbst betroffenen Eltern überschätzt, da diese sensitiviert fürs Thema sind -> Überschätzung
> > niedrige Spezifität führt zu stärkerer Unterschätzung als niedrige Sensitivität (falls (P(X=1 < 0.5))
Auftretreihenfolge von Bias
(Reihenfolge, Gründe, Interaktion)
wahrer Effekt > confounding > Selektion > Messfehler > beobachteter Effekt
> confounding: produziert Zusammenhänge, die man beobachten könnte (Bsp. gemeinsame Ursachen)
Selektion: entscheidet über Individuen, bei denen Zusammenhänge beobachtet werden
Messfehler: produziert Zusammenhänge, die man tatsächlich beobachtet
> > 3 Arten von Bias interagieren häufig! Bsp. anderer Bias durch Messfehler, falls Selektion in Klinik, wo anders diagnostisch erfasst
Umgang mit Bias (falls nicht im Design verhindert - beste Option!) (5)
- ignorieren
- diskutieren
- einfache statistische Ansätze
a) confounding: adjustieren
b) Selektion: Daten gewichten
c) Messfehler: keine einfachen Ansätze - Sensitivitätsanalysen durchführen
- Monte-Carlo-, Bayesianische Sensitivitätsanalysen
Analytical Bias (Def, 4 Ursachen)
weitere Bias-Art
Daten falsch ausgewertet -> irreführende Ergebnisse
Ursachen:
> Analyse-Voraussetzungen nicht erfüllt
> Zusammenhangsstruktur nicht beachtet
> Modell für Frage ungeeignet
> zu kleine Stichprobe für Modell (zu viele X)
Heuristik: Bradford-Hill-Betrachtungen (Def + 8)
qualitative Annäherungen, sind Kontext-abhängig
Ist Assoziation eher kausal wenn…
> stark ausgeprägt?
> konsistent?
> spezifisch?
> Dosis-Wirkungs-Beziehung?
> plausibel?
> von Theorien unterstützt?
> auf RCT beruhend?
> bereits in analogen Situationen gezeigt?