10 Quantifizieren Flashcards
Vergleich zw. 2 Gruppen mit quantitativem Y
(Bsp., Gestalt, Verschiebung, t-test Annahmen, MD + Interpretation)
Bsp. Frauen vs. Männer in Inhibition (1-5 Skala)
- Gestalt der Verteilung ca. ähnlich
- Annahme: Verteilung verschoben -> additiver Unterschied -> Mittelwertsdifferenz sinnvoll
- Annahme bei t-test: Normalverteilung + gleiche Varianz, Verteilung also um mean difference verschoben
- Mittelwertsdifferenz: geschätzte Erwartungswertdifferenz in Zielpopulation, gleiche Einheit wie Y
» Interpretation: um wieviele Y-Einheiten unterscheiden sich X=0 und X=1 im Mittel?
Skalierung von Y
(intuitiv vs nicht intuitiv + Lösung, 3 allgemein)
- intuitive Maße wie kg, mm/l, IQ -> leicht interpretierbar
- Summenscore: hängt von Anzahl der Items ab -> schwerer interpretierbar
- besser: Mittelwertscore = Summenscore / Anzahl Items -> leichter interpretierbar
allgemein:
- Y in einfacher & verständlicher Einheit, Bsp. kg statt g
- Y auf einfach darstellbarer Skala (wenig Zahlen)
- Y Unterschied qualitativ beurteilbar (Bsp. was ist der kleinste Unterschied delta, der von klinischer Relevanz ist)
z-Standardisierung von Y
(Formel, neuer mean & SD, Effektstärkeformel, 2 Alternativen, Auswirkung auf p-Wert)
- Y* = (Yi - Ymean) / SD
- Mittelwert = 0, SD = 1 -> Einheit für MD: Standardabweichungen
- Maß für Effektstärke: Cohen’s d = (X1mean - X2mean) / Wurzel ((s1^2 + s2^2) / 2)
- Cohen’s d Varianten: Hedges g, Glass delta
- Transformation ändert nichts an p-Werten, da alle Lineartransformationen erlaubt
Varianten der Y-Standardisierung
(Problem, 4 Varianten, bei Vergleichen)
- unterschiedliche SD!!!
- pooled SD aus Gesamtstichprobe
- SD aus Kontrollgruppe - nicht beeinflusst von Intervention
- aus erster Messung bei Längsschnittsstudie oder RCT - nicht beeinflusst von Intervention
- aus externen Daten oder Referenzstichprobe - repräsentativer
!!! bei Studienvergleichen: wenn unterschiedliche SD verwendet -> schlechter Vergleich
Vergleichbarkeit bei z-Standardisierung
(5 intern, 3 extern)
interne Vergleichbarkeit:
- in welchen von verschiedenen unterschiedlich skalierten Outcomes größte Differenz?
- Skalen vergleichbarer
- SD-Skala etabliert: Ergebnisse (vor allem bei PT) gut einordnebar
- bekannte Heuristik nach Cohen: 0.2-0.3 klein, 0.4-0.7 mittel, >=0.8 groß (aber Einordnung aus develop. psy. Kontext!)
- Skalen messen latente Variablen -> willkürliche Skalierung kann durch Standardisierung vereinheitlicht werden
externe Vergleichbarkeit:
- klinische Gruppen sehr homogen -> kleinere SD, Allgemeinbevölkerung heterogen -> größere SD
- wahrer Effekt in beiden Gruppen gleich, aber Cohen’s d in Allgem. bev. < klinische Gruppe
- Vergleich leider gängige Praxis in Forschung, z.B. Meta-Analysen -> Problemo!
Vergleich zw. 2 Gruppen mit schief verteiltem Y
(Bsp., Gestalt, Unterschiedsart, sinnvolles Maß, ___ , Skala, Formel, Unterschiedsart, Einheit, stat)
Bsp. Frauen / Männer & Alkohol g/Tag
- Gestalt der Verteilung nicht ähnlich (bei F gestaucht, bei M größere SD)
- eher multiplikative Unterschiede
-> Mittelwertsquotient sinnvoll
Mittelwertsquotient (mean ratio)
- Y braucht Verhältnisskala mit absolutem Nullpunkt
- MR = Y(X=1) / Y(X=0)
- um welchen Faktor Unterschied?
- MR hat keine Einheit (rausgekürzt)
- statistisch: idR Regressionsmodelle, zB GLM
Lineare (1) vs. multiplikative (2) Unterschiede
Lineare Unterschiede:
- Regressionsgerade: Steigung wächst konstant / absolut an
Nicht-lineare/multiplikative Unterschiede:
- pro Erhöhung von X um 1 wächst Y stärker an
- bei größerem Y ist Verteilung “gestreckt” -> SD größer
Nicht-parametrisches Alternativmaß zum Vergleich zweier Gruppen (4)
- Fläche unter der ROC-Kurve
- Y mind. Ordinalskala
- AUC (area under the curve) = Wahrscheinlichkeit, dass zufällig gezogener Fall mit X=1 größeres Y aufweist als zufällig gezogener Fall mit X=0
- U-Test kann in AUC umgerechnet werden für KI etc.
Maße für binäre Y (3, Y, Formel, Visualisierung)
- Risikodifferenz
- relatives Risiko
- Odds Ratio
- Y dichotom
- Unterschied in p=P(Y=1) zw. X=1 & X=0 quantifizieren
- Ergebnisse in Vierfeldertafel
Bsp. Angststörung (j/n) und Geschlecht (m/w)
Risikodifferenz (Maß für ?, 2 Formeln, Interpretation, 7 Eigenschaften, Variante + 4, !!)
- Maß für additive lineare Zusammenhänge bei binärem Y
- RD = p1 - p0 = P(Y=1 | X=1) - P(Y=1 | X=0)
- RD^ = D/(B+D) - C/(A+C)
- absolute Differenz im Risiko zw. X=1 und X=0
- Eigenschaften
» kein Unterschied: RD = 0
» Wertebereich -1 bis +1
» X vertauschen -> Vorzeichen ändert sich
» Y vertauschen -> Vorzeichen ändert sich
» X & Y NICHT vertauschen! –> RD besser geeignet wenn zeitl. Reihenfolge klar (nicht Querschnittsstudien)
» als prävalenzabhängig kritisert
» RD = 1 -> vollständiger Zusammenhang
Variante: Number needed to treat (NNT) = 1 / RD = 1 / p(x=1) - p(x=0)
- wieviele Pat. müssen behandelt werden um 1 zu “heilen”?
- RD = 0 -> NNT = unendlich (keiner wird “geheilt”)
- RD = 1 –> NNT = 1 (jeder behandelte wird “geheilt”)
- Interpretation gilt nur wenn kausaler Zusammenhang gegeben
!! nur Risikodifferenz RD ist proportional zur Anzahl inzidenter Fälle: RD Verdopplung -> Verdopplung der verhinderten Fälle durch Prävention (Kausalität vorausgesetzt), gilt NICHT bei RR / OR!
Relatives Risiko (risk ratio)
(2 Formeln, Interpretation, 7 Eigenschaften)
- RR = p(x=1) / p(x=0) = P(Y=1 | X=1) / P(Y=1 | X=0)
- RR^ = (D/(B+D)) / (C/(A+C))
- Interpretation: Faktor, um den sich Risiko für X=1 und X=0 unterscheiden
- Eigenschaften
» kein Unterschied: RR = 1
» Wertebereich 0 bis + unendlich
» X vertauschbar: RR -> 1/RR
» Y NICHT vertauschbar
» X & Y NICHT vertauschbar -> zeitl. Reihenfolge!
» prävalenzabhängig
» RR sehr groß /= vollständiger Zusammenhang (eine Zelle, die zu negativer Assoziation beiträgt kann trotz hohem RR-Wert stark besetzt sein, müsste für vollst. Zus. null sein)
Odds Ratio
(odds Formel, Interpretation, Zahlenbsp., OR 4, 7 Eigenschaften, 2 !!)
- odds = p / 1-p
- Interpretation: “Chancenverhältnis” - wie wahrscheinlich tritt Ereignis ein relativ zur Wahrscheinlichkeit, dass es nicht eintritt
- am häufigsten verwendet, aber schwer interpretierbar!
- odds = 1 (50/50), odds = 2 (66/33), odds = 0.5 (33/66)
ODDS RATIO
- Quotient zweier odds (Kreuzproduktverhältnis)
- OR = odds(x=1) / odds(x=0)
- OR^ = AD / BC
- Faktor, um den sich odds zw. X=1 & X=0 unterscheiden
-Eigenschaften
» kein Unterschied: OR = 1
» Wertebereich 0 & + unendlich
» X vertauschbar: OR -> 1/OR
» Y vertauschbar: OR -> 1/OR
» X & Y vertauschbar -> zeitl. Reihenfolge egal, super für Querschnittsstudien
» prävalenzUNabhängig
» OR sehr groß /= vollständiger Zusammenhang
!! RR & OR ähnlich, wenn niedriges Risiko in beiden Gruppen, aber NICHT gleich
!! Robustheit bei Fehlklassifikation: RD unempfindlicher als RR oder OR! (OR mit Bayes stabiler machen)
Korrelationen (2 usual suspects, Problem, 2 Alternativen)
- Pearson-Korrelation (Produkt-Moment-Korrelation) : intervallskalierte Variablen, gemeinsam bivariat normalverteilt
- Spearman-Korrelation (Rangkorrelation): X & Y mind. ordinalskaliert
!!! Pearson bei dichotomem X und/oder Y: schränkt Wertebereich < 1 ein -> unterschätzt Zusammenhang
-> bei 2 binären Variablen besser tetrachorische Korrelation (r(tet)) (kann aber Korrelation überschätzen!) (Vorgang: Schwellenwertschätzung > 4-Feldertafel > bivariate Normalverteilung > Pearson anwenden > tetrachorische Korrelation)
(verallgemeinert: polychorische Korrelation mit K > 2 geordneten Kategorien)