Bayes-Statistik Flashcards
Was strebt die Bayes-Statistik an?
Wahrscheinlichkeiten über Hypothesen zu testen. Woher haben wir Nullhypothesen-Signifikanztests gemacht, die p-Wert als Wahrscheinlichkeit von Daten gegeben, eine bestimmte Hypothese (zumeist die Nullhypothese) wurde gelten, berechnet haben.
frequentistischer/ objektiver Wahrscheinlichkeitsbegriff
I. Der Wahrscheinlichkeitsbegriff der Inferenzstatistik: Bedient sich einer Entscheidungslogik, die nicht darauf abzielt, für eine einzelne Untersuchung notwendigerweise korrekt zu sein, sondern über viele Untersuchungen hinweg, in den meisten Fälle eine korrekte Entscheidung zu ermöglichen
II. Definition: Es geht also um relative Häufigkeiten auf lange Sicht. Wahrscheinlichkeiten werden also als relative Häufigkeiten durch den p-Wert ausgedrückt. Der P-Wert ist nichts anderes als eine bedingte Wahrscheinlichkeit über Daten gegeben einer Hypothese:
p=P(Daten|H_0)
subjektiver Wahrscheinlichkeitsbegriff
I. Der Wahrscheinlichkeitsbegriff der bayesianischen Verfahrens: a)Sieht Wahrscheinlichkeiten als Überzeugen für das Zutreffen einer bestimmen Hypothese.
b)Diese Überzeugungen beruhen einerseits auf den erhobenen Daten, andererseits auf Vorannahmen über die generelle Wahrscheinlichkeit bzw. Plausibilität einer Hypothese (sog. Priors) Demnach ist vor allem folgende Wahrscheinlichkeit von Interesse:
P(Hypothese|Daten,Vorannahmen)
Vergleich der Wahrscheinlichkeitsbegriffe
Als Vorteil des Bayes-Verfahren wird oft genannt, dass die Bayes-Statistik direkt die Frage danach beantwortet, welche Hypothese man im Angesicht der verfügbaren Datenlage vertreten sollte. Dies wird durch Nullhypothesen-Signifikanztests nur über Umwegen erreicht. Jedoch ist bei Näherer Betrachtung die Bayes-Statistik mind. genau so indirekt wie die Inferenzstatistik.
Die Verteilung des p-Werts
- Die Wahrscheinlichkeit ein signifikantes Ergebnis zu erzielen steigt bei Gültigkeit der (angenommenen) Alternativhypothese, wenn die Stichproben größer werden.
- Bei Gültigkeit der Alternativhypothese werden die resultierenden p-Werte tendenziell kleiner und gehen gegen 0
- Wie verhält sich der p-Wert, wenn die H0 gilt?
I. Häufige Antwort: er geht nicht gegen 0, sondern gegen 1, diese Vermutung ist jedoch falsch
II. Richtige Antwort: In diesem Fall hat die Stichprobengröße keinen Einfluss auf die Häufigkeit bestimmter p-Werte
Verteilung des P-Werts bei Gültigkeit der H0
Gleichverteilung, alle p-Werte sind gleich wahrscheinlich, unabhängig von Stichprobenumfang. Mittelwerte schwanken um p = 0.5
Verteilung des p-Werts bei Gültigkeit der H1
Schiefe Verteilung, mehr kleine als große p-werte, dieser Trend wird ausgeprägter, je mehr der Stichprobenumfang zunimmt
Der Satz des Bayes - was beschreibt er?
- Den Zusammenhang der beiden bedingten Wahrscheinlichkeiten P(A|B) und P(B|A).
- Der Satz drückt die bedingte Wahrscheinlichkeit P(A|B) aus durch:
(i) die bedingte Wahrscheinlichkeit von P(B|A) und
(ii) die beiden Wahrscheinlichkeiten P(A) und P(B)
Sensitivität und Spezifität
(i) Sensitivität: Hohe Sensitivität liegt vor, wenn bei Vorhandensein einer Krankheit diese auch als solche erkannt wird, also bei hohen Werte für P(positives Ergebnis| Krankheit vorhanden) bzw. kurz P(+|K)
(ii) Spezifität: Hohe Spezifität leigt dann vor, wenn gesunde Personen auch tatsächlich als solche Erkannt werden, also bei hohen Werten für P(negatives Untersuchungsergebnis | Krankheit nicht vorhanden) bzw. kurz P(−|¬K).
Der Satz des Bayes im Kontext von Hypothesentests
I1. formalisiert den Zusammenhang zwischen Hypothesen und den zum Test dieser Hypothesen erhobenen Daten.
2. Hierzu ersetzen wir das Ergebnis A mit einer prüfenden Hypothese und das Ergebnis B mit den erhobenen Daten.
Es ergibt sich:
P(Hypothese│Daten)=(P(Daten│Hypothese)*P(Hypothese))/(P(Daten))
Terminologie für: P(Hypothese|Daten):
• P(Daten|Hypothese):
• P(Hypothese):
P (Daten):
P(Hypothese|Daten): posterior probability
• P(Daten|Hypothese): likelihood
• P(Hypothese): prior probability (kurz: prior)
• P(Daten): marginal likelihood
Probleme des Satz des Bayes
Wenn wir alle Terme rechts des Gleichzeichens der Gleichung kennen würden, dann könnten wir eine Wahrscheinlichkeit für bestimmte Hypothesen anhand der aktuellen Datenlage berechnen. Dies ist jedoch leider nicht ohne weiteres möglich. Daher gibt es zwei kritische Einschränkungen:
I. Berechnung von likelihood P(Daten|Hypothese)
II. Abschätzung der prior probability und der marginal likelihood
Problem des Satz des Bayes: 1. Berechnung von likelihood (P(Daten|Hypothese)
- Wir benötigen für die Berechnung zwingend eine spezifische Hypothese. Dies trifft typischerweise auf die Nullhypothese zu, während die Alternativhypothese für viele Forschungsfragen unspezifisch formuliert wird (was auch die Berechnung der Power dann unmöglich macht). Dies ist auch der Grund warum spezifische Nullhypothesen-Siginfikanztests den p-Wert unter der Annahme der Nullhypothese berechnen und ihre Entscheidungslogik an diesem Kennwert festmachen.
Eine notwendige Voraussetzung für die Durchführung eines bayesianischen Hypothesentests ist es demnach, eine spezifische Alternativhypothese zu formulieren.
(ii) Verteilung von zu erwartenden Effektstärken wird oft implizit angenommen
Probleme des Satz des bayes: 2. Abschätzung der prior probability und der marginal likelihood
(i) insbesondere die marginal likelihood nicht oder nur sehr aufwändig bestimmbar
(ii) daher betrachtet man oft Odds und kürzt bei der Betrachtung von zwei Hypothesen die marginal likelihood einfach raus:
Der Bayes-Faktor: Definition
Verhältnis zweier likelihoods, welches für zwei konkurrierende Hypothese angibt, welche der beiden Hypothesen die verfügbaren Daten korrekt widerspiegelt
P(H1) / P(H0)
Der Index 01 gibt dabei an, welche Hypothese dem Zahler (die erste Ziffer) und welche Hypothese dem Nenner (die zweite Ziffer) zugrunde liegt.