Bayes-Statistik Flashcards

1
Q

Was strebt die Bayes-Statistik an?

A

Wahrscheinlichkeiten über Hypothesen zu testen. Woher haben wir Nullhypothesen-Signifikanztests gemacht, die p-Wert als Wahrscheinlichkeit von Daten gegeben, eine bestimmte Hypothese (zumeist die Nullhypothese) wurde gelten, berechnet haben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

frequentistischer/ objektiver Wahrscheinlichkeitsbegriff

A

I. Der Wahrscheinlichkeitsbegriff der Inferenzstatistik: Bedient sich einer Entscheidungslogik, die nicht darauf abzielt, für eine einzelne Untersuchung notwendigerweise korrekt zu sein, sondern über viele Untersuchungen hinweg, in den meisten Fälle eine korrekte Entscheidung zu ermöglichen
II. Definition: Es geht also um relative Häufigkeiten auf lange Sicht. Wahrscheinlichkeiten werden also als relative Häufigkeiten durch den p-Wert ausgedrückt. Der P-Wert ist nichts anderes als eine bedingte Wahrscheinlichkeit über Daten gegeben einer Hypothese:
p=P(Daten|H_0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

subjektiver Wahrscheinlichkeitsbegriff

A

I. Der Wahrscheinlichkeitsbegriff der bayesianischen Verfahrens: a)Sieht Wahrscheinlichkeiten als Überzeugen für das Zutreffen einer bestimmen Hypothese.
b)Diese Überzeugungen beruhen einerseits auf den erhobenen Daten, andererseits auf Vorannahmen über die generelle Wahrscheinlichkeit bzw. Plausibilität einer Hypothese (sog. Priors) Demnach ist vor allem folgende Wahrscheinlichkeit von Interesse:
P(Hypothese|Daten,Vorannahmen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vergleich der Wahrscheinlichkeitsbegriffe

A

Als Vorteil des Bayes-Verfahren wird oft genannt, dass die Bayes-Statistik direkt die Frage danach beantwortet, welche Hypothese man im Angesicht der verfügbaren Datenlage vertreten sollte. Dies wird durch Nullhypothesen-Signifikanztests nur über Umwegen erreicht. Jedoch ist bei Näherer Betrachtung die Bayes-Statistik mind. genau so indirekt wie die Inferenzstatistik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Die Verteilung des p-Werts

A
  1. Die Wahrscheinlichkeit ein signifikantes Ergebnis zu erzielen steigt bei Gültigkeit der (angenommenen) Alternativhypothese, wenn die Stichproben größer werden.
  2. Bei Gültigkeit der Alternativhypothese werden die resultierenden p-Werte tendenziell kleiner und gehen gegen 0
  3. Wie verhält sich der p-Wert, wenn die H0 gilt?
    I. Häufige Antwort: er geht nicht gegen 0, sondern gegen 1, diese Vermutung ist jedoch falsch
    II. Richtige Antwort: In diesem Fall hat die Stichprobengröße keinen Einfluss auf die Häufigkeit bestimmter p-Werte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Verteilung des P-Werts bei Gültigkeit der H0

A

Gleichverteilung, alle p-Werte sind gleich wahrscheinlich, unabhängig von Stichprobenumfang. Mittelwerte schwanken um p = 0.5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Verteilung des p-Werts bei Gültigkeit der H1

A

Schiefe Verteilung, mehr kleine als große p-werte, dieser Trend wird ausgeprägter, je mehr der Stichprobenumfang zunimmt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Der Satz des Bayes - was beschreibt er?

A
  1. Den Zusammenhang der beiden bedingten Wahrscheinlichkeiten P(A|B) und P(B|A).
  2. Der Satz drückt die bedingte Wahrscheinlichkeit P(A|B) aus durch:
    (i) die bedingte Wahrscheinlichkeit von P(B|A) und
    (ii) die beiden Wahrscheinlichkeiten P(A) und P(B)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Sensitivität und Spezifität

A

(i) Sensitivität: Hohe Sensitivität liegt vor, wenn bei Vorhandensein einer Krankheit diese auch als solche erkannt wird, also bei hohen Werte für P(positives Ergebnis| Krankheit vorhanden) bzw. kurz P(+|K)
(ii) Spezifität: Hohe Spezifität leigt dann vor, wenn gesunde Personen auch tatsächlich als solche Erkannt werden, also bei hohen Werten für P(negatives Untersuchungsergebnis | Krankheit nicht vorhanden) bzw. kurz P(−|¬K).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Der Satz des Bayes im Kontext von Hypothesentests

A

I1. formalisiert den Zusammenhang zwischen Hypothesen und den zum Test dieser Hypothesen erhobenen Daten.
2. Hierzu ersetzen wir das Ergebnis A mit einer prüfenden Hypothese und das Ergebnis B mit den erhobenen Daten.
Es ergibt sich:
P(Hypothese│Daten)=(P(Daten│Hypothese)*P(Hypothese))/(P(Daten))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Terminologie für: P(Hypothese|Daten):
• P(Daten|Hypothese):
• P(Hypothese):
P (Daten):

A

P(Hypothese|Daten): posterior probability
• P(Daten|Hypothese): likelihood
• P(Hypothese): prior probability (kurz: prior)
• P(Daten): marginal likelihood

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Probleme des Satz des Bayes

A

Wenn wir alle Terme rechts des Gleichzeichens der Gleichung kennen würden, dann könnten wir eine Wahrscheinlichkeit für bestimmte Hypothesen anhand der aktuellen Datenlage berechnen. Dies ist jedoch leider nicht ohne weiteres möglich. Daher gibt es zwei kritische Einschränkungen:
I. Berechnung von likelihood P(Daten|Hypothese)
II. Abschätzung der prior probability und der marginal likelihood

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Problem des Satz des Bayes: 1. Berechnung von likelihood (P(Daten|Hypothese)

A
  1. Wir benötigen für die Berechnung zwingend eine spezifische Hypothese. Dies trifft typischerweise auf die Nullhypothese zu, während die Alternativhypothese für viele Forschungsfragen unspezifisch formuliert wird (was auch die Berechnung der Power dann unmöglich macht). Dies ist auch der Grund warum spezifische Nullhypothesen-Siginfikanztests den p-Wert unter der Annahme der Nullhypothese berechnen und ihre Entscheidungslogik an diesem Kennwert festmachen.
    Eine notwendige Voraussetzung für die Durchführung eines bayesianischen Hypothesentests ist es demnach, eine spezifische Alternativhypothese zu formulieren.
    (ii) Verteilung von zu erwartenden Effektstärken wird oft implizit angenommen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Probleme des Satz des bayes: 2. Abschätzung der prior probability und der marginal likelihood

A

(i) insbesondere die marginal likelihood nicht oder nur sehr aufwändig bestimmbar
(ii) daher betrachtet man oft Odds und kürzt bei der Betrachtung von zwei Hypothesen die marginal likelihood einfach raus:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Der Bayes-Faktor: Definition

A

Verhältnis zweier likelihoods, welches für zwei konkurrierende Hypothese angibt, welche der beiden Hypothesen die verfügbaren Daten korrekt widerspiegelt
P(H1) / P(H0)
Der Index 01 gibt dabei an, welche Hypothese dem Zahler (die erste Ziffer) und welche Hypothese dem Nenner (die zweite Ziffer) zugrunde liegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Der Bayes-Faktor: Interpretationen

A

(i) Manchmal Interpretation: Bayes-Faktor gäbe direkt das posterior odds ratio an, also um wieviel wahrscheinliher die eine gegenüber der anderen Hypothese ist
Achtung: Das stimmt aber nur, wenn das prior odds ratio 1 ist und dies trifft nur zu in genau einer Situation, nämlich, wenn P(H0) = P(H1) = 0.5 ist.  dies ist sicherlich eine machbare Annahme, jedoch nicht immer sinnvoll und entspricht genau der Grundidee der Bayesianischen Herangehensweise, dass Vorkenntnisse mit in die a prori Bewertung von Hypothesen einfießen sollten.
(ii) Sinnvoller Interpretation: Sinnvoller ist daher die Interpreation, dass der Bayes Faktor angibt, um welchen Faktor sich das prior odds ratio ändert. Das heißt, er verändert die vorher getroffenen Annahmen über die Plausibilität der H0 gegenüber der H1 in Abhängigkeit der vorliegenden Daten.

17
Q

der Bayes-Faktor: Wichtigste Interpretation

A

Der Bayes-Faktor ist eines der zentralen Ergebnisse einer Bayesianischen Analyse und Bayesianische Hypothesentests wurden in jüngere Zeit für alle gängigen Verfahren der Inferenzstatistik entwickelt. Die wichtigste Interpreation dabei ist (vorausgesetzt (P(H_1))/(P(H_0))=1 )
BF10 > 1: die Daten sind unter der H1 wahrscheinlicher
BF10 = 1: Die daten sind unter der H1 genauso wahrscheinlich wie unter der H0
0 < BF10 <1: Die Daten sind unter der H0 wahrscheinlicher

18
Q

Bayes-Faktor: Einteilung von 1 -100

A

1-3: andekdotisch bzw. vernachlässigbar
3-10: substantiell/moderat
10-30: stark
30-100: sehr stark
>100: extrem
Die in der Tabelle aufgeführten Werte gelten dabei nur für Evidenz für dasjenige Modell, welches in der Gleichung zur Herleitung des Bayes-Faktors in den Zähler eingegangen ist.
BF01 > 1 würden dann entsprechend Evidenz für die H0 liefern, während BF01 < 1 Evidenz für die H1 indizieren würden

19
Q

umrechung von BF01 zu BF10

A

1/ BF10 = BF01

20
Q

Transitivität des Bayes-Faktors

A

Eine wichtige Eigenschaft des Bayes-Faktors ist seine Transitivität:
Wenn eine Hypothese A 10-mal soviel Evidenz wie eine Hypothese B erfährt: als BFAB = 10 ist und die Hypothese B 5-mal so viel Evidenz wie eine Hypothese C erfährt: also BFBC = 5,
dann ist auch BFAC = BFAB * BFBC = 50: Die Hypothese A erfährt als 50-mal soviel Evidenz wie die Hypothese C. Dadurch ist es auch sinnvoll, in einer Serie von Studien das posterior odds ratio der ersten Studie zum prior odds ratio der zweiten Studie zu machen

21
Q

Bayes-Verfahren vs. Inferenzstatistik

A
  1. Vorteile Bayes-Verfahren:
    a) bietet Vorteile gegenüber klassischen Verfahren, aber dafür müssen jedoch andere Einschränkungen in Kauf genommen werden und weitere teilweise nicht immer offensichtliche Annahmen gemacht werden.

b) Nachteile:
Bayes-Verfahren weniger standardisiert als klassische Verfahren: Berechnung & der Interpretation von Bayes Faktoren keinen Konsens

c) beide Verfahren führen oft zu ähnlichen Ergebnissen. Entscheidungen aufgrund von Bayes-Faktor sind lediglich etwas konservativer als Entscheidungen aufgrund von p-Werten

22
Q

Mögliche Vorteile Bayesianischer Verfahren bei der Absicherung eines Nulleffekts

A

I. klassische Inferenzstatistik ist dazu nur bedingt in der Lage, während Bayes-Statistik auch Evidenz für eine Überlegenheit der Nullhypothese über die Alternativhypothese liefern kann

23
Q

p-Wert vs. Bayes-Faktor

A

Im Gegensatz zum p-Wert, wird der Bayes-Faktor bei Gültigkeit der Alternativhypothese mit zunehmender Stichprobengröße größer, während er bei Gültigkeit der H0 mit zunehmender Stichprobengrößer immer kleiner wird

24
Q

Analyse mit R

A

Bei der Ausgabe in R steht immer hinter dem Doppelpunkt der Wert für den Bayes_Faktor, der kann dann gemäß der vorgestellten Interpretationen bewertet werden. Für ein paar Beispiele ins Skript zu der Sitzung gucken.

25
Q

ttest bayes bei R

A

Wichtig: In der Formelsammlung steht nur Datenteil_1
hierfür müssen wir eingeben: Daten$Kriterium[Daten$Gruppe == X]
zb. Für x die Gruppennummer eingeben