Forschungstext 1: The quest for an optimal alpha Flashcards
Das Problem mit α
- α = 0.05 der traditionelle cut-off-Wert
- eine wachsende Sorge in der Wissenschaft sind jedoch Falsch- positive Befunde, weshalb Forderungen nach strengere α-Werte gefordert werden
- Gegenargument ist, dass das auch den Wert für falsch-negative (ß-Fehler) erhöhen würde
- Autoren argumentieren: Das optimale α-Niveau hängt von viele Charakteristiken des Forschungsfeldes ab und das α in machen Fällen größer als 0.05 seinen sollte und in machen Fällen kleiner
Sorge um zu höhe α-Niveaus
aufgrund des Publikation-Bias, wenig Anstrengungen und manchen Forschungsfeldern und unangemessenen Analyse-Methoden oder Betrug empirische Evidenz, dass Forscher benutzten Praktiken, die den Fehler erster Art erhöhen (FP = False positiv) FP spielen ebenfalls bei der Replikationskriese eine Rolle
Vorschlag von Benjamin et al
Das Alpha-Level auf 0.005 zu reduzieren, um der steigenden Anzahl an FA entgegenzuwirken
-> Problem: Das Reduzieren von α-Niveaus kann auch zu einer Reduzierung der Replikationswahrscheinlichkeit führen
Vorschlag von Lakens et. al.
Lakens. Et. al.: Argumentieren gegen Benjamin et. al.:
Die Reduzierung von α führt auch zu einer Reduzierung der Power und damit die Rate von Falsch Negativen (FN) erhöhen -> viele Studien würden also einen Effekt nicht finden, der eigentlich existiert
Kritik der Autoren an Lakens et. al. und Benjamin et. al
d) Die Kritik der Autoren: Keine der Forderungen (werden nach α = 0.005 noch α = 0.05) spezifiziert die Parameter der Forschung in der das α angewandt werden soll
Statistische Grundlagen: Formalisierung der Abwägung zwischen FP und FN: Welche Rate erhöhen wahre bzw. falsche H0
π = die Basisrate wahrere Effekte (H0 = falsch)
1 – π = Die Gegenwahrscheinlichkeit (H0 = wahr)
-> Studien die wahre H0 testen produzieren eher FP oder True Negatives (TN) und Studien die falsche H0 testen produzieren eher FN oder True Positives (TP)
Statistische Grundlagen: Formel für die Wahrscheinlichkeiten der vier Ausgänge von Studien
- Pr (FP) = (1 – π) * α
- Pr (TN) = (1 – π) * (1 – α)
- Pr (FN) = π * β
- Pr (TP) = π * (1 – β)
Statistische Grundlagen: Power und wovon hängt sie ab?
Power = 1 – β Die Power hängt ab von I. Dem α-Level II. Der Größe des wahren Effekts (d) III. Und der Stichprobengröße (n)
Statistische Grundlagen: Die Formel für die Rate von FP
R_(fp ) =(Pr(FP)) / (Pr(FP)+Pr(TP))
Die Rate von FP ist die Wahrscheinlichkeit von FP geteilt durch die Wahrscheinlichkeit von FP + die Wahrscheinlichkeit von TP
Statistische Grundlagen: Die Formel für die Rate von FN
R_fn= (Pr(FN))/(Pr(FN)+Pr(TN) )
Die Rate von FN ist die Wahrscheinlichkeit von FN geteilt durch die Wahrscheinlichkeit von FN + die Wahrscheinlichkeit von TN
Bei welchem Alpha war die Rate von FP größer? (Bei allem im Text getesteten Kombinationen von d, Pi & Stichprobengröße?)
wenn α = 0.05
Bei welchem Alpha war die Rate von FN größer? (Bei allem im Text getesteten Kombinationen von d, Pi & Stichprobengröße?)
wenn α= 0.005
Der Payoff
- Eine empirische Studie wird immer einen dieser vier Ergebnisse erzielen: TP, TN, FN, FP
- Der Informationsgehalt (Payoff) dieser Ergebnisse kann beschrieben werden als: P_tp,P_tn,P_fp,P_fn
- Die Einheiten dieser Payoffs sind komplett willkürlich, daher ist es meist bequem P_(tp )=1 zu setzen und die anderen Payoffs in Relation dazu zu setzten. Auf dieser Skala hat P_fp= -2. Das würde bedeuten, dass der Informationsschade dieser Missinformation (FP) in dem Forschungsfeld mit zwei „richtigen“ Informationen ( 2 * TP) ausgeglichen werden würde
- Diese Payoff-Werte variieren jedoch nach Forschungsfeld stark und sind eigentlich nur subjektiv abschätzbar
Der durschnittliche Payoff einer Studie (P_1) und der totale Payoff aller Studie (P_T)
- durchschnittliche Payoff einer Studie:
P_1= Pr(TP)* P_tp + Pr(FP)* P_fp + Pr(TN)* P_tn + Pr(FN)* P_fn
Die Summe der Wahrscheinlichkeit aller vier möglichen Ausgänge multipliziert mit ihrem jeweiligen Payoff
Der totale Payoff alles durchgeführten Studie (P_T) wäre:
P_T = k*P_1
Wobei k der Anzahl der durchgeführten Studien entspricht
Wie versuchen Forschende im Bezug auf dem Payoff zu entscheiden und welche Parameter müssen dafür berücksichtigt werden?
- Forschende versuchen die Entscheidungen immer so zu treffen, dass sich der Payoff maximiert, dafür müssen sie zwei Entscheidungen treffen:
I. Die Stichprobengröße (n): größere Stichproben haben größer Power (1-β) , aber sind Zeitaufwändiger und teurer, sodass die Erhöhung der Stichprobengröße mit einer Senkung der Gesamtanzahl an Studien (k) einhergeht
II. α-Level: Das Auszuwählen hängt jedoch nicht nur an den Forschenden, sondern auch z.B.: an den Standards dem Journals in dem veröffentlicht wird
-> Das Problem der Forschenden ist als den Wert von n und α so zu bestimmen, dass sie den Maximalen totalen Payoff P_T generieren