13. VL - p-hacking, Daten Fälschung Flashcards
Was sagt uns der Hypothesentest/ Signifikanztest?
→ Er sagt aus, ob wir die H0 beibehalten oder verwerfen (=signifikant) - wie wahrscheinlich ist das gemessene Ergebnis unter H0
→ Wie wahrscheinlich ein Ergebnis unter der Annahme der H0 ist und damit
→ wie groß unsere Irrtumswahrscheinlichkeit ist, wenn wir die H0 aufgrund eines Ergebnisses ablehnen
Zwei untersuchte Variablen hängen nicht zusammen. Welche Hypothese liegt hier vor?
Nullhypothese H0
Zwei untersuchte Variablen hängen zusammen (z.B. Lernmethode und Test) Welche Hypothese liegt hier vor?
H1
Wann lehnt man die H0 ab?
- Wahrscheinlichkeit (p) des tatsächlichen Stichprobenergebnisses unter H0 ermitteln
- Ist sie kleiner als ⍺, dann lehnt man die H0 mit der Irrtumswahrscheinlichkeit ⍺ ab
- p < ⍺
Durch das Ausschließen von Vpn und durch Manipulation der Daten, wurde das p künstlich verkleinert. Was wurde hier gemacht?
p-hacking
Was bedeutet der Begriff publication bias?
- Das i.d.R. nicht-signifikante Ergebnisse nicht publiziert werden
- Man schaut sich p-Kurve v. 0-5% an:
- kleine p-Werte = wahrscheinlicher
- große p-Werte = weniger wahrscheinlich
- Alle Studien zu einem Thema p-Werte nahe 5% = stimmt was nicht
Mit welchen Methoden kann man p-hacking betreiben?
OUTCOME SWITCHING:
- Man misst mehrere AVs und berichtet nur von denen, die funktionieren
- AVs verdoppel die Rate, weil man zwei Chancen hat, einen Effekt zu finden
- 5 (unkorrelierte) AVs (einseitig), steigert Chance auf 41%
OPTIONAL STOPPING
- Daten erheben, bis Ergebnis signifikant ist
Wie kann man p-hacking feststellen und das Problem lösen?
- p-Kurven-Analyse
- (unter H0 ist die p-Kurve gleichverteilt (p-wert gleichwahrscheinlich)
- Open Science → Daten allgemein zugänglich machen
- Reanalysen zulassen → Studien Fehler in den Zahlen
- Prä-Registrierung → Registriert Idee online, entspricht Erwartungen = nicht durch p-h. entstanden
Wie kann ich kleine Effekte bewirken?
Mit einer großen Stichprobe wird es signifikant (mangelnde Effektstärke)
Wie bekomme ich große Effekte?
Mit einer kleinen Stichprobe (Mangelnde Power)