VL2 Statistische Entscheidungen und Teststärke Flashcards

1
Q

Was ist die Teststärke (Power) eines statistischen Tests?

A

Wahrscheinlichkeit, ein signifikantes Ergebnis zu finden, wenn die Alternativhypothese wahr ist.
Drückt aus, wie wahrscheinlich es ist, einen Effekt zu entdecken, wenn dieser tatsächlich existiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche vier Faktoren beeinflussen die Teststärke?

A

Signifikanzniveau (α): Höheres α erhöht die Teststärke.
Stichprobengröße (N): Größere Stichproben erhöhen die Teststärke.
Effektstärke (ES): Größere Effekte erhöhen die Teststärke.
Reliabilität der Messung: Zuverlässige Messungen verbessern die Teststärke indirekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist ein β-Fehler, und wie hängt er mit der Teststärke zusammen?

A

β-Fehler: Wahrscheinlichkeit, einen existierenden Effekt zu übersehen (Fehler 2. Art).
Zusammenhang: Teststärke = 1−𝛽.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist eine a-priori Poweranalyse?

A

Wird vor einer Studie durchgeführt, um die erforderliche Stichprobengröße zu bestimmen.
Notwendige Eingaben: Effektstärke, Signifikanzniveau und gewünschte Teststärke (z. B. 80 %).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist eine post-hoc Poweranalyse?

A

Wird nach einer Studie durchgeführt, um die tatsächliche Teststärke zu berechnen.
Berücksichtigt die beobachtete Effektstärke, Stichprobengröße und Signifikanzniveau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist eine Sensitivitätsanalyse?

A

Bestimmt, wie groß ein Effekt sein muss, um bei einer gegebenen Teststärke und Stichprobengröße entdeckt zu werden.
Nützlich bei festem Studiendesign, um die Nachweisfähigkeit eines Tests zu evaluieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind die Folgen geringer Teststärke?

A

Erhöhtes Risiko, wahre Effekte zu übersehen.
Verschwendung von Ressourcen (z. B. Zeit, Geld, Probanden).
Erhöhte Wahrscheinlichkeit von falschen Ergebnissen in der Forschung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie kann die Teststärke in der Praxis erhöht werden?

A

Größere Stichproben verwenden.
Effektstärke durch präzises Studiendesign maximieren.
Signifikanzniveau leicht erhöhen (mit Vorsicht, da dies den α-Fehler steigert).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist der Positive Vorhersagewert (PPV), und warum ist er wichtig?

A

Definition: Wahrscheinlichkeit, dass ein signifikantes Ergebnis tatsächlich korrekt ist.
Höhere Teststärke und strengeres Signifikanzniveau (kleineres α) erhöhen den PPV.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist das Nullritual, und warum wird es kritisiert?

A

Nullritual: Standardverfahren des Nullhypothesensignifikanztestens (H0 formulieren, α festlegen, Ergebnis prüfen).
Kritik:
Fokus auf Signifikanz statt praktischer Relevanz.
Unrealistische Nil-Nullhypothese (kein Effekt existiert).
Fehlinterpretationen des p-Werts.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was bedeutet der p-Wert?

A

Wahrscheinlichkeit, einen mindestens so großen Effekt zu beobachten, wenn die Nullhypothese wahr ist.
Wichtig: Er sagt nichts über die Wahrscheinlichkeit aus, dass die H0 wahr oder falsch ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche Fehlinterpretationen des p-Werts sind häufig?

A

Der p-Wert gibt die Wahrscheinlichkeit an, dass die Nullhypothese falsch ist (falsch!).
Ein signifikanter p-Wert beweist, dass die Alternativhypothese wahr ist (falsch!).
Ein nicht-signifikanter p-Wert zeigt, dass kein Effekt existiert (falsch!).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Lösungsvorschläge für die Kritik am Signifikanztesten?

A

Berichterstattung von Effektstärken und Konfidenzintervallen.
Durchführung von Replikationsstudien.
Teststärkeanalysen vor der Studie durchführen.
Bayesianische Ansätze nutzen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Warum sind Effektstärken wichtig?

A

Geben die praktische Bedeutung eines Ergebnisses an.
Ergänzen p-Werte, um die Relevanz eines Effekts zu bewerten.
Beispiele: Cohen’s d, Korrelationskoeffizient r, R² bei der Regression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind die Unterschiede zwischen Teststärke und Effektstärke?

A

Teststärke: Wahrscheinlichkeit, einen existierenden Effekt zu entdecken (abhängig von α, N, ES).
Effektstärke: Größe des tatsächlichen Effekts, unabhängig von der Stichprobengröße.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist eine Fehlerrate 2. Art (β), und warum ist sie relevant?

A

Definition: Wahrscheinlichkeit, einen existierenden Effekt nicht zu entdecken.
Relevanz: Ein hoher β-Wert (geringe Teststärke) kann wichtige Effekte übersehen und zu falschen Schlussfolgerungen führen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wie hängt die Stichprobengröße mit der Teststärke zusammen?

A

Größere Stichproben reduzieren den Standardfehler und erhöhen die Präzision von Schätzungen.
Dies führt zu einer höheren Wahrscheinlichkeit, signifikante Effekte zu erkennen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was sind die typischen Schwellenwerte für die Teststärke in Studien?

A

Üblicher Standard: 80 % (1-β = 0.8).
Bedeutet, dass ein Effekt mit 80 % Wahrscheinlichkeit erkannt wird, wenn er existiert.

19
Q

Warum ist eine niedrige Teststärke problematisch in der Forschung?

A

Erhöht die Wahrscheinlichkeit, wahre Effekte zu übersehen.
Führt zu einer Verzerrung der veröffentlichten Ergebnisse (z. B. Publikationsbias).
Kann falsche Evidenz für die Nullhypothese liefern.

20
Q

Was ist der Unterschied zwischen einer hohen und niedrigen Effektstärke?

A

Hohe Effektstärke: Deutlicher Unterschied oder starker Zusammenhang zwischen Variablen.
Niedrige Effektstärke: Schwacher oder subtiler Zusammenhang, oft schwer nachweisbar.

21
Q

Was ist eine exploratory vs. confirmatory Poweranalyse?

A

Exploratory: Zur Untersuchung neuer Hypothesen; oft geringere Teststärke akzeptiert.
Confirmatory: Zur Prüfung spezifischer Hypothesen; erfordert hohe Teststärke (mindestens 80 %).

22
Q

Was ist der Unterschied zwischen Sensitivität und Spezifität in statistischen Tests?

A

Sensitivität: Fähigkeit, tatsächlich vorhandene Effekte zu erkennen (verwandt mit Teststärke).
Spezifität: Fähigkeit, keine falschen positiven Ergebnisse zu liefern (niedriger α-Fehler).

23
Q

Was ist ein Signifikanzniveau (α), und wie beeinflusst es die Teststärke?

A

Definition: Wahrscheinlichkeit, einen α-Fehler (falsches Ablehnen der Nullhypothese) zu begehen.
Einfluss: Ein höheres α (z. B. 0.1 statt 0.05) erhöht die Teststärke, aber auch die Gefahr von Fehlalarmen.

24
Q

Was sind die Vor- und Nachteile einer hohen Teststärke?

A

Vorteile:
Reduziert die Wahrscheinlichkeit, Effekte zu übersehen (niedriger β-Fehler).
Erhöht die Zuverlässigkeit von Ergebnissen.
Nachteile:
Erfordert oft größere Stichproben, was kostspielig sein kann.

25
Was ist Publikationsbias, und wie hängt er mit Teststärke zusammen?
Publikationsbias: Studien mit signifikanten Ergebnissen werden häufiger veröffentlicht. Zusammenhang: Studien mit geringer Teststärke produzieren häufiger nicht-signifikante Ergebnisse, die oft nicht veröffentlicht werden, was zu einer Verzerrung führt.
26
Wie beeinflussen unreliable Messinstrumente die Teststärke?
Unreliable Instrumente erhöhen die Messfehler und reduzieren die Effektstärke. Dies führt zu einer geringeren Wahrscheinlichkeit, signifikante Ergebnisse zu finden.
27
Was ist eine False Discovery Rate (FDR)?
Definition: Anteil der falsch positiven Ergebnisse unter den signifikanten Tests. Zusammenhang: FDR steigt bei geringer Teststärke und bei vielen Tests ohne wahre Effekte.
28
Wie können Bayesianische Ansätze die Teststärke ergänzen?
Bayesianische Ansätze bewerten die Plausibilität von Hypothesen unter Berücksichtigung von a-priori-Wissen. Ermöglichen stärkere Schlussfolgerungen, auch bei kleinen Stichproben.
29
Was ist eine Effektgrößen-basierte Poweranalyse?
Bestimmung der notwendigen Stichprobengröße basierend auf einer geschätzten Effektgröße. Beispiele für Effektgrößen: Cohen’s d für Mittelwertsunterschiede. r für Korrelationen. f² für multiple Regressionen.
30
Was ist der Zusammenhang zwischen Effektgröße und Teststärke?
Größere Effektgrößen erhöhen die Teststärke, da sie leichter nachweisbar sind. Kleine Effektgrößen erfordern größere Stichproben, um signifikante Ergebnisse zu erzielen.
31
Was sind typische Werte für kleine, mittlere und große Effektgrößen nach Cohen?
Cohen’s d: Klein: 𝑑=0.2 Mittel: d=0.5. Groß: d=0.8. Korrelationskoeffizient r: Klein: r=0.1. Mittel: r=0.3. Groß: r=0.5.
32
Was ist der Unterschied zwischen tatsächlicher und wahrer Effektgröße?
Tatsächliche Effektgröße: Gemessene Größe in einer Stichprobe, beeinflusst durch Zufallsfehler. Wahre Effektgröße: Effektgröße in der gesamten Population, unabhängig von Stichprobenfehlern.
33
Was ist die Konsequenz einer zu kleinen Stichprobe für die Forschung?
Geringe Teststärke, wodurch wahre Effekte übersehen werden können. Erhöhte Wahrscheinlichkeit von unzuverlässigen oder instabilen Ergebnissen. Schwierigkeit, replizierbare Ergebnisse zu erzielen.
34
Was ist eine statistische Replikation, und warum ist sie wichtig?
Definition: Wiederholung einer Studie, um die Gültigkeit der Ergebnisse zu überprüfen. Wichtigkeit: Reduziert den Einfluss zufälliger Fehler und stärkt die Glaubwürdigkeit von Befunden.
35
Welche Rolle spielt das Signifikanzniveau (𝛼) bei der Fehlerrate?
Höheres 𝛼 erhöht die Wahrscheinlichkeit eines α-Fehlers (falsches Ablehnen von H0) Strenges 𝛼 (z. B. 0.01 statt 0.05) reduziert den α-Fehler, kann aber die Teststärke senken.
36
Warum ist die Balance zwischen α und β wichtig?
Niedriges 𝛼 reduziert den α-Fehler, kann aber die Teststärke (1-β) senken und den β-Fehler erhöhen. Optimal ist ein Gleichgewicht, das verlässliche Ergebnisse ohne unnötig hohe Fehlerraten ermöglicht.
37
Was ist ein Publikationsbias, und wie hängt er mit der Teststärke zusammen?
Publikationsbias: Studien mit signifikanten Ergebnissen werden häufiger veröffentlicht. Bei geringer Teststärke werden viele wahre Effekte übersehen, was die publizierte Forschung verzerrt.
38
Was sind multiple Tests, und welche Probleme können auftreten?
Definition: Mehrere statistische Tests innerhalb einer Studie. Problem: Erhöhte Wahrscheinlichkeit für Fehlalarme (α-Fehlerkumulierung). Lösung: Bonferroni-Korrektur oder False Discovery Rate (FDR).
39
Was ist die Bonferroni-Korrektur?
40
Was ist der Unterschied zwischen Teststärke und Sensitivität?
Teststärke: Wahrscheinlichkeit, einen Effekt zu entdecken, wenn er existiert. Sensitivität: Fähigkeit eines Tests, korrekt positive Ergebnisse zu identifizieren. Beide Begriffe sind eng verwandt, aber Sensitivität wird häufiger in der Diagnostik verwendet.
41
Was ist eine Meta-Analyse, und wie hilft sie bei Teststärkeproblemen?
Definition: Zusammenfassung und Analyse von Ergebnissen mehrerer Studien. Nutzen: Erhöht die statistische Power durch größere aggregierte Stichproben. Liefert präzisere Schätzungen von Effektgrößen.
42
Wie kann der β-Fehler reduziert werden?
Erhöhung der Stichprobengröße. Verbesserung der Messinstrumente (höhere Reliabilität). Verwendung von gerichteten Tests, wenn die Richtung des Effekts bekannt ist.
43
Warum sind gerichtete Tests oft teststärker als ungerichtete?
Gerichtete Tests prüfen nur eine spezifische Richtung des Effekts. Reduzieren die kritische Fläche im Test, was die Wahrscheinlichkeit erhöht, einen Effekt zu entdecken.
44
Welche Alternativen zum klassischen Signifikanztesten gibt es?
Bayesianische Ansätze: Integrieren a-priori-Wissen und berechnen Wahrscheinlichkeiten direkt. Effektstärkenanalyse: Fokus auf praktische Relevanz statt nur auf Signifikanz. Konfidenzintervalle: Stellen Unsicherheiten klar dar.