Klassische Inferenzstatistik Flashcards

1
Q

Was ist das Ziel psychologischer Forschung?

A

Das Ziel psychologischer Forschung ist das Verstehen und Erklären menschlichen Erlebens und Verhaltens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind die Merkmale einer wissenschaftlichen Theorie?

A
  • Allgemeingültigkeit

-Überwindung des Einzelfalls

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wer legte Anfang des 20. Jahrhunderts die Grundlagen für den kritischen Rationalismus?

A

Karl Popper

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Ansicht vertrat Karl Popper in Bezug auf die Bildung von Theorien?

A

Karl Popper vertrat die Ansicht, dass Theorien nicht aus Einzelbeobachtungen abgeleitet werden können

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist Induktion und warum argumentierte Popper dagegen?

A
  • Induktion ist der Schluss vom Einzelfall auf eine allgemeingültige Regel
  • Popper argumentierte, dass dieser Schluss nicht zwingend logisch ist
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie kann man eine Theorie und Beobachtung in einem Konditionalsatz darstellen und was bedeutet das für die Überprüfung einer Theorie?

A

Eine Theorie und Beobachtung können in einem Konditionalsatz dargestellt werden, wobei die Beobachtung die Theorie nicht beweist, sondern nur widerlegen kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist Modus Tollens und warum ist es wichtig für wissenschaftliche Theorien?

A

Modus Tollens besagt, dass wenn die Konsequenz einer Theorie nicht eintritt, die Theorie falsch sein muss

> wichtig, um Theorien zu überprüfen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was bedeutet es, dass eine Theorie falsifizierbar sein muss?

A
  • Eine Theorie muss falsifizierbar sein, um wissenschaftlich zu sein

> bedeutet, dass sie anhand von Beobachtungen widerlegt werden kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Hypothesen und wie werden sie aus einer Theorie abgeleitet?

A

Hypothesen sind Vorhersagen oder Erwartungen, die aus einer Theorie abgeleitet werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist Deduktion und warum ist sie wichtig für die wissenschaftliche Arbeit?

A
  • das Ableiten spezifischer Hypothesen aus einer allgemeinen Theorie

> ist wichtig für die wissenschaftliche Arbeit, da sie die Grundlage für Hypothesentests bildet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind Hypothesentests und warum sind sie entscheidend für die wissenschaftliche Arbeit?

A
  • sind entscheidend für die wissenschaftliche Arbeit
  • ermöglichen die Überprüfung von Hypothesen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist eine Population und wie steht sie in Beziehung zur Stichprobe?

A
  • Ist die Gesamtheit der Elemente, auf die eine Theorie und abgeleitete Hypothesen zutreffen
  • Die Stichprobe ist eine Teilmenge der Population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist Inferenzstatistik und warum ist sie wichtig für den Umgang mit Stichproben?

A
  • um von Stichproben auf Populationen zu schließen
  • um Wahrscheinlichkeitsaussagen zu treffen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Statistische Hypothesentests werden verwendet, um …

A
  • … die Passung zwischen Erwartung und Beobachtung zu quantifizieren
  • … Hypothesen zu überprüfen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist die klassische oder frequentistische Inferenzstatistik und was ist ihre Grundlage?

A
  • basiert auf der Definition von Wahrscheinlichkeit als relative Häufigkeit
  • betrachtet Wahrscheinlichkeiten als Eigenschaften von hypothetischen unendlichen Folgen von Beobachtungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist eine Hypothese und wie unterscheidet sie sich von einer Tatsachenbeschreibung?

A

Eine Hypothese ist eine Vorhersage über den Zustand der Welt, die keine Tatsachenbeschreibung, sondern eine mögliche Situation darstellt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welche Arten von Hypothesen sind in der Psychologie üblich und welche Beispiele werden genannt?

A

In der Psychologie sind verbale Hypothesen üblich, die oft quantifiziert werden müssen.

> Beispiele sind Hypothesen über Erinnerung, Wahrnehmung oder Wirksamkeit von Therapien

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Warum ist es schwierig, psychologische Hypothesen zu testen?

A

Psychologische Hypothesen sind oft schwer zu testen, da sie oft vage formuliert sind und schwierig zu quantifizieren sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Warum müssen psychologische Hypothesen oft in statistische Hypothesen umgewandelt werden?

A
  • um sie mit Daten zu überprüfen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wie kann statistisches Rauschen die Überprüfung einer Hypothese beeinflussen?

A

kann die Ergebnisse einer Studie beeinflussen, da es zu unvorhersehbaren Variationen in den Daten führt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welches Konzept wird verwendet, um mit dem statistischen Rauschen umzugehen, und wie wird es angewendet?

A

Das Konzept der Zufallsvariable

> Es definiert die Ergebnisse eines Experiments als Variable mit einer bestimmten Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was ist eine Zufallsvariable und wie wird sie im Kontext der psychologischen Forschung verwendet?

A

Eine Zufallsvariable wird verwendet, um die Ergebnisse eines Experiments zu beschreiben

> sie unterliegt einer bestimmten Wahrscheinlichkeitsverteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist die Binomialverteilung und wie wird sie im Zusammenhang mit psychologischen Experimenten angewendet?

A

Die Binomialverteilung wird verwendet, um die Wahrscheinlichkeit von Erfolgen oder Misserfolgen in einer festgelegten Anzahl von Versuchen zu beschreiben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Welche Parameter beschreiben die Binomialverteilung und wie werden sie definiert?

A

Die Binomialverteilung wird durch zwei Parameter beschrieben

  • die Wahrscheinlichkeit eines Erfolgs (λ)
  • und die Anzahl der Versuche (N)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Was sind Erfolge und Misserfolge in Bezug auf die Binomialverteilung und wie werden sie verwendet, um die Wahrscheinlichkeit eines Ereignisses zu berechnen?

A
  • werden in Bezug auf die Binomialverteilung definiert, um die Wahrscheinlichkeit eines Ereignisses zu berechnen

> Erfolge sind das Ereignis von Interesse

> während Misserfolge das Gegenteil sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Wie wird eine binomialverteilte Zufallsvariable notiert und was bedeutet diese Notation?

A

Eine binomialverteilte Zufallsvariable wird notiert als X Binomial(λ, N)

> was bedeutet, dass X binomialverteilt ist mit einer Wahrscheinlichkeit λ und N Versuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Welche beiden Parameter bestimmen die Binomialverteilung?

A
  • die Wahrscheinlichkeit λ
  • die Anzahl der Versuche n
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Was ist die Nullhypothese und wie wird sie definiert?

A

Die Nullhypothese ist eine Hypothese, die einen Zustand “ohne Effekt” repräsentiert

> wird normalerweise als H0 bezeichnet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Warum repräsentiert die Nullhypothese typischerweise einen Zustand “ohne Effekt”?

A

Die Nullhypothese repräsentiert typischerweise einen Zustand “ohne Effekt”

> um zu testen, ob ein Unterschied oder Zusammenhang besteht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was bedeutet es, dass die Nullhypothese im Fall des Marmeladentoast-Experiments besagt, dass die Landungen auf beiden Seiten gleich wahrscheinlich sind?

A

Die Nullhypothese im Marmeladentoast-Experiment besagt, dass die Landungen auf beiden Seiten gleich wahrscheinlich sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Wie wird eine inhaltliche Hypothese in eine statistische Hypothese übersetzt?

A

indem sie in eine Vorhersage über den Wert eines oder mehrerer Parameter der Zufallsverteilung umgewandelt wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was bedeutet die statistische Nullhypothese H0: λ = 0.50 im Zusammenhang mit dem Marmeladentoast-Experiment?

A

H0: λ = 0.50 besagt, dass die Wahrscheinlichkeit, dass der Toast auf der Marmeladenseite landet, 50 % beträgt

> was bedeutet, dass es keinen Unterschied in den Landungen auf den beiden Seiten gibt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Abbildung 1: Wahrscheinlichkeit der Ergebnisse des Toastwurfsexperiments

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Wie wird die Zufallsvariable Xi definiert und welche Verteilung liegt ihr zugrunde?

A

Die Zufallsvariable Xi wird definiert als der IQ-Wert einer Person i in einem IQ-Test

> sie liegt einer Normalverteilung zugrunde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was bedeutet die Notation Xi Normal (μ, σ)?

A

dass Xi normalverteilt ist mit einem Mittelwert μ und einer Standardabweichung σ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Wie wird die Wahrscheinlichkeit für bestimmte Ergebnisse in einem IQ-Test unter der Nullhypothese quantifiziert?

A

indem man angibt, wie wahrscheinlich es ist, dass der IQ-Wert in einem bestimmten Bereich liegt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Warum können wir unter der Nullhypothese die Wahrscheinlichkeit für bestimmte IQ-Werte quantifizieren, aber nicht für einen spezifischen IQ-Wert?

A
  • weil die Normalverteilung eine stetige Verteilung ist

> aber nicht für einen spezifischen IQ-Wert, da er unendlich viele mögliche Werte haben kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Abbildung 2: Wahrscheinlichkeitsdichte von IQ-Werten unter der H0:μ mit σ = 15

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Wer ist der Statistiker, der die Logik des Signifikanztests entwickelt hat, und wann?

A

Ronald Fisher

> er veröffentlichte seine Arbeit darüber im Jahr 1935

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Was ist die Grundidee eines Signifikanztests?

A
  • die Passung der Daten zur Nullhypothese zu prüfen

> um zu sehen, wie wahrscheinlich es ist, dass die beobachteten Daten unter der Nullhypothese auftreten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Wie wird die Nullhypothese typischerweise spezifiziert und was repräsentiert sie?

A
  • wird spezifiziert als das logische Komplement der inhaltlichen Hypothese

> repräsentiert die Abwesenheit eines Effekts oder Zusammenhangs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Welche Frage stellen wir uns, wenn wir die Passung unserer Daten zur Nullhypothese prüfen?

A

wie wahrscheinlich es ist, unter der Nullhypothese solche Daten zu beobachten, wie wir sie tatsächlich beobachtet haben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Was ist eine Teststatistik und warum ist sie wichtig bei der Durchführung eines Signifikanztests?

A

Eine Teststatistik ist ein statistischer Kennwert unserer Stichprobe

> erlaubt uns, eine Aussage über den Populationsparameter zu treffen, den wir in der Nullhypothese spezifiziert haben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Was ist das entscheidende Kriterium bei der Auswahl einer geeigneten Teststatistik?

A
  • dass wir die Zufallsverteilung dieser Statistik unter der Annahme kennen müssen, dass die Nullhypothese wahr ist

> Teststatistiken sind z.B. Chi Quadrat Test, t-test, z-test usw. (Man muss die Verteilung unter der Nullhypothese kennen, um die richtige Teststärke zu wählen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Welche Teststatistik wird im Beispiel des IQ-Tests verwendet und wie ist ihre Verteilung unter der Nullhypothese?

A

Im Beispiel des IQ-Tests wird der Stichprobenmittelwert als Teststatistik verwendet

  • seine Verteilung unter der Nullhypothese ist normalverteilt mit einem Mittelwert von μ und einem Standardfehler von σ / √N
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Was ist die Stichprobenverteilung und was repräsentiert sie im Kontext des Signifikanztests?

A

Die Stichprobenverteilung repräsentiert die Verteilung der Teststatistik unter der Nullhypothese

> das heißt, die Verteilung der Mittelwerte von unendlich vielen Stichproben aus der Population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Was ist der Standardfehler des Mittelwerts und welche Bedeutung hat er in der Stichprobenverteilung?

A

Der Standardfehler des Mittelwerts ist die Standardabweichung der Stichprobenverteilung

> er repräsentiert die Genauigkeit der Schätzung des Mittelwerts der Population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Wie wird die Stichprobenverteilung unter der Nullhypothese definiert?

A

wird definiert als die Verteilung der Mittelwerte von unendlich vielen Stichproben aus der Population

> wenn die Nullhypothese wahr ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Abbildung 3: Stichprobenverteilung des Mittelwerts

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

Was ist der p-Wert und welche Funktion hat er im Signifikanztest?

A

Der p-Wert ist die Wahrscheinlichkeit, unter der Nullhypothese ein Ergebnis so extrem oder extremer zu beobachten wie das tatsächlich Beobachtete

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Wie wird der p-Wert definiert und wie wird er berechnet?

A

Der p-Wert ist der Anteil der Fläche unter der Kurve der Stichprobenverteilung, der über dem beobachteten Wert liegt

  • Er wird oft durch Software berechnet
  • kann auch aus einer zugehörigen Tabelle abgelesen werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Welche Bedeutung hat der p-Wert bei einer Signifikanzprüfung?

A

Der p-Wert ermöglicht es uns, die Evidenz der Daten gegen die Nullhypothese zu bewerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Wie wird die Interpretation des p-Werts als bedingte Wahrscheinlichkeit erklärt?

A

Der p-Wert wird als bedingte Wahrscheinlichkeit beschrieben, die angibt, wie wahrscheinlich das beobachtete Ereignis unter der Annahme ist, dass die Nullhypothese wahr ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Was beschreibt die bedingte Wahrscheinlichkeit im Kontext des Signifikanztests?

A

Die bedingte Wahrscheinlichkeit beschreibt die Wahrscheinlichkeit eines Ereignisses unter der Bedingung, dass ein anderes Ereignis eingetreten ist, wobei das Ereignis das Auftreten des beobachteten oder eines extremeren Werts der Teststatistik ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Wie erklärt Fisher die Bedeutung des p-Werts in Bezug auf die Evidenz gegen die Nullhypothese?

A
  • Fisher betrachtet den p-Wert als Maß für die Evidenz der Daten gegen die Nullhypothese

> Ein kleiner p-Wert deutet auf starke Evidenz gegen die Nullhypothese hin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

Welchen Begriff verwendet Fisher, um die Evidenz gegen die Nullhypothese zu beschreiben?

A

Fisher bezeichnet die Evidenz gegen die Nullhypothese als “Signifikanzlevel”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

Was bedeutet die “Fishers Disjunktion” im Zusammenhang mit einem kleinen p-Wert?

A

besagt, dass entweder ein sehr unwahrscheinliches Ereignis eingetreten ist oder die Nullhypothese nicht zutrifft.

> Ein kleiner p-Wert unterstützt diese Disjunktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Was ist der z-Wert?

A
  • ein an Mittelwert
    und Standardabweichung
    normierter Messwert

> In z-Werte transformierte
Messwerte haben grundsätzlich
einen Mittelwert von 0 und eine Standardabweichung von 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

z-Wert berechnen:

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Was ist das Ziel in der Inferenzstatistik im Zusammenhang mit statistischen Tests?

A

Das Ziel ist es, statistische Entscheidungen über Hypothesen zu treffen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

Was sind klassische statistische Tests und welche Information geben sie normalerweise?

A

Klassische statistische Tests geben normalerweise Informationen darüber, wann die Nullhypothese verworfen werden kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

Was ist der Nullhypothesen-Signifikanztest (NHST) und wie ist er mit Fishers Signifikanztest verbunden?

A

Der NHST ist eine Entscheidungsprozedur, die auf Fishers Signifikanztest basiert

> zielt darauf ab zu entscheiden, ob die Nullhypothese verworfen werden kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

Wie wird die Poppersche Falsifikationslogik im NHST angewendet?

A

wird angewendet, um zu entscheiden, ob die Nullhypothese falsifiziert werden kann

> basierend auf dem p-Wert als Maß der Evidenz gegen die Nullhypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

Welche Entscheidungen können beim NHST getroffen werden und wie werden sie interpretiert?

A
  • Es kann entweder die Nullhypothese abgelehnt werden, was die inhaltliche Hypothese unterstützt

oder

  • sie bleibt erhalten, was keinen Schluss über die Hypothese zulässt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Wie ist die Entscheidungsregel beim NHST definiert und auf welchem Schema basiert sie?

A
  • basiert auf der Fehlerwahrscheinlichkeit 1. Art
  • unterscheidet zwischen vier möglichen Szenarien
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Welche vier möglichen Szenarien ergeben sich aus der Kombination des wahren Zustands der Welt und unserer Entscheidung beim NHST?

A
  • ergeben sich aus der Kombination des wahren Zustands der Welt (wahr oder falsch)

und

  • unserer Entscheidung (Ablehnung der Nullhypothese oder Beibehaltung)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Tabelle 1: Entscheidungsmatrix bei Nullhypothesen-Signifikanztests (NHST)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

Was beschreibt der Fehler 1. Art im Kontext von Hypothesentests?

A

Der Fehler 1. Art beschreibt die Situation, in der die Nullhypothese zutrifft, aber fälschlicherweise abgelehnt wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

Wie wird die Irrtumswahrscheinlichkeit α definiert und wie wird sie im Hypothesentest verwendet?

A
  • wird als die Wahrscheinlichkeit definiert, einen Fehler 1. Art zu begehen
  • wird verwendet, um den Rejektionsbereich und den kritischen Wert zu bestimmen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

Warum wird α häufig per Konvention auf 5 % festgelegt, und welche Kritik gibt es an dieser Festlegung?

A

α wird häufig auf 5 % festgelegt, jedoch gibt es Kritik, da der Wert gut begründet sein und sich an den Kosten einer falschen Entscheidung orientieren sollte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

Was ist das Signifikanzniveau α und wie unterscheidet es sich von der Signifikanz im Zusammenhang mit dem p-Wert?

A
  • Das Signifikanzniveau α beschreibt die vorab festgelegte Wahrscheinlichkeit, einen Fehler 1. Art zu begehen

> während die Signifikanz im Zusammenhang mit dem p-Wert die Stärke der Evidenz gegen die Nullhypothese beschreibt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

Wie wird der p-Wert im Nullhypothesen-Signifikanztest (NHST) interpretiert?

A

Im NHST wird der p-Wert nicht interpretiert, sondern verglichen, ob er kleiner als das Signifikanzniveau α ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

Was bedeutet es, wenn das Ergebnis eines Tests als signifikant betrachtet wird?

A

Ein Ergebnis wird als signifikant betrachtet, wenn der p-Wert kleiner als das Signifikanzniveau α ist, und die Nullhypothese wird abgelehnt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

Warum können wir bei dieser Testlogik die Nullhypothese zwar ablehnen, aber nicht annehmen oder bestätigen?

A

Bei dieser Testlogik können wir die Nullhypothese ablehnen, aber nicht annehmen oder bestätigen, da wir nur die Evidenz gegen die Nullhypothese bewerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
75
Q

Was ist ein einseitiger Hypothesentest und wie wird er angewendet?

A

Ein einseitiger Hypothesentest ist eine Art von Test, bei dem die Nullhypothese nur bei ausreichend starker Abweichung in eine bestimmte Richtung abgelehnt wird

76
Q

Welche Art von Hypothese wird in einem einseitigen Hypothesentest verwendet, und warum wird sie als gerichtete Hypothese bezeichnet?

A

In einem einseitigen Hypothesentest wird eine gerichtete Hypothese verwendet, die eine klare Richtung definiert, in der eine Abweichung von der Nullhypothese erwartet wird

77
Q

Abbildung 5: Rejektionsbereich und kritischer Wert bei einem einseitigen Test

A
78
Q

Beispiel: Rejektionsbereich für Toastwurfexperiment bestimmen

A

N = 10 Toasts

  • wir erwarten, dass der Toast häufiger auf der Marmeladenseite landet als auf der Brotseite
  • Dazu testen wir die Nullhypothese, dass die Wahrscheinlichkeit für beide Seiten jeweils 50% beträgt auf einem α = 5% Signifikanzniveau

> Es bieten sich zwei relevante Teststatistiken an:

  • Entweder die Anzahl k der Marmeladenlandungen
  • Oder aber der erwartungstreue Schätzer für die Wahrscheinlichkeit einer Marmeladenlandung: λ = k : N
79
Q

Warum können wir das geforderte Signifikanzniveau nicht exakt einhalten, wenn die Binomialverteilung diskret ist?

A

Die Binomialverteilung ist diskret, daher können wir den kritischen Wert nicht genau bestimmen, um das Signifikanzniveau exakt einzuhalten

80
Q

Wie wählen wir den kritischen Wert, wenn das geforderte Signifikanzniveau nicht exakt eingehalten werden kann?

A

Wir wählen den konservativeren Wert als kritischen Wert, der das geforderte Signifikanzniveau nicht überschreitet

81
Q

Wie wird der Rejektionsbereich definiert, wenn wir die Nullhypothese bei einem gerichteten Test ablehnen möchten?

A

Beim gerichteten Test wird der Rejektionsbereich so definiert, dass wir die Nullhypothese ablehnen, wenn das beobachtete Ergebnis extrem genug in die erwartete Richtung abweicht

82
Q

Was bedeutet es, wenn eine inhaltliche Hypothese keine Richtung vorgibt?

A

Wenn eine inhaltliche Hypothese keine Richtung vorgibt, wird sie als ungerichtet bezeichnet

83
Q

Warum benötigen wir bei einem zweiseitigen Hypothesentest zwei kritische Werte und Rejektionsbereiche?

A

Bei einem zweiseitigen Hypothesentest definieren wir die Rejektionsbereiche so, dass die Irrtumswahrscheinlichkeit gleichmäßig aufgeteilt ist

> um sicherzustellen, dass die Wahrscheinlichkeit für einen Fehler 1. Art nicht erhöht wird

84
Q

Abbildung 6: Kritische Werte und Rejektionsbereiche bei einem zweiseitigen Test

A
85
Q

Wie wird ein Ergebnis als signifikant bezeichnet, wenn der p-Wert für den beobachteten Wert der Teststatistik mit dem Signifikanzniveau α verglichen wird?

A

Ein Ergebnis wird als signifikant bezeichnet, wenn der p-Wert kleiner als das Signifikanzniveau α ist

86
Q

Was muss beachtet werden, wenn der p-Wert mit dem Signifikanzniveau α verglichen wird?

A

Beim Vergleich des p-Werts mit dem Signifikanzniveau α muss berücksichtigt werden, dass der p-Wert normalerweise nur den Bereich an einem Ende der Verteilung beschreibt

> daher muss er entweder verdoppelt oder das Signifikanzniveau halbiert werden

87
Q

Warum wird in vielen Statistikprogrammen standardmäßig ein zweiseitiger Test durchgeführt?

A

um beide Richtungen der Abweichung von der Nullhypothese zu berücksichtigen

88
Q

Wie wird der p-Wert behandelt, wenn ein zweiseitiger Test durchgeführt wird?

A

Wenn ein zweiseitiger Test durchgeführt wird, wird der verdoppelte p-Wert ausgegeben, der direkt mit dem Signifikanzniveau α verglichen werden kann

89
Q

Welche Bedeutung hat der Vermerk “2-tailed” in Statistikprogrammen?

A

zeigt an, dass ein zweiseitiger Test durchgeführt wird, der beide Richtungen der Abweichung von der Nullhypothese berücksichtigt.

90
Q

Was sind die Hauptkritikpunkte an Signifikanztests und dem Nullhypothesentest (NHST)?

A

Die Hauptkritikpunkte betreffen sowohl die praktische Anwendung als auch die theoretische Fundierung von Signifikanztests und dem NHST

91
Q

Welche Unterschiede bestehen zwischen Fishers Signifikanztest und dem NHST in Bezug auf ihre Vorgehensweise und Ziele?

A
  • Fishers Signifikanztest beinhaltet die Berechnung des p-Werts als Maß für die Evidenz gegen die Nullhypothese
  • Der NHST legt explizite Regeln für das Ablehnen oder Beibehalten der Nullhypothese basierend auf dem Signifikanzniveau α fest
92
Q

Warum wird der NHST oft als Hybrid bezeichnet?

A

da er Elemente von Signifikanztests und einer anderen statistischen Prozedur enthält, die sich mit statistischen Entscheidungen und der Kontrolle von Fehlerwahrscheinlichkeiten befasst

93
Q

Was ist der probabilistische Modus Tollens und wie wird er im Zusammenhang mit dem Signifikanztest diskutiert?

A

Der probabilistische Modus Tollens im Signifikanztest argumentiert, dass das Eintreten eines unwahrscheinlichen Ereignisses nicht zwangsläufig bedeutet, dass die Nullhypothese falsch ist, da das Ereignis unter einer anderen Hypothese möglicherweise noch unwahrscheinlicher ist

94
Q

Warum wird argumentiert, dass der Schluss des Fishers Disjunktion, der im Signifikanztest verwendet wird, nicht logisch korrekt ist?

A

Der Fishers Disjunktion-Schluss im Signifikanztest wird als nicht logisch korrekt betrachtet, da er aus probabilistischen Prämissen eine deterministische Schlussfolgerung zieht, ohne andere mögliche Hypothesen zu berücksichtigen

95
Q

Warum wird argumentiert, dass im Nullhypothesentest (NHST) und im Signifikanztest nur ein signifikantes Ergebnis als gültiges Ergebnis betrachtet wird?

A

Im NHST und im Signifikanztest wird nur ein signifikantes Ergebnis als gültig betrachtet, da nur in diesem Fall die Nullhypothese abgelehnt wird

96
Q

Welches Problem entsteht, wenn die Nullhypothese im NHST oder im Signifikanztest nicht zutrifft?

A

Wenn die Nullhypothese nicht zutrifft, wird das Ergebnis weiterhin unter der Annahme betrachtet, dass sie zutrifft, was zu einer unbalancierten Entscheidungssituation führt

97
Q

Warum ist die Entscheidungssituation im NHST und im Signifikanztest als unbalanciert beschrieben?

A

Diese unbalancierte Entscheidungssituation bedeutet, dass das Nichtsignifikante nicht interpretiert werden kann, da es keine Möglichkeit gibt, die Nullhypothese zu bestätigen

98
Q

Welche Auswirkungen hatte dieser Mangel an Möglichkeit, die Nullhypothese zu bestätigen oder abzulehnen, auf die Veröffentlichungspraxis in der wissenschaftlichen Forschung?

A

Dies führte dazu, dass es lange Zeit schwierig war, Experimente zu veröffentlichen, deren statistische Analyse zu einem nichtsignifikanten Ergebnis führte

99
Q

Warum wird die Berücksichtigung einer Alternativhypothese als notwendiger Bestandteil eines sinnvollen statistischen Hypothesentests betrachtet?

A

Die Berücksichtigung einer Alternativhypothese ist notwendig, um einen sinnvollen statistischen Hypothesentest durchzuführen

> da sie eine alternative Annahme über den hypothetischen Zustand der Welt darstellt, wenn die Nullhypothese nicht zutrifft

100
Q

Wie definieren Neyman und Pearson den Hypothesentest in ihrer statistischen Prozedur?

A

Neyman und Pearson definieren den Hypothesentest als eine Entscheidungsregel zwischen zwei möglichen Handlungsoptionen

101
Q

Was ist das Ziel der Neyman-Pearson-Prozedur?

A

Das Ziel der Neyman-Pearson-Prozedur ist es, den Anteil an falschen Entscheidungen langfristig zu kontrollieren

102
Q

Warum können wir bei einer einzelnen Entscheidung im Hypothesentest nie sicher sein, ob sie korrekt ist?

A

Bei einer einzelnen Entscheidung im Hypothesentest können wir nie sicher sein, ob sie korrekt ist, da wir den wahren Zustand der Welt nicht kennen

103
Q

Wie wird das Prinzip der Neyman-Pearson-Prozedur anhand des Würfelbeispiels verdeutlicht?

A

Das Prinzip der Neyman-Pearson-Prozedur wird anhand des Würfelbeispiels verdeutlicht, indem gezeigt wird, wie eine Entscheidung basierend auf Wahrscheinlichkeiten über viele Wiederholungen hinweg kontrolliert werden kann

104
Q

Nach welchem Prinzip funktionieren Neyman-Pearson-Tests, und warum?

A

Neyman-Pearson-Tests funktionieren nach dem frequentistischen Prinzip, bei dem der Anteil der falschen Entscheidungen über viele Wiederholungen genau kontrolliert wird

105
Q

Tabelle 2: Entscheidungsmatrix bei Neyman-Pearson-Tests

A
106
Q

Was ist das entscheidende Merkmal der Neyman-Pearson-Theorie?

A

Das entscheidende Merkmal der Neyman-Pearson-Theorie ist die konkret auf einen Punkt spezifizierte Alternativhypothese

107
Q

Was sind die beiden Hypothesen, die bei einem Hypothesentest betrachtet werden?

A

Die beiden Hypothesen, die bei einem Hypothesentest betrachtet werden, sind die Nullhypothese (H0) und die Alternativhypothese (H1)

108
Q

Wie unterscheidet sich die Behandlung der Alternativhypothese in der Neyman-Pearson-Theorie von der im NHST?

A

Im Gegensatz zum NHST, bei dem die Alternativhypothese nur als Komplement zur Nullhypothese verstanden wird, wird in der Neyman-Pearson-Theorie eine präzise Hypothese als Alternative zur Nullhypothese spezifiziert

109
Q

Warum ist es wichtig, eine präzise Hypothese als Alternative zur Nullhypothese zu spezifizieren?

A

Es ist wichtig, eine präzise Hypothese als Alternative zur Nullhypothese zu spezifizieren, um eine balancierte Entscheidungssituation zu schaffen und jede der beiden Hypothesen annehmen zu können

110
Q

Was sind Fehler 1. und Fehler 2. Art, und wie werden sie in der Neyman-Pearson-Theorie quantifiziert?

A
  • Fehler 1. Art bezieht sich auf die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie tatsächlich wahr ist
  • während Fehler 2. Art die Wahrscheinlichkeit bezeichnet, die Nullhypothese anzunehmen, wenn eigentlich die Alternativhypothese wahr ist.

> Diese werden in der Neyman-Pearson-Theorie quantifiziert, um alle Irrtumswahrscheinlichkeiten der Testprozedur zu erfassen

111
Q

Was ist Fehler 2. Art/Teststärke und wie wird sie definiert?

A

Fehler 2. Art/Teststärke ist die bedingte Wahrscheinlichkeit, die Nullhypothese anzunehmen, wenn tatsächlich die Alternativhypothese wahr ist

112
Q

Wie wird die Wahrscheinlichkeit eines Fehlers 2. Art, β, quantifiziert?

A

Die Wahrscheinlichkeit eines Fehlers 2. Art, β, entspricht dem Anteil der Fläche unter der Alternativhypothese-Stichprobenverteilung, der links vom kritischen Wert liegt

113
Q

Was bezeichnet die Teststärke und wie wird sie berechnet, wenn die Alternativhypothese wahr ist?

A

Die Teststärke ist die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie tatsächlich falsch ist. Wenn die Alternativhypothese wahr ist, beträgt die Teststärke 1−β

114
Q

Welchen Zusammenhang gibt es zwischen α und β?

A

Wenn die Irrtumswahrscheinlichkeit eines Fehlers 1. Art (α) verringert wird, steigt automatisch die Wahrscheinlichkeit eines Fehlers 2. Art (β) bzw. sinkt die Teststärke. Umgekehrt steigt die Teststärke, wenn α ansteigt

115
Q

Welche Eigenschaften/Parameter beeinflussen die Teststärke eines statistischen Tests?

A
  • Irrtumswahrscheinlichkeit 1. Art (α)
  • Effektstärke (unter der Nullhypothese und der Alternativhypothese)
  • Stichprobengröße
116
Q

Was beschreibt der Begriff “Effektstärke”?

A

Die Effektstärke beschreibt den standardisierten Unterschied zwischen der Null- und der Alternativhypothese

117
Q

Wie wird die Effektstärke standardisiert definiert?

A

Die Effektstärke ist standardisiert, was bedeutet, dass sie unabhängig von der Skala bzw. Einheit ist, in der die in den Hypothesen spezifizierten Parameter angegeben sind

118
Q

Warum ist es wichtig, dass die Effektstärke unabhängig von der Skala bzw. Einheit ist?

A

Es ist wichtig, dass die Effektstärke unabhängig von der Skala bzw. Einheit ist, damit sie vergleichbar bleibt, unabhängig von den spezifischen Messungen oder Variablen

119
Q

Welche Maße gibt es für die Effektstärke?

A

Es gibt viele Maße für die Effektstärke, je nach Art der Analyse und des Untersuchungsdesigns

120
Q

Wie wird die angenommene Effektstärke definiert und was bedeutet eine größere Effektstärke in Bezug auf die Stichprobenverteilung?

A

Die angenommene Effektstärke wird als der (standardisierte) Unterschied zwischen H1 und H0 verstanden

  • Eine größere Effektstärke bedeutet, dass die Stichprobenverteilung unter der H1 stärker von der Verteilung unter der H0 abweicht
121
Q

Wie hängt die Stichprobenverteilung der relevanten Teststatistik mit der Größe der Stichprobe zusammen?

A

Die Stichprobenverteilung der relevanten Teststatistik wird direkt von der Größe der Stichprobe beeinflusst

122
Q

Was sind die Konzepte Erwartungstreue und Konsistenz?

A

Erwartungstreue betrifft den Erwartungswert (bzw. Mittelwert) der Stichprobenverteilung, während sich die Konsistenz auf deren Varianz/Streuung bezieht

123
Q

Was betrifft die Erwartungstreue, und worauf bezieht sich die Konsistenz?

A

Erwartungstreue bezieht sich auf den Erwartungswert der Stichprobenverteilung, während sich die Konsistenz auf deren Varianz/Streuung bezieht

124
Q

Wie beeinflusst die Stichprobengröße den Standardfehler?

A

Der Standardfehler wird in der Regel kleiner, je größer die Stichprobe ist

125
Q

Was bedeutet ein kleinerer Standardfehler in Bezug auf die Verteilung der Stichprobenschätzer?

A

Ein kleinerer Standardfehler bedeutet, dass sich die Werte der Stichprobenschätzer enger um die Erwartungswerte verteilen

126
Q

Wie lässt sich die Auswirkung der Stichprobengröße auf die Teststärke mit einem Beispiel illustrieren?

A

Mit wachsender Stichprobengröße nimmt die Teststärke zu, da der kritische Wert näher an den Erwartungswert unter der H0 rückt und der Anteil der Verteilung unter der H1, der über dem kritischen Wert liegt, steigt

127
Q

Was ist das Ziel der Neyman-Pearson-Prozedur?

A

Das Ziel der Neyman-Pearson-Prozedur ist die Kontrolle von langfristigen Fehlerraten bzw. der Wahrscheinlichkeit von Entscheidungsfehlern

128
Q

Warum ist es wichtig, die Fehlerwahrscheinlichkeiten eines Tests zu minimieren?

A

Es ist wichtig, die Fehlerwahrscheinlichkeiten eines Tests zu minimieren, um die Zuverlässigkeit der Ergebnisse zu gewährleisten

129
Q

Welche fünf entscheidenden Komponenten hat die Testprozedur?

A
  • die statistischen Hypothesen (H0 und H1),
  • die angestrebten Fehlerwahrscheinlichkeiten α und β (bzw. die Teststärke 1 − β)
  • die Stichprobengröße
130
Q

Wie hängen die Komponenten der Testprozedur miteinander zusammen?

A

Jede dieser Komponenten ist eine Funktion der anderen vier, sodass vier Freiheitsgrade bei der Gestaltung eines Tests bestehen, während eine Komponente immer durch die anderen vier definiert ist

131
Q

Was ist eine Poweranalyse?

A

Eine Poweranalyse ist die Konstruktion eines Experiments oder statistischen Hypothesentests

> mit dem Ziel, bestimmte Hypothesen mit bestimmten Fehlerwahrscheinlichkeiten zu testen

132
Q

Warum sollte einer statistischen Test immer eine Poweranalyse vorangehen?

A

sollte immer vor einem statistischen Test durchgeführt werden, um sicherzustellen, dass der Test sinnvoll ist und die gewünschten Hypothesen mit angemessener Genauigkeit getestet werden können

133
Q

Wie könnte die Teststärke verbessert werden, indem α angepasst wird?

A

Die Teststärke könnte verbessert werden, indem α erhöht wird, aber dies könnte die Irrtumswahrscheinlichkeit unter der H0 erhöhen

134
Q

Warum ist eine Balance zwischen α und β wichtig?

A

Eine Balance zwischen α und β ist wichtig, um eine angemessene Fehlerkontrolle zu gewährleisten

135
Q

Warum ist es problematisch, die statistischen Hypothesen anzupassen, um die Teststärke zu erhöhen?

A

Das Anpassen der statistischen Hypothesen, um die Teststärke zu erhöhen, könnte dazu führen, dass der Test nicht mehr die inhaltliche Hypothese angemessen testet

136
Q

Was ist eine Punkthypothese?

A

Eine Punkthypothese ist eine exakte Hypothese, die einem Parameter genau einen Wert zuweist

137
Q

Wie kann der minimale relevante Effekt verwendet werden, um eine Punkthypothese zu definieren

A

Der minimale relevante Effekt wird verwendet, um die H1 so zu spezifizieren, dass der Unterschied zur H0 gerade noch relevant ist

138
Q

Warum ist es wichtig, die statistischen Hypothesen von inhaltlichen Überlegungen leiten zu lassen?

A

um sicherzustellen, dass der Test relevante Effekte angemessen untersucht

139
Q

Welche Komponente können wir sinnvoll anpassen, um die Teststärke zu erhöhen, wenn Hypothesen und α feststehen?

A

Die Stichprobengröße kann angepasst werden, um die Teststärke zu erhöhen, wenn Hypothesen und α feststehen

140
Q

Wozu wird der Begriff “Poweranalyse” synonym verwendet?

A

Der Begriff “Poweranalyse” wird synonym für die Festlegung der Stichprobe a priori verwendet

141
Q

Wie wird die Stichprobengröße in einer Poweranalyse für klassische, frequentistische Hypothesentests bestimmt?

A

Die Stichprobengröße für klassische, frequentistische Hypothesentests wird durch eine Poweranalyse bestimmt

142
Q

Was sind Möglichkeiten, die Stichprobengröße für eine Poweranalyse zu bestimmen, wenn eine analytische Lösung nicht möglich ist?

A

Wenn eine analytische Lösung nicht möglich ist, kann die Stichprobengröße für eine Poweranalyse mithilfe von Computersimulationen bestimmt werden

> es stehen Softwarepakete wie G*Power zur Verfügung

143
Q

Wie wird der NHST häufig in Bezug auf Neyman-Pearson-Tests beschrieben?

A

Der NHST wird häufig als Hybrid mit Elementen von Fishers Signifikanztest und Neyman-Pearson-Tests beschrieben

144
Q

Was ist das Ziel sowohl von Neyman-Pearson-Tests als auch des NHST?

A

Das Ziel sowohl von Neyman-Pearson-Tests als auch des NHST ist es, eine statistische Entscheidung zu treffen und langfristig Fehlerraten zu kontrollieren

145
Q

Welche Hypothese wird im NHST genau spezifiziert, und welche nicht?

A

Im NHST wird die Nullhypothese genau spezifiziert, während die Alternativhypothese nicht genau definiert ist

146
Q

Warum wird die Teststärke im NHST in der Regel nicht kontrolliert?

A

Die Teststärke wird im NHST in der Regel nicht kontrolliert, da die Alternativhypothese nicht genau spezifiziert ist

147
Q

Was war lange Zeit in der Anwendung gängige Praxis im Hinblick auf die Teststärke?

A

Lange Zeit wurde die Teststärke weitestgehend ignoriert, und nur “signifikante” Ergebnisse fanden Beachtung

148
Q

Warum ist das Bewusstsein für die Bedeutung der Teststärke und die Wichtigkeit einer Poweranalyse in den letzten Jahren gestiegen?

A

Das Bewusstsein für die Bedeutung der Teststärke und die Wichtigkeit einer Poweranalyse ist in den letzten Jahren gestiegen, um eine angemessene Fehlerkontrolle sicherzustellen

149
Q

Warum benötigt ein sinnvoller statistischer Test neben der Nullhypothese auch eine Alternativhypothese?

A

Ein sinnvoller statistischer Test benötigt neben der Nullhypothese auch eine Alternativhypothese, um alle relevanten Aspekte des Phänomens zu berücksichtigen

150
Q

Welche beiden Aspekte müssen neben der Irrtumswahrscheinlichkeit 1. Art ebenfalls beachtet werden?

A

Neben der Irrtumswahrscheinlichkeit 1. Art muss auch die Teststärke beachtet werden, um die Leistungsfähigkeit des Tests zu beurteilen

151
Q

Was sind Hypothesentests, und warum sind sie ein zentraler Bestandteil wissenschaftlicher Arbeit?

A

Hypothesentests sind Verfahren, um empirisch Hypothesen zu überprüfen, und sind ein wesentlicher Bestandteil wissenschaftlicher Arbeit

152
Q

Welche Art von Vorhersagen nutzen wir, um Theorien empirisch zu überprüfen?

A

Um Theorien kritisch zu testen, leiten wir Vorhersagen (Hypothesen) ab

153
Q

Auf welcher Definition von Wahrscheinlichkeit basiert die klassische Inferenzstatistik?

A

Die klassische Inferenzstatistik basiert auf der frequentistischen Definition von Wahrscheinlichkeit, bei der Wahrscheinlichkeit eine relative Häufigkeit beschreibt

154
Q

Was ist das Ziel der frequentistischen Hypothesentests, insbesondere der Neyman-Pearson-Testprozedur?

A

Das Ziel der frequentistischen Hypothesentests, insbesondere der Neyman-Pearson-Testprozedur, ist es, statistische Entscheidungen über Hypothesen zu treffen und dabei die Wahrscheinlichkeit, eine Hypothese fälschlicherweise abzulehnen, zu kontrollieren

155
Q

Welche zwei statistischen Hypothesen müssen spezifiziert werden, um eine statistische Entscheidung zu treffen?

A

Es müssen die Null- und die Alternativhypothese spezifiziert werden, um eine statistische Entscheidung zu treffen

156
Q

Wie wird die Fehlerwahrscheinlichkeit 1. Art kontrolliert?

A

Die Fehlerwahrscheinlichkeit 1. Art wird durch die Wahl eines geeigneten kritischen Werts der Teststatistik kontrolliert

157
Q

Wie wird die Fehlerwahrscheinlichkeit 2. Art bzw. die Teststärke kontrolliert?

A

Die Fehlerwahrscheinlichkeit 2. Art bzw. die Teststärke wird durch die Wahl einer ausreichend großen Stichprobe kontrolliert

158
Q

Was ist vor der Durchführung eines klassischen Hypothesentests erforderlich?

A
  • es müssen beide Hypothesen spezifiziert werden
  • es müssen die gewünschten Fehlerraten/Teststärke festgelegt werden
  • es muss die benötigte Stichprobengröße mithilfe einer Poweranalyse ermittelt werden
159
Q

Was ist das Ziel der Poweranalyse a priori?

A

Bestimmung der Stichproben Größe, damit ein bestimmter Effekt mit gewisser Wahrscheinlichkeit detektiert werden kann

160
Q

Von was hängt der Kritische Wert ab?

A

Von der Nullhypothese
Von Alpha (a-Fehler)

161
Q

Was ist 1–ß?

A

Teststärke/Power

-> Wahrscheinlichkeit, die Nullhypothese korrekt abzulehnen

162
Q

Warum ist der P-Wert kein geeignetes Maß für statistische Evidenz für die Nullhypothese?

A
  • Daten beziehen sich nur auf die Nullhypothese
  • Evidenz = Daten unter einer alternativen Hypothese müssten miteinbezogen werden
163
Q

Entscheidungstabelle Hypothesentests

A
164
Q

Was ist ein Fehler 2. Art?

A

Wenn die Nullhypothese fälschlicherweise beibehalten wird, obwohl sie tatsächlich falsch ist

Alternativ: Wenn die Alternativhypothese wahr ist

165
Q

Wie verändert sich die Wahrscheinlichkeit eines Fehlers 2. Art, wenn sich die Fehlerwahrscheinlichkeit 1. Art (alpha) vergrößert?

A

Je größer alpha festgelegt wird, desto kleiner der kritische Wert der Teststatistik (1–ß)

> wodurch die Wahrscheinlichkeit eines Fehlers 2. Art ebenfalls sinkt

166
Q

Wie verändert sich die Wahrscheinlichkeit eines Fehlers 2. Art, wenn sich die EFFEKTSTÄRKE verringert?

A

Effektstärke = Unterschied zwischen H0 und H1

167
Q

Wie verändert sich die Wahrscheinlichkeit eines Fehlers 2. Art, wenn statt zweiseitig nun EINSEITIG getestet wird

A

Wenn einseitig getestet word, wird der kritische Wert kleiner (da er nun alpha statt alpha/2% der Verteilung abtrennt)

> Dadurch sinkt die Wahrscheinlichkeit eines Fehlers 2. Art

168
Q

Was heißt X~Normal (100,15)

A

Beschreibt eine Zufallsvariable X, die einer Normalverteilung folgt

mü = 100
Sigma / Standardabweichung = 15

169
Q

Was sagt die Standardabweichung von 15?

A

Es bedeutet, dass die Streuung der Werte um den Mittelwert herum 15 beträgt

170
Q

Was sind die 4 Komponenten, die den Rejektionsbereich beeinflussen

A
  1. Signifikanzniveau
  2. Verteilung der Teststatistik
  3. Freiheitsgrade
  4. Ein- oder zweiseitiger Test
171
Q

Was sind Freiheitsgrade?

A

Freiheitsgrade sind die Anzahl unabhängiger Werte, die in die Berechnung der Teststatistik eingehen

172
Q

Wie lautet die Streuung der Stichprobenvarianz?

A
173
Q

alpha wird auch …

A

… Signifikanzniveau genannt

174
Q

Szenarien, wie sich die Teststärke verändert:

A
  1. Erhöhung der Stichprobengröße: Erhöht die Teststärke
  2. Erhöhung des Signifikanzniveaus (𝛼): Erhöht die Teststärke, aber auch die Fehlerwahrscheinlichkeit 1. Art
  3. Größerer Effekt: Erhöht die Teststärke, da größere Effekte leichter zu entdecken sind
175
Q

Tests für verschiedene Skalenniveaus:

A

Nominal:
Chi-Quadrat-Test
Fisher’s Exact Test

Ordinal:
Mann-Whitney-U-Test
Wilcoxon-Rangsummentest

Intervallskaliert:
t-Test
ANOVA
Pearson-Korrelation

176
Q

Wer hat den Signifikanztest erfunden?

A

Der Signifikanztest wurde von Ronald A. Fisher erfunden

177
Q

Was sind die wesentlichen Kritikpunkte am NHST?

A
  1. Überbetonung von p-Werten: Fokussierung auf Signifikanz statt auf Effektgrößen und praktische Relevanz.
  2. Dichotomes Denken: Ergebnisse werden als entweder signifikant oder nicht signifikant interpretiert.
  3. Missverständnisse: Fehlinterpretation der p-Werte und der Wahrscheinlichkeit der Nullhypothese.
  4. Power und Stichprobengröße: Geringe Teststärke bei kleinen Stichproben.
178
Q

Sie führen ein Experiment mit einer Stichprobe von N = 100 durch. Anschließend wiederholen Sie das Experiment unter gleichen Bedingungen und mit den gleichen Hypothesen, diesmal allerdings mit N = 75 Teilnehmenden. In beiden Experimenten beobachten Sie exakt den gleichen Wert der Teststatistik.

Wie verhält sich der p-Wert?

A

Der p-Wert ist im zweiten Experiment größer.

> da bei kleineren Stichproben die Verteilung der Teststatistik breiter ist, was dazu führt, dass der gleiche Wert der Teststatistik einen höheren p-Wert ergibt

179
Q

Wie nennt man die Streuung bei einer Stichprobenverteilung eines statistischen Kennwerts?

A

Streuung: Standardfehler (Standard Error, SE)

> Erklärung: Der Standardfehler misst die Streuung der Stichprobenmittelwerte um den Populationsmittelwert

180
Q

Formel Standardabweichung

A
181
Q

Formel Standardfehler (SE)

A
182
Q

Formel Berechnung z-Wert

A
183
Q

Formel kritischer Wert

A
184
Q

1 – alpha =

A

Wahrscheinlichkeit, die Nullhypothese korrekt beizubehalten

185
Q

1 – beta =

A

Wahrscheinlichkeit, die Nullhypothese korrekt abzulehnen (Teststärke/Power)