1. Hypothesentesten Flashcards

1
Q

Die Inferenzstatistik beruht auf dem Prinzip der Hypothesentestung. Beschreiben Sie kurz die Schritte bei der Hypothesenprüfung.

A
  1. Formulierung von Null- und Alternativhypothese
  2. Festlegung des Signifikanzniveaus
  3. Festlegung der Stichprobengröße und Art
  4. Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte
  5. Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese
  6. Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert
  7. Falls Signifikanz vorliegt: Interpretation der Effektgröße
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Formulieren der Null- und Alternativhypothese

A

• Zu Beginn einer Studie sollte eine von Theorien geleitete wissenschaftliche Behauptung in Form einer Hypothese aufgestellt werden

• Definition zweier gegensätzlicher, sich einander ausschließender Hypothesen

• Nullhypothese = Negativhypothese: es gibt keine Mittelwertsunterschiede/Zusammenhänge in Population (Status quo)

• Alternativhypothese = Positivhypothese: es existiert ein Unterschied/Zusammenhang in Population, sollte immer aus Vorstudien oder der Literatur abgeleitet sein, kann gerichtet/ungerichtet sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Festlegung eines Signifikanzniveaus

A

• Signifikanzniveau legt fest, ab welcher a-Fehler-Wahrscheinlichkeit (p) die Nullhypothese (H0) zugunsten der Alternativhypothese (H1) verworfen wird

• also ab welcher Fehlerwahrscheinlichkeit ein empirisches Ergebnis nicht mehr mit der Nullhypothese vereinbar sein soll

• wird immer zu Beginn einer Studie festgelegt

• In der Regel: Signifikanzniveau von 5% (a = 0.05)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Festlegung des Stichprobenumfangs und Art

A

• Umfang sollte bestenfalls a priori festgelegt werden, die optimale Stichprobengröße ist wichtig, da Einfluss auf den a-Fehler und ß-Fehler

• ART: 2 Stichprobenarten: abhängige/unabhängige: Abhängige Stichprobe: Werte der einen Stichprobe beeinflussen Werte in der anderen Stichprobe

• Zu kleine Stichprobe = erschwert statistische Absicherung eines in der Population vorhandenen relevanten Effekts

• Zu große Stichprobe: Gefahr, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/signifikant werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte

A

• Zuerst Datenerhebung anhand von Zufallsstichprobe (Stichprobengröße a priori), danach Auswahl des passenden statistischen Tests

• Testwahl ist abhängig von: Art der Hypothese (Zusammenhang/Unterschied/Veränderung), Skalenniveau (Verfahren für nominal-, ordinal-, intervallskalierte Variablen), Relation der Stichproben zueinander (abhängig/unabhängig), Anzahl der Variablen (ein- oder mehrfaktoriell, uni- oder multivariant)

• Nun werden Kennwerte mithilfe des korrekten Tests ermittelt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese

A

• Es wird berechnet, mit welcher Wahrscheinlichkeit dieser Kennwert in der Population auftritt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert

A

• Entscheidung: liegt beobachteter Wert im Ablehnungs- oder Beibehaltungbereich der Nullhypothese? (deshalb vorher Festlegung Signifikanzniveau)

• Ermittelter Wert liegt im Ablehnungbereich: (beobachteter Wert ist größer als kritischer Wert): H0 wird abgelehnt und Alternativhypothese H1 wird angenommen

• ≠ Nullhypothese wird beibehalten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Falls Signifikanz vorliegt: Interpretation der Effektgröße

A

• Untersuchung, ob dieser Unterschied/Zusammenhang auch von praktischer Relevanz ist ( Wie groß ist das Ausmaß des Effekts tatsächlich?)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erläutere die Null- und Alternativhypothese, welche Fehler können beim Hypothesentesten begangen werden?

A

Nullhypothese (H0): H0: u1 = u2

• Negativhypothese, Status quo
• gibt an, dass es keine Mittelwertsunterschiede/Zusammenhänge in der Population gibt
• Grundlage für die inferenzstatistische Hypothesenprüfung
• Testung immer auf Gültigkeit der Nullhypothese
_________________________________________________

Alternativhypothese (H1): H1: u1 ≠ u2

•Positivhypothese
• Es existiert ein Unterschied/Zusammenhang in der Population
• sollte aus Vorstudien/Literatur abgeleitet sein
• es wird zwischen gerichteter/ungerichteter Hypothese unterschieden
_________________________________________________

Dadurch, dass eine Hypothese immer nur mit einer gewissen Wahrscheinlichkeit abgelehnt werden kann, besteht immer ein Restrisiko für Fehler. Dadurch ergeben sich 2 verschiedene Fehlerarten: aFehler und ßFehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erläutere den Unterschied zwischen ungerichteter und gerichteter Alternativhypothese.

A

Ungerichtete Alternativhypothese: H1: u1 ≠ u2

• zweiseitige Testung
• es wird von einem Unterschied zwischen zwei Stichprobenkennwerten ausgegangen und allein auf die Existenz eines Unterschieds getestet, jedoch:
• werden keine Aussagen über die „Richtung“ des Unterschieds gemacht (nur ≠)
• exploratives Verfahren
• “Frauen unterscheiden sich in xy von Männern”
_________________________________________________

Gerichtete Alternativhypothese: H1: u1 </> u2

• einseitige Testung
• gibt die „Richtung“ eines Unterschieds
zwischen Stichprobenkennwerten an
• Vorgehensweise gilt als wissenschaftlicher, da theoretische Vorannahmen getroffen werden müssen
• “Noten verbessern sich nach Lerntrainings mit Schülern”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Erkläre den aFehler und den ßFehler.

A

aFehler: Ablehnung der Nullhypothese, obwohl diese eigentlich gültig ist (Beispiel: falscher Alarm, Schwangerschaftstest fälschlicherweise positiv)

❗️Es wird ein signifikantes Ergebnis/vermeintlicher Effekt gefunden, der in Wirklichkeit nicht vorhanden ist
_________________________________________________

ßFehler: Beibehaltung der Nullhypothese bei gültiger Alternativhypothese (Beispiel: unterlassener Alarm, Schwangerschaftstest negativ obwohl schwanger)

❗️es wird kein signifikantes Ergebnis/Effekt gefunden, obwohl einer vorhanden ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was beeinflusst den ßFehler + psychologisches Beispiel nennen.

A

Beeinflussung durch:

• Höhe des Signifikanzniveaus (je höher aNiveau, desto niedriger ßFehler)

• Stichprobenumfang (je größer Stichprobe, desto niedriger ßFehler)

• Größe des stat. Effekts (je größer Unterschiede/Zusammenhänge, desto niedriger ßFehler)

• Streuung des Merkmals (umso homogener die Stichprobe, desto niedriger ßFehler)

• Ein- oder zweiseitige Testung (zweiseitige Testung Risiko auf größeren ßFehler)

• abhängige/unabhängige Stichproben (unabhängige Stichproben Risiko auf größeren ßFehler)

• Teststärke (größere Teststärke führt zu niedrigerem ßFehler)
_________________________________________________

Psychologisches Beispiel: In einer Studie mit 10 Personen wird ein neues Therapieverfahren mit einem bestehendem verglichen. Statistiken ergeben, dass neue Form nicht signifikant besser ist, obwohl dies in Wirklichkeit der Fall ist. Die Nullhypothese (kein signifikanter Unterschied) wird trotz gültiger Alternativhypothese (es gibt einen signifikanten Unterschied) beibehalten.(Gründe: geringe Stichprobengröße oder ungünstige Ziehung der Stichprobe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erklären Sie die Teststärke?

A

Teststärke = Power:

• die Wahrscheinlichkeit, einen Effekt zu entdecken, wenn dieser tatsächlich vorhanden ist, also korrekterweise eine falsche Nullhypothese zu verwerfen
• verläuft gegenläufig zum ßFehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was beeinflusst die Teststärke, wie kann diese erhöht werden?

A

• Höhe des Signifikanzniveaus (je höher aNiveau, desto größer ist Teststärke) 🅰️

• Höhe des ßFehlers (geringerer ßFehler führt zu größerer Teststärke)

• Größe des stat. Effekts (je größer, desto größer ist Teststärke) 👊🏼

• Stichprobenumfang (größere Stichprobe führt zu größerer Teststärke) 🪐

• Streuung des Merkmals (homogene Stichprobe führt zu größerer Teststärke) 🍩

• Ein- oder zweiseitige Testung (Teststärke bei einseitiger Testung größer) ⬅️↔️

• Abhängige/unabhängige Stichproben (Teststärke bei Abhängigen größer) 🍺

• Experimenteller Fehler (Störvariablen möglichst eliminieren)

• Informationsgehalt der Ausgangsdaten (hohes Skalenniveau führt zu hoher Teststärke)ℹ️

• Voraussetzungen an die Verteilung: je mehr Voraussetzungen erfüllt (Normalverteilung, Varianzhomogenität) desto größer Teststärke

• Auswahl des statistischen Verfahrens: parametrische Tests sind Teststärker

ALLE FAKTOREN, DIE ßFEHLER SENKEN, ERHÖHEN DIE TESTSTÄRKE (1-ß)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was versteht man unter dem optimalen Stichprobenumfang?

A

• Bestimmung der optimalen Stichprobengröße a priori für Planung einer Untersuchung von großer Bedeutung, da:

• Stichprobenumfang einen entscheidenden Einfluss auf Standardfehler und die beiden Fehlerarten a und ß hat

❗️zu kleine Stichprobe: erschwert die statistische Absicherung eines in der Population vorhandenen relevanten Effekts

❗️zu große Stichprobe: es kann passieren, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/ signifikant werden

• optimaler Stichprobenumfang ist aus statistischer Sicher also eher eine Mindestgröße (Stichprobe sollte gerade groß genug gewählt wird, um einen für die Praxis relevanten Effekt statistisch abzusichern)

Folgendes ist für Stichprobenplanung wichtig:

• A priori, also schon bei der Planung der Untersuchung, sollten optimaler Stichprobenumfang und Effektgröße berücksichtigt werden

• es sollte überlegt werden, ob und wie groß die erwarteten Effekte sind (enormer Aufwand einer Untersuchung ist nur sinnvoll, wenn ein Effekt aufgrund der Stichprobengröße statistisch bedeutsam ist)

• Deshalb sollten über den optimalen Stichprobenumfang die minimale Anzahl der notwendigen Teilnehmer ermittelt werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nenne 3 Parameter, die den optimalen Stichprobenumfang beeinflussen.

A

a Niveau (je höher das a-Niveau a priori festgelegt wurde, desto geringer fällt der ßFehler aus)
ß Fehler (kleinere Wahrscheinlichkeit für ß-Fehler erfordert Erhöhung der Stichprobengröße)
Effektgröße (bei nur gering zu erwartendem Effekt (Effektgröße: d=0,2) wird ein relativ großer Stichprobenumfang benötigt, damit dieser Effekt auch statistisch bedeutsam wird)

❗️Diese Faktoren beeinflussen sich alle gegenseitig ❗️

17
Q

Welche Schwierigkeit kann bei der Interpretation inferenzstatistischer Tests auftreten, wenn der Stichprobenumfang sehr groß ist? Welches Vorgehen wird dann empfohlen?

A

❗️für die Praxis unbedeutende Effekte können statistisch bedeutsam/signifikant werden❗️

Vorgehen um dies zu umgehen:

• optimaler Stichprobenumfang sollte a priori festgelegt werden

passendes a-Niveau zuvor festlegen (großes Datenvolumen: Signifikanzniveau von 1 % (a = 0.01))

Berücksichtigung der praktischen Relevanz (Effektgröße) trotz vorhandener Signifikanz, da mit sehr großen Stichproben prinzipiell jeder Effekt statistisch bedeutsam wird

• wurde bereits eine zu große Stichprobe erhoben: Teststärke und Effektgröße angeben, damit das Ergebnis der statistischen Signifikanz eingeordnet werden kann (es kann festgestellt werden, ob die statistische Signifikanz wirklich bedeutsam ist oder das Ergebnis doch nur zufällig aufgrund der zu hohen Stichprobe signifikant wird)

18
Q

Definiere was unter der Effektgröße zu verstehen ist.

A

❗️bezeichnet die Größe/Stärke eines statistischen Effekts und untersucht, ob dieser auch eine praktische Relevanz hat, denn:❗️

Unterschied zwischen statistischer Signifikanz und praktischer Relevanz eines Effekts

• Statistische Signifikanz = wenn ein bedeutsamer Unterschied/Zusammenhang zwischen zwei Gruppen existiert

• allerdings werden bei großem Stichprobenumfang zunehmend sehr kleine Unterschiede statistisch signifikant, obwohl diese keine praktische Relevanz haben

• je nach Studie Verwendung verschiedener Arten von Effektgrößen: z.B. Odds Ratio, Hazard Ratio und Cohen’s d

19
Q

Definition Cohens d

A

• Eine Effektgröße für Mittelwertsunterschiede zwischen zwei Gruppen, hilft bei der Bewertung der Praktischen Relevanz eines signifikanten Mittelwertsunterschied (hier wird die Differenz zwischen zwei Mittelwerten an der Streuung relativiert)

• nach Cohen (1988) kann diese Effektgröße folgendermaßen eingeteilt und interpretiert werden:

0,20 = kleiner Effekt

0.50 = mittlerer Effekt

0.80 = großer Effekt

20
Q

Wie kann die Effektgröße verbessert werden?

A

Erhöhung der Stichprobengröße

Homogenität der Stichprobe herstellen, um Verzerrungen zu vermeiden (sorgfältigere Auswahl von Studienteilnehmern)

Messmethoden sorgfältig validieren & standardisieren

21
Q

Erklären Sie die Abhängigkeiten und Zusammenhänge von Stichprobengröße, Signifikanzniveau (aNiveau), Teststärke und Effektgröße. Wie können diese für die Stichprobenplanung genutzt werden?

A

❗️Grundsätzlich sind die folgenden 4 statistischen Werte voneinander abhängig: Signifikanzniveau (a-Niveau), ß-Fehler (somit auch die Teststärke 1-ß), Effektgröße und Stichprobenumfang ❗️

Es gelten folgende Zusammenhänge:

• Mit zunehmender Stichprobengröße werden immer kleinere Effekte statistisch signifikant, selbst wenn sie keine praktische Relevanz haben, mit einer entsprechend großen Stichprobe können minimale Mittelwertdifferenzen signifikant gemacht werden

• Ein praktisch relevanter Effekt kann hingegen aufgrund eines zu geringen Stichprobenumfangs nicht als signifikante Mittelwertdifferenz bestätigt werden

• Je geringer a-Niveau, desto höher der ß-Fehler und desto geringer die Teststärke und desto höher ist die Anforderung an die Stichprobengröße

• Je größer die Stichprobe, desto geringer die Wahrscheinlichkeit des ß -Fehlers, was wiederrum die Teststärke erhöht (da die Stichprobengröße den Standardfehler beeinflusst)

• Je größer der Effekt desto geringer der ß-Fehler, was wiederrum die Teststärke erhöht

22
Q

Erklären Sie die Bedeutung der Stichprobenverteilung für die Hypothesentestung.

A

• Stichprobenverteilung = die Ergebnisverteilung der Stichprobenwerte bzgl. bestimmter statistischer Größen

• Wichtigkeit der bekannten Stichprobenverteilung für die Auswahl des Testverfahrens und der Bewertung auf Genauigkeit des Ergebnisses (STICHPROBENVERTEILUNG HAT EINFLUSS AUF TESTVERFAHREN, SOMIT AUCH AUF TESTSTÄRKE!)

• In der Hypothesentestung erfolgt die Ziehung einer Stichprobe aus der größeren Population zufällig um Rückschlüsse auf die Population ziehen zu können Analyse, wenn Stichprobengröße ausreichend und die Annahme der Normalverteilung der Population erfüllt ist