1. Hypothesentesten Flashcards

Question 1

Q

Die Inferenzstatistik beruht auf dem Prinzip der Hypothesentestung. Beschreiben Sie kurz die Schritte bei der Hypothesenprüfung.

Answer

A

Formulierung von Null- und Alternativhypothese
Festlegung des Signifikanzniveaus
Festlegung der Stichprobengröße und Art
Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte
Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese
Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert
Falls Signifikanz vorliegt: Interpretation der Effektgröße

Question 2

Q

Formulieren der Null- und Alternativhypothese

Answer

A

• Zu Beginn einer Studie sollte eine von Theorien geleitete wissenschaftliche Behauptung in Form einer Hypothese aufgestellt werden

• Definition zweier gegensätzlicher, sich einander ausschließender Hypothesen

• Nullhypothese = Negativhypothese: es gibt keine Mittelwertsunterschiede/Zusammenhänge in Population (Status quo)

• Alternativhypothese = Positivhypothese: es existiert ein Unterschied/Zusammenhang in Population, sollte immer aus Vorstudien oder der Literatur abgeleitet sein, kann gerichtet/ungerichtet sein

Question 3

Q

Festlegung eines Signifikanzniveaus

Answer

A

• Signifikanzniveau legt fest, ab welcher a-Fehler-Wahrscheinlichkeit (p) die Nullhypothese (H0) zugunsten der Alternativhypothese (H1) verworfen wird

• also ab welcher Fehlerwahrscheinlichkeit ein empirisches Ergebnis nicht mehr mit der Nullhypothese vereinbar sein soll

• wird immer zu Beginn einer Studie festgelegt

• In der Regel: Signifikanzniveau von 5% (a = 0.05)

Question 4

Q

Festlegung des Stichprobenumfangs und Art

Answer

A

• Umfang sollte bestenfalls a priori festgelegt werden, die optimale Stichprobengröße ist wichtig, da Einfluss auf den a-Fehler und ß-Fehler

• ART: 2 Stichprobenarten: abhängige/unabhängige: Abhängige Stichprobe: Werte der einen Stichprobe beeinflussen Werte in der anderen Stichprobe

• Zu kleine Stichprobe = erschwert statistische Absicherung eines in der Population vorhandenen relevanten Effekts

• Zu große Stichprobe: Gefahr, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/signifikant werden

Question 5

Q

Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte

Answer

A

• Zuerst Datenerhebung anhand von Zufallsstichprobe (Stichprobengröße a priori), danach Auswahl des passenden statistischen Tests

• Testwahl ist abhängig von: Art der Hypothese (Zusammenhang/Unterschied/Veränderung), Skalenniveau (Verfahren für nominal-, ordinal-, intervallskalierte Variablen), Relation der Stichproben zueinander (abhängig/unabhängig), Anzahl der Variablen (ein- oder mehrfaktoriell, uni- oder multivariant)

• Nun werden Kennwerte mithilfe des korrekten Tests ermittelt

Question 6

Q

Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese

Answer

A

• Es wird berechnet, mit welcher Wahrscheinlichkeit dieser Kennwert in der Population auftritt

Question 7

Q

Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert

Answer

A

• Entscheidung: liegt beobachteter Wert im Ablehnungs- oder Beibehaltungbereich der Nullhypothese? (deshalb vorher Festlegung Signifikanzniveau)

• Ermittelter Wert liegt im Ablehnungbereich: (beobachteter Wert ist größer als kritischer Wert): H0 wird abgelehnt und Alternativhypothese H1 wird angenommen

• ≠ Nullhypothese wird beibehalten

Question 8

Q

Falls Signifikanz vorliegt: Interpretation der Effektgröße

Answer

A

• Untersuchung, ob dieser Unterschied/Zusammenhang auch von praktischer Relevanz ist ( Wie groß ist das Ausmaß des Effekts tatsächlich?)

Question 9

Q

Erläutere die Null- und Alternativhypothese, welche Fehler können beim Hypothesentesten begangen werden?

Answer

A

Nullhypothese (H0): H0: u1 = u2

• Negativhypothese, Status quo
• gibt an, dass es keine Mittelwertsunterschiede/Zusammenhänge in der Population gibt
• Grundlage für die inferenzstatistische Hypothesenprüfung
• Testung immer auf Gültigkeit der Nullhypothese
_________________________________________________

Alternativhypothese (H1): H1: u1 ≠ u2

•Positivhypothese
• Es existiert ein Unterschied/Zusammenhang in der Population
• sollte aus Vorstudien/Literatur abgeleitet sein
• es wird zwischen gerichteter/ungerichteter Hypothese unterschieden
_________________________________________________

Dadurch, dass eine Hypothese immer nur mit einer gewissen Wahrscheinlichkeit abgelehnt werden kann, besteht immer ein Restrisiko für Fehler. Dadurch ergeben sich 2 verschiedene Fehlerarten: aFehler und ßFehler

Question 10

Q

Erläutere den Unterschied zwischen ungerichteter und gerichteter Alternativhypothese.

Answer

A

Ungerichtete Alternativhypothese: H1: u1 ≠ u2

• zweiseitige Testung
• es wird von einem Unterschied zwischen zwei Stichprobenkennwerten ausgegangen und allein auf die Existenz eines Unterschieds getestet, jedoch:
• werden keine Aussagen über die „Richtung“ des Unterschieds gemacht (nur ≠)
• exploratives Verfahren
• “Frauen unterscheiden sich in xy von Männern”
_________________________________________________

Gerichtete Alternativhypothese: H1: u1 </> u2

• einseitige Testung
• gibt die „Richtung“ eines Unterschieds
zwischen Stichprobenkennwerten an
• Vorgehensweise gilt als wissenschaftlicher, da theoretische Vorannahmen getroffen werden müssen
• “Noten verbessern sich nach Lerntrainings mit Schülern”

Question 11

Q

Erkläre den aFehler und den ßFehler.

Answer

A

aFehler: Ablehnung der Nullhypothese, obwohl diese eigentlich gültig ist (Beispiel: falscher Alarm, Schwangerschaftstest fälschlicherweise positiv)

❗️Es wird ein signifikantes Ergebnis/vermeintlicher Effekt gefunden, der in Wirklichkeit nicht vorhanden ist
_________________________________________________

ßFehler: Beibehaltung der Nullhypothese bei gültiger Alternativhypothese (Beispiel: unterlassener Alarm, Schwangerschaftstest negativ obwohl schwanger)

❗️es wird kein signifikantes Ergebnis/Effekt gefunden, obwohl einer vorhanden ist

Question 12

Q

Was beeinflusst den ßFehler + psychologisches Beispiel nennen.

Answer

A

Beeinflussung durch:

• Höhe des Signifikanzniveaus (je höher aNiveau, desto niedriger ßFehler)

• Stichprobenumfang (je größer Stichprobe, desto niedriger ßFehler)

• Größe des stat. Effekts (je größer Unterschiede/Zusammenhänge, desto niedriger ßFehler)

• Streuung des Merkmals (umso homogener die Stichprobe, desto niedriger ßFehler)

• Ein- oder zweiseitige Testung (zweiseitige Testung Risiko auf größeren ßFehler)

• abhängige/unabhängige Stichproben (unabhängige Stichproben Risiko auf größeren ßFehler)

• Teststärke (größere Teststärke führt zu niedrigerem ßFehler)
_________________________________________________

Psychologisches Beispiel: In einer Studie mit 10 Personen wird ein neues Therapieverfahren mit einem bestehendem verglichen. Statistiken ergeben, dass neue Form nicht signifikant besser ist, obwohl dies in Wirklichkeit der Fall ist. Die Nullhypothese (kein signifikanter Unterschied) wird trotz gültiger Alternativhypothese (es gibt einen signifikanten Unterschied) beibehalten.(Gründe: geringe Stichprobengröße oder ungünstige Ziehung der Stichprobe)

Question 13

Q

Erklären Sie die Teststärke?

Answer

A

Teststärke = Power:

• die Wahrscheinlichkeit, einen Effekt zu entdecken, wenn dieser tatsächlich vorhanden ist, also korrekterweise eine falsche Nullhypothese zu verwerfen
• verläuft gegenläufig zum ßFehler

Question 14

Q

Was beeinflusst die Teststärke, wie kann diese erhöht werden?

Answer

A

• Höhe des Signifikanzniveaus (je höher aNiveau, desto größer ist Teststärke) 🅰️

• Höhe des ßFehlers (geringerer ßFehler führt zu größerer Teststärke)

• Größe des stat. Effekts (je größer, desto größer ist Teststärke) 👊🏼

• Stichprobenumfang (größere Stichprobe führt zu größerer Teststärke) 🪐

• Streuung des Merkmals (homogene Stichprobe führt zu größerer Teststärke) 🍩

• Ein- oder zweiseitige Testung (Teststärke bei einseitiger Testung größer) ⬅️↔️

• Abhängige/unabhängige Stichproben (Teststärke bei Abhängigen größer) 🍺

• Experimenteller Fehler (Störvariablen möglichst eliminieren)

• Informationsgehalt der Ausgangsdaten (hohes Skalenniveau führt zu hoher Teststärke)ℹ️

• Voraussetzungen an die Verteilung: je mehr Voraussetzungen erfüllt (Normalverteilung, Varianzhomogenität) desto größer Teststärke

• Auswahl des statistischen Verfahrens: parametrische Tests sind Teststärker

ALLE FAKTOREN, DIE ßFEHLER SENKEN, ERHÖHEN DIE TESTSTÄRKE (1-ß)

Question 15

Q

Was versteht man unter dem optimalen Stichprobenumfang?

Answer

A

• Bestimmung der optimalen Stichprobengröße a priori für Planung einer Untersuchung von großer Bedeutung, da:

• Stichprobenumfang einen entscheidenden Einfluss auf Standardfehler und die beiden Fehlerarten a und ß hat

❗️zu kleine Stichprobe: erschwert die statistische Absicherung eines in der Population vorhandenen relevanten Effekts

❗️zu große Stichprobe: es kann passieren, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/ signifikant werden

• optimaler Stichprobenumfang ist aus statistischer Sicher also eher eine Mindestgröße (Stichprobe sollte gerade groß genug gewählt wird, um einen für die Praxis relevanten Effekt statistisch abzusichern)

Folgendes ist für Stichprobenplanung wichtig:

• A priori, also schon bei der Planung der Untersuchung, sollten optimaler Stichprobenumfang und Effektgröße berücksichtigt werden

• es sollte überlegt werden, ob und wie groß die erwarteten Effekte sind (enormer Aufwand einer Untersuchung ist nur sinnvoll, wenn ein Effekt aufgrund der Stichprobengröße statistisch bedeutsam ist)

• Deshalb sollten über den optimalen Stichprobenumfang die minimale Anzahl der notwendigen Teilnehmer ermittelt werden

Question 16

Q

Nenne 3 Parameter, die den optimalen Stichprobenumfang beeinflussen.

Answer

Study These Flashcards

A

• a Niveau (je höher das a-Niveau a priori festgelegt wurde, desto geringer fällt der ßFehler aus)
• ß Fehler (kleinere Wahrscheinlichkeit für ß-Fehler erfordert Erhöhung der Stichprobengröße)
• Effektgröße (bei nur gering zu erwartendem Effekt (Effektgröße: d=0,2) wird ein relativ großer Stichprobenumfang benötigt, damit dieser Effekt auch statistisch bedeutsam wird)

❗️Diese Faktoren beeinflussen sich alle gegenseitig ❗️

Question 17

Q

Welche Schwierigkeit kann bei der Interpretation inferenzstatistischer Tests auftreten, wenn der Stichprobenumfang sehr groß ist? Welches Vorgehen wird dann empfohlen?

Answer

Study These Flashcards

A

❗️für die Praxis unbedeutende Effekte können statistisch bedeutsam/signifikant werden❗️

Vorgehen um dies zu umgehen:

• optimaler Stichprobenumfang sollte a priori festgelegt werden

• passendes a-Niveau zuvor festlegen (großes Datenvolumen: Signifikanzniveau von 1 % (a = 0.01))

• Berücksichtigung der praktischen Relevanz (Effektgröße) trotz vorhandener Signifikanz, da mit sehr großen Stichproben prinzipiell jeder Effekt statistisch bedeutsam wird

• wurde bereits eine zu große Stichprobe erhoben: Teststärke und Effektgröße angeben, damit das Ergebnis der statistischen Signifikanz eingeordnet werden kann (es kann festgestellt werden, ob die statistische Signifikanz wirklich bedeutsam ist oder das Ergebnis doch nur zufällig aufgrund der zu hohen Stichprobe signifikant wird)

Question 18

Q

Definiere was unter der Effektgröße zu verstehen ist.

Answer

Study These Flashcards

A

❗️bezeichnet die Größe/Stärke eines statistischen Effekts und untersucht, ob dieser auch eine praktische Relevanz hat, denn:❗️

• Unterschied zwischen statistischer Signifikanz und praktischer Relevanz eines Effekts

• Statistische Signifikanz = wenn ein bedeutsamer Unterschied/Zusammenhang zwischen zwei Gruppen existiert

• allerdings werden bei großem Stichprobenumfang zunehmend sehr kleine Unterschiede statistisch signifikant, obwohl diese keine praktische Relevanz haben

• je nach Studie Verwendung verschiedener Arten von Effektgrößen: z.B. Odds Ratio, Hazard Ratio und Cohen’s d

Question 19

Q

Definition Cohens d

Answer

Study These Flashcards

A

• Eine Effektgröße für Mittelwertsunterschiede zwischen zwei Gruppen, hilft bei der Bewertung der Praktischen Relevanz eines signifikanten Mittelwertsunterschied (hier wird die Differenz zwischen zwei Mittelwerten an der Streuung relativiert)

• nach Cohen (1988) kann diese Effektgröße folgendermaßen eingeteilt und interpretiert werden:

0,20 = kleiner Effekt

0.50 = mittlerer Effekt

0.80 = großer Effekt

Question 20

Q

Wie kann die Effektgröße verbessert werden?

Answer

Study These Flashcards

A

• Erhöhung der Stichprobengröße

• Homogenität der Stichprobe herstellen, um Verzerrungen zu vermeiden (sorgfältigere Auswahl von Studienteilnehmern)

• Messmethoden sorgfältig validieren & standardisieren

Question 21

Q

Erklären Sie die Abhängigkeiten und Zusammenhänge von Stichprobengröße, Signifikanzniveau (aNiveau), Teststärke und Effektgröße. Wie können diese für die Stichprobenplanung genutzt werden?

Answer

Study These Flashcards

A

❗️Grundsätzlich sind die folgenden 4 statistischen Werte voneinander abhängig: Signifikanzniveau (a-Niveau), ß-Fehler (somit auch die Teststärke 1-ß), Effektgröße und Stichprobenumfang ❗️

Es gelten folgende Zusammenhänge:

• Mit zunehmender Stichprobengröße werden immer kleinere Effekte statistisch signifikant, selbst wenn sie keine praktische Relevanz haben, mit einer entsprechend großen Stichprobe können minimale Mittelwertdifferenzen signifikant gemacht werden

• Ein praktisch relevanter Effekt kann hingegen aufgrund eines zu geringen Stichprobenumfangs nicht als signifikante Mittelwertdifferenz bestätigt werden

• Je geringer a-Niveau, desto höher der ß-Fehler und desto geringer die Teststärke und desto höher ist die Anforderung an die Stichprobengröße

• Je größer die Stichprobe, desto geringer die Wahrscheinlichkeit des ß -Fehlers, was wiederrum die Teststärke erhöht (da die Stichprobengröße den Standardfehler beeinflusst)

• Je größer der Effekt desto geringer der ß-Fehler, was wiederrum die Teststärke erhöht

Question 22

Q

Erklären Sie die Bedeutung der Stichprobenverteilung für die Hypothesentestung.

Answer

Study These Flashcards

A

• Stichprobenverteilung = die Ergebnisverteilung der Stichprobenwerte bzgl. bestimmter statistischer Größen

• Wichtigkeit der bekannten Stichprobenverteilung für die Auswahl des Testverfahrens und der Bewertung auf Genauigkeit des Ergebnisses (STICHPROBENVERTEILUNG HAT EINFLUSS AUF TESTVERFAHREN, SOMIT AUCH AUF TESTSTÄRKE!)

• In der Hypothesentestung erfolgt die Ziehung einer Stichprobe aus der größeren Population zufällig um Rückschlüsse auf die Population ziehen zu können Analyse, wenn Stichprobengröße ausreichend und die Annahme der Normalverteilung der Population erfüllt ist

1. Hypothesentesten Flashcards

(22 cards)