1. Hypothesentesten Flashcards
Die Inferenzstatistik beruht auf dem Prinzip der Hypothesentestung. Beschreiben Sie kurz die Schritte bei der Hypothesenprüfung.
- Formulierung von Null- und Alternativhypothese
- Festlegung des Signifikanzniveaus
- Festlegung der Stichprobengröße und Art
- Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte
- Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese
- Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert
- Falls Signifikanz vorliegt: Interpretation der Effektgröße
Formulieren der Null- und Alternativhypothese
• Zu Beginn einer Studie sollte eine von Theorien geleitete wissenschaftliche Behauptung in Form einer Hypothese aufgestellt werden
• Definition zweier gegensätzlicher, sich einander ausschließender Hypothesen
• Nullhypothese = Negativhypothese: es gibt keine Mittelwertsunterschiede/Zusammenhänge in Population (Status quo)
• Alternativhypothese = Positivhypothese: es existiert ein Unterschied/Zusammenhang in Population, sollte immer aus Vorstudien oder der Literatur abgeleitet sein, kann gerichtet/ungerichtet sein
Festlegung eines Signifikanzniveaus
• Signifikanzniveau legt fest, ab welcher a-Fehler-Wahrscheinlichkeit (p) die Nullhypothese (H0) zugunsten der Alternativhypothese (H1) verworfen wird
• also ab welcher Fehlerwahrscheinlichkeit ein empirisches Ergebnis nicht mehr mit der Nullhypothese vereinbar sein soll
• wird immer zu Beginn einer Studie festgelegt
• In der Regel: Signifikanzniveau von 5% (a = 0.05)
Festlegung des Stichprobenumfangs und Art
• Umfang sollte bestenfalls a priori festgelegt werden, die optimale Stichprobengröße ist wichtig, da Einfluss auf den a-Fehler und ß-Fehler
• ART: 2 Stichprobenarten: abhängige/unabhängige: Abhängige Stichprobe: Werte der einen Stichprobe beeinflussen Werte in der anderen Stichprobe
• Zu kleine Stichprobe = erschwert statistische Absicherung eines in der Population vorhandenen relevanten Effekts
• Zu große Stichprobe: Gefahr, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/signifikant werden
Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte
• Zuerst Datenerhebung anhand von Zufallsstichprobe (Stichprobengröße a priori), danach Auswahl des passenden statistischen Tests
• Testwahl ist abhängig von: Art der Hypothese (Zusammenhang/Unterschied/Veränderung), Skalenniveau (Verfahren für nominal-, ordinal-, intervallskalierte Variablen), Relation der Stichproben zueinander (abhängig/unabhängig), Anzahl der Variablen (ein- oder mehrfaktoriell, uni- oder multivariant)
• Nun werden Kennwerte mithilfe des korrekten Tests ermittelt
Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese
• Es wird berechnet, mit welcher Wahrscheinlichkeit dieser Kennwert in der Population auftritt
Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert
• Entscheidung: liegt beobachteter Wert im Ablehnungs- oder Beibehaltungbereich der Nullhypothese? (deshalb vorher Festlegung Signifikanzniveau)
• Ermittelter Wert liegt im Ablehnungbereich: (beobachteter Wert ist größer als kritischer Wert): H0 wird abgelehnt und Alternativhypothese H1 wird angenommen
• ≠ Nullhypothese wird beibehalten
Falls Signifikanz vorliegt: Interpretation der Effektgröße
• Untersuchung, ob dieser Unterschied/Zusammenhang auch von praktischer Relevanz ist ( Wie groß ist das Ausmaß des Effekts tatsächlich?)
Erläutere die Null- und Alternativhypothese, welche Fehler können beim Hypothesentesten begangen werden?
Nullhypothese (H0): H0: u1 = u2
• Negativhypothese, Status quo
• gibt an, dass es keine Mittelwertsunterschiede/Zusammenhänge in der Population gibt
• Grundlage für die inferenzstatistische Hypothesenprüfung
• Testung immer auf Gültigkeit der Nullhypothese
_________________________________________________
Alternativhypothese (H1): H1: u1 ≠ u2
•Positivhypothese
• Es existiert ein Unterschied/Zusammenhang in der Population
• sollte aus Vorstudien/Literatur abgeleitet sein
• es wird zwischen gerichteter/ungerichteter Hypothese unterschieden
_________________________________________________
Dadurch, dass eine Hypothese immer nur mit einer gewissen Wahrscheinlichkeit abgelehnt werden kann, besteht immer ein Restrisiko für Fehler. Dadurch ergeben sich 2 verschiedene Fehlerarten: aFehler und ßFehler
Erläutere den Unterschied zwischen ungerichteter und gerichteter Alternativhypothese.
Ungerichtete Alternativhypothese: H1: u1 ≠ u2
• zweiseitige Testung
• es wird von einem Unterschied zwischen zwei Stichprobenkennwerten ausgegangen und allein auf die Existenz eines Unterschieds getestet, jedoch:
• werden keine Aussagen über die „Richtung“ des Unterschieds gemacht (nur ≠)
• exploratives Verfahren
• “Frauen unterscheiden sich in xy von Männern”
_________________________________________________
Gerichtete Alternativhypothese: H1: u1 </> u2
• einseitige Testung
• gibt die „Richtung“ eines Unterschieds
zwischen Stichprobenkennwerten an
• Vorgehensweise gilt als wissenschaftlicher, da theoretische Vorannahmen getroffen werden müssen
• “Noten verbessern sich nach Lerntrainings mit Schülern”
Erkläre den aFehler und den ßFehler.
aFehler: Ablehnung der Nullhypothese, obwohl diese eigentlich gültig ist (Beispiel: falscher Alarm, Schwangerschaftstest fälschlicherweise positiv)
❗️Es wird ein signifikantes Ergebnis/vermeintlicher Effekt gefunden, der in Wirklichkeit nicht vorhanden ist
_________________________________________________
ßFehler: Beibehaltung der Nullhypothese bei gültiger Alternativhypothese (Beispiel: unterlassener Alarm, Schwangerschaftstest negativ obwohl schwanger)
❗️es wird kein signifikantes Ergebnis/Effekt gefunden, obwohl einer vorhanden ist
Was beeinflusst den ßFehler + psychologisches Beispiel nennen.
Beeinflussung durch:
• Höhe des Signifikanzniveaus (je höher aNiveau, desto niedriger ßFehler)
• Stichprobenumfang (je größer Stichprobe, desto niedriger ßFehler)
• Größe des stat. Effekts (je größer Unterschiede/Zusammenhänge, desto niedriger ßFehler)
• Streuung des Merkmals (umso homogener die Stichprobe, desto niedriger ßFehler)
• Ein- oder zweiseitige Testung (zweiseitige Testung Risiko auf größeren ßFehler)
• abhängige/unabhängige Stichproben (unabhängige Stichproben Risiko auf größeren ßFehler)
• Teststärke (größere Teststärke führt zu niedrigerem ßFehler)
_________________________________________________
Psychologisches Beispiel: In einer Studie mit 10 Personen wird ein neues Therapieverfahren mit einem bestehendem verglichen. Statistiken ergeben, dass neue Form nicht signifikant besser ist, obwohl dies in Wirklichkeit der Fall ist. Die Nullhypothese (kein signifikanter Unterschied) wird trotz gültiger Alternativhypothese (es gibt einen signifikanten Unterschied) beibehalten.(Gründe: geringe Stichprobengröße oder ungünstige Ziehung der Stichprobe)
Erklären Sie die Teststärke?
Teststärke = Power:
• die Wahrscheinlichkeit, einen Effekt zu entdecken, wenn dieser tatsächlich vorhanden ist, also korrekterweise eine falsche Nullhypothese zu verwerfen
• verläuft gegenläufig zum ßFehler
Was beeinflusst die Teststärke, wie kann diese erhöht werden?
• Höhe des Signifikanzniveaus (je höher aNiveau, desto größer ist Teststärke) 🅰️
• Höhe des ßFehlers (geringerer ßFehler führt zu größerer Teststärke)
• Größe des stat. Effekts (je größer, desto größer ist Teststärke) 👊🏼
• Stichprobenumfang (größere Stichprobe führt zu größerer Teststärke) 🪐
• Streuung des Merkmals (homogene Stichprobe führt zu größerer Teststärke) 🍩
• Ein- oder zweiseitige Testung (Teststärke bei einseitiger Testung größer) ⬅️↔️
• Abhängige/unabhängige Stichproben (Teststärke bei Abhängigen größer) 🍺
• Experimenteller Fehler (Störvariablen möglichst eliminieren)
• Informationsgehalt der Ausgangsdaten (hohes Skalenniveau führt zu hoher Teststärke)ℹ️
• Voraussetzungen an die Verteilung: je mehr Voraussetzungen erfüllt (Normalverteilung, Varianzhomogenität) desto größer Teststärke
• Auswahl des statistischen Verfahrens: parametrische Tests sind Teststärker
ALLE FAKTOREN, DIE ßFEHLER SENKEN, ERHÖHEN DIE TESTSTÄRKE (1-ß)
Was versteht man unter dem optimalen Stichprobenumfang?
• Bestimmung der optimalen Stichprobengröße a priori für Planung einer Untersuchung von großer Bedeutung, da:
• Stichprobenumfang einen entscheidenden Einfluss auf Standardfehler und die beiden Fehlerarten a und ß hat
❗️zu kleine Stichprobe: erschwert die statistische Absicherung eines in der Population vorhandenen relevanten Effekts
❗️zu große Stichprobe: es kann passieren, dass für die Praxis unbedeutende Effekte statistisch bedeutsam/ signifikant werden
• optimaler Stichprobenumfang ist aus statistischer Sicher also eher eine Mindestgröße (Stichprobe sollte gerade groß genug gewählt wird, um einen für die Praxis relevanten Effekt statistisch abzusichern)
Folgendes ist für Stichprobenplanung wichtig:
• A priori, also schon bei der Planung der Untersuchung, sollten optimaler Stichprobenumfang und Effektgröße berücksichtigt werden
• es sollte überlegt werden, ob und wie groß die erwarteten Effekte sind (enormer Aufwand einer Untersuchung ist nur sinnvoll, wenn ein Effekt aufgrund der Stichprobengröße statistisch bedeutsam ist)
• Deshalb sollten über den optimalen Stichprobenumfang die minimale Anzahl der notwendigen Teilnehmer ermittelt werden