Verfahren zur Überprüfung von Unterschiedshypothesen mit mehr als zwei Gruppen Flashcards
Worum geht es in der psychologischen Forschung häufig in Bezug auf Unterschiedshypothesen?
- beschäftigt sich häufig mit Unterschiedshypothesen über zwei oder mehr Gruppen
> z.B. Experimental- und Kontrollgruppen oder verschiedene demografische Gruppen
Welche statistischen Werkzeuge werden verwendet, um Unterschiede zwischen mehr als zwei Gruppen zu untersuchen?
- Die Varianzanalyse (ANOVA)
Warum ist der t-Test für Untersuchungen mit mehr als zwei Gruppen nicht geeignet?
Der t-Test ist nicht geeignet, weil er nur für den Vergleich von zwei Gruppen verwendet wird und nicht für mehrere Gruppen
Was ist die Varianzanalyse und wofür wird sie verwendet?
- ein statistisches Verfahren
- um Unterschiedshypothesen über Mittelwerte zu testen
> insbesondere wenn mehr als zwei Gruppen vorhanden sind
Warum wird die Varianzanalyse manchmal als irreführend betrachtet?
- Der Begriff “Varianzanalyse” kann irreführend sein
> weil sie Hypothesen über Gruppenmittelwerte testet und nicht unbedingt über Varianzen
Welche Art von Hypothesen werden mit der Varianzanalyse getestet?
Mit der Varianzanalyse werden Hypothesen über Unterschiede zwischen Gruppenmittelwerten getestet
Was ist eine naheliegende Lösung, um das Problem mit multiple Tests zu lösen?
Eine naheliegende Lösung sind multiple Tests
- bei denen jede mögliche Kombination von Faktorstufen mit t-Tests untersucht wird
Welches Problem entsteht mit der Anzahl der Gruppen in Bezug auf multiple Tests?
Mit der Anzahl der Gruppen explodiert die Anzahl der möglichen Vergleiche
Wie ändert sich die Anzahl der möglichen Vergleiche mit der Anzahl der Gruppen?
Bei mehr Gruppen gibt es eine exponentielle Zunahme der möglichen Vergleiche
Was ist ein weiteres Problem, das mit multiple Tests verbunden ist?
- die α-Inflation
> bei der das kumulierte Fehlerniveau bei multiplen unabhängigen Tests zunimmt
Wie wirkt sich die Durchführung von mehreren unabhängigen Tests auf die Wahrscheinlichkeit aus, die Nullhypothese richtig beizubehalten?
Die Wahrscheinlichkeit, die Nullhypothese richtig beizubehalten, nimmt ab, wenn mehrere unabhängige Tests durchgeführt werden
Wie wird die kumulierte Wahrscheinlichkeit berechnet, bei mehreren unabhängigen Tests die korrekte Entscheidung zu treffen?
Die kumulierte Wahrscheinlichkeit wird berechnet als 1 minus das Produkt aus (1 minus α) für die Anzahl der Tests
Was ist α-Inflation und wann tritt sie auf?
- α-Inflation tritt auf, wenn das kumulierte Fehlerniveau bei multiplen unabhängigen Tests zunimmt
> was zu einer erhöhten Wahrscheinlichkeit führt, fälschlicherweise einen Unterschied festzustellen
Was ist ein besserer Weg, um die Nullhypothese zu testen, anstatt multiple unabhängige t-Tests durchzuführen?
- Ein besserer Weg ist die Verwendung der Varianzanalyse
- die speziell entwickelt wurde, um Unterschiede zwischen Gruppen zu untersuchen
Welche Terminologie wird für die Varianzanalyse (ANOVA) benötigt?
Für die Varianzanalyse benötigen wir eine klare Terminologie zur Bezeichnung von Faktoren und Faktorstufen
Wie wird der zu untersuchende Faktor A bezeichnet?
Der zu untersuchende Faktor A wird genannt
Wie werden die verschiedenen Faktorstufen benannt?
- werden mit dem Index i bezeichnet
> wobei i = 1, …, p
Wie wird jede Person innerhalb einer Faktorstufe gekennzeichnet?
- Jede Person innerhalb einer Faktorstufe wird mit dem Index k bezeichnet
> wobei k = 1, …, ni
Wie wird jeder Wert der abhängigen Variablen genau definiert?
Jeder Wert der abhängigen Variablen wird als yik definiert
Was bedeutet yik in diesem Kontext?
yik bezeichnet die Beobachtung von Person k in Faktorstufe i
Wie würde beispielsweise der Wert y11 interpretiert werden?
er Wert y11 wäre die Bewertung der ersten Person in der ersten Faktorstufe
Was ist die Varianz und welche Information liefert sie?
- ein statistisches Maß für die Variabilität von Werten
- Sie beschreibt die mittlere quadrierte Abweichung aller Werte vom Mittelwert
Wie wird der wahre globale Mittelwert definiert und wie wird der beobachtete globale Mittelwert bezeichnet?
- Der wahre globale Mittelwert wird als μ definiert
- während der beobachtete globale Mittelwert als Y bezeichnet wird
Wie wird die Varianz berechnet?
Die Varianz wird erhalten, indem der Abstand jedes Messwerts zum globalen Mittelwert erfasst, quadriert und die Summe durch die Anzahl der Freiheitsgrade geteilt wird
Was ist die Grundidee der ANOVA?
Die Grundidee der ANOVA besteht darin, die Varianz entsprechend dem Effektmodell in die Varianz aufzuschlüsseln, die durch den Einfluss des Faktors entsteht, und die Residualvarianz
Wie wird die Varianz gemäß dem Effektmodell in der ANOVA aufgeschlüsselt?
- durch den Einfluss des Faktors (systematische Unterschiede zwischen den Faktorstufen)
- die Residualvarianz (unsystematische Unterschiede zwischen Personen innerhalb der Faktorstufen)
Warum werden in der ANOVA Quadratsummen betrachtet, obwohl von Varianz die Rede ist?
Obwohl in der ANOVA Quadratsummen betrachtet werden, wird dennoch von Varianzanalyse gesprochen
> da Quadratsummen und Varianzen direkt miteinander in Verbindung stehen
Was ist die Fehlerquadratsumme in Bezug auf die ANOVA?
- Die Fehlerquadratsumme ist die Variabilität innerhalb der Gruppen
- die nicht durch den Faktor beeinflusst wird
> und wird in der ANOVA als Maß für diese Variabilität verwendet
Wie entsteht die Variabilität innerhalb der Faktorstufen?
Personen innerhalb der Faktorstufen können sich aufgrund verschiedener Einflüsse unterscheiden, was zur Variabilität innerhalb der Gruppen führt
Warum dürfen die Unterschiede innerhalb der Faktorstufen nicht durch den Faktor beeinflusst sein?
Da alle Personen mit derselben Faktorstufe zu tun hatten, dürfen die Unterschiede innerhalb der Faktorstufen nicht durch den Faktor beeinflusst sein
Wie wird die Fehlerquadratsumme berechnet?
Die Fehlerquadratsumme berechnet sich als Summe der quadrierten Abweichungen aller Werte von ihren gruppenspezifischen Mittelwerten
Wie unterscheidet sich die Fehlerquadratsumme von der Variabilität zwischen den Gruppen?
- Die Fehlerquadratsumme misst die Variabilität innerhalb der Gruppen
- die Variabilität zwischen den Gruppen ist die Quadratsumme zu Lasten des Faktors (die die Variabilität zwischen den Gruppen beschreibt)
Was besagt die Nullhypothese bezüglich der Gruppenmittelwerte?
Die Nullhypothese besagt, dass sich die Gruppenmittelwerte nicht voneinander unterscheiden
Warum muss die Varianz der Gruppenmittelwerte unter der Nullhypothese 0 sein?
Wenn alle Gruppenmittelwerte gleich sind, gibt es keine Varianz um den globalen Mittelwert
Wie sind mittlere Quadratsummen mit Varianzen verbunden?
- Mittlere Quadratsummen sind Schätzer für Varianzen
- Wenn wir beispielsweise die Fehlerquadratsumme durch ihre Freiheitsgrade teilen, erhalten wir einen erwartungstreuen Schätzer für die Fehler- bzw. Residualvarianz
Was ist der erwartungstreue Schätzer für die Fehler- bzw. Residualvarianz?
die Fehlerquadratsumme geteilt durch ihre Freiheitsgrade
Wie verändert sich die mittlere Quadratsumme der Abweichungen zwischen den Gruppen, wenn es einen Effekt gibt?
Wenn es einen Effekt gibt, ist die mittlere Quadratsumme der Abweichungen zwischen den Gruppen größer als die geschätzte Fehlervarianz
Was ist der entscheidende Test in der ANOVA und worauf bezieht er sich?
- Der entscheidende Test in der ANOVA ist der F-Test
> bezieht sich auf das Verhältnis der Varianz zwischen den Gruppen zur Varianz innerhalb der Gruppen
Wie wird das Verhältnis zwischen der Varianz zwischen den Gruppen und der Varianz innerhalb der Gruppen im F-Test dargestellt?
wird im F-Test dargestellt
Was ist die F-Verteilung und wie wird sie definiert?
- Wird durch zwei Parameter definiert
> Die Freiheitsgrade des Zählers (df1)
> Die Freiheitsgrade des Nenners (df2)
Wie wird der p-Wert im Zusammenhang mit dem F-Test verwendet?
- Der p-Wert quantifiziert die Wahrscheinlichkeit, einen ebenso großen oder noch größeren F-Wert zu erhalten, wenn die Nullhypothese zutrifft
Wann lehnen wir die Nullhypothese im F-Test ab?
Wenn der p-Wert kleiner als das Signifikanzniveau (α) ist
> schließen daraus, dass die Faktorstufenmittelwerte nicht alle identisch sind und der Faktor einen Effekt hat
Was sind standardisierte Effektstärkemaße und warum sind sie wichtig?
- sind wichtige Metriken
- um die Stärke von Effekten in statistischen Analysen zu quantifizieren und zu vergleichen
Was ist η² (Eta-Quadrat) und was beschreibt es im Kontext der ANOVA?
- η² (Eta-Quadrat) beschreibt den Anteil der beobachteten Variabilität
- der auf den Faktor zurückgeht, im Kontext der ANOVA auch bekannt als “Anteil der erklärten Varianz”
Warum wird η² als Effektstärkemaß bei der ANOVA häufig verwendet?
η² wird häufig als Effektstärkemaß bei der ANOVA verwendet, weil es den Anteil der Varianz angibt, der durch den Faktor erklärt wird
Welches Effektstärkemaß weist weniger Verzerrung als η² auf und warum wird es als besser angesehen?
- ω² (Omega-Quadrat) weist weniger Verzerrung als η² auf
> wird als besser angesehen, da es ein erwartungstreuerer Schätzer der Effektstärke ist
Wie können wir mithilfe der erwarteten Effektstärke die benötigte Stichprobengröße vor einem Experiment festlegen?
- Mithilfe der erwarteten Effektstärke können wir vor einem Experiment die benötigte Stichprobengröße festlegen
> um die Teststärke des Tests zu bestimmen
Was ist die Power eines Tests und wie wird sie durch Effektstärke, Stichprobengröße und das α-Niveau beeinflusst?
Die Power eines Tests ist die Wahrscheinlichkeit, ein signifikantes Ergebnis zu beobachten, wenn die Nullhypothese nicht zutrifft
> Sie wird durch die Effektstärke, die Stichprobengröße und das α-Niveau beeinflusst
Was ist Cohens f und wie wird es in der Poweranalyse verwendet?
- Cohens f ist ein Effektstärkemaß
- wird in der Poweranalyse verwendet, um die Stichprobengröße für eine bestimmte erwartete Effektstärke und Teststärke zu ermitteln
Welche Software kann für eine A-priori-Poweranalyse verwendet werden?
Software wie R oder G*Power
> um die benötigte Stichprobengröße für eine bestimmte erwartete Effektstärke sicherzustellen
Was bezeichnet man als Omnibus-Test in der ANOVA und welche Nullhypothese wird dabei getestet?
- Der F-Test in der ANOVA wird als Omnibus-Test bezeichnet
- testet die globale Nullhypothese, dass alle Gruppen auf Populationsebene gleich sind
Was bedeutet es, wenn die Nullhypothese im Omnibus-Test abgelehnt wird?
Dann nehmen wir an, dass es zumindest einen Unterschied zwischen den Gruppen gibt
> wissen aber nicht, welche Gruppen sich unterscheiden
Warum ist es wichtig, den Mittelwertsverlauf zu visualisieren, nachdem der F-Test durchgeführt wurde?
- Es ist wichtig, den Mittelwertsverlauf zu visualisieren
- um zu sehen, welche Gruppen sich mehr oder weniger unterscheiden
- um die Ergebnisse des statistischen Tests besser interpretieren zu können
Was sind Post-hoc-Tests und wann werden sie durchgeführt?
- sind statistische Tests, die nach dem signifikanten Omnibus-F-Test durchgeführt werden
> um festzustellen, welche spezifischen Gruppen sich voneinander unterscheiden
Warum ist es wichtig, Post-hoc-Tests durchzuführen, nachdem der Omnibus-F-Test abgeschlossen wurde?
- um die spezifischen Unterschiede zwischen den Gruppen zu identifizieren
> da der Omnibus-F-Test lediglich feststellt, ob es überhaupt Unterschiede zwischen den Gruppen gibt, aber nicht welche Gruppen sich unterscheiden
Welche Funktion erfüllt die Bonferroni-Methode im Zusammenhang mit Post-hoc-Tests?
- Die Bonferroni-Methode wird im Zusammenhang mit Post-hoc-Tests verwendet
- um das Signifikanzniveau anzupassen und die Wahrscheinlichkeit von Fehlern des ersten Typs zu reduzieren, die durch multiple Vergleiche entstehen können
Was sind paarweise t-Tests und wie werden sie verwendet, um Mittelwerte post-hoc zu überprüfen?
Paarweise t-Tests werden verwendet, um die Mittelwerte von verschiedenen Gruppen miteinander zu vergleichen, nachdem ein signifikanter Omnibus-F-Test durchgeführt wurde
Welches Problem tritt bei der Durchführung multipler unabhängiger t-Tests auf, wenn die Nullhypothese zutrifft?
Bei der Durchführung multipler unabhängiger t-Tests kumulieren sich die Fehlerwahrscheinlichkeiten, was zu einem erhöhten Risiko von Fehlern des ersten Typs führt, insbesondere wenn die Nullhypothese für jeden Test abgelehnt wird
Wie funktioniert die Bonferroni-Korrektur und welches Ziel verfolgt sie?
- reduziert das Signifikanzniveau jedes einzelnen Tests
- um sicherzustellen, dass das kumulierte Fehlerrisiko für die Familie an durchgeführten Tests das gewünschte Niveau nicht überschreitet
Was sind die Nachteile der Bonferroni-Korrektur?
Die Bonferroni-Korrektur führt zu einer geringeren Teststärke, da das Signifikanzniveau jedes einzelnen Tests verringert wird
- was die Wahrscheinlichkeit erhöht, einen tatsächlichen Unterschied zwischen den Gruppen nicht zu finden
> Außerdem ist die Korrektur zu konservativ