Verfahren zur Überprüfung von Unterschiedshypothesen mit mehr als zwei Gruppen Flashcards
Worum geht es in der psychologischen Forschung häufig in Bezug auf Unterschiedshypothesen?
- beschäftigt sich häufig mit Unterschiedshypothesen über zwei oder mehr Gruppen
> z.B. Experimental- und Kontrollgruppen oder verschiedene demografische Gruppen
Welche statistischen Werkzeuge werden verwendet, um Unterschiede zwischen mehr als zwei Gruppen zu untersuchen?
- Die Varianzanalyse (ANOVA)
Warum ist der t-Test für Untersuchungen mit mehr als zwei Gruppen nicht geeignet?
Der t-Test ist nicht geeignet, weil er nur für den Vergleich von zwei Gruppen verwendet wird und nicht für mehrere Gruppen
Was ist die Varianzanalyse und wofür wird sie verwendet?
- ein statistisches Verfahren
- um Unterschiedshypothesen über Mittelwerte zu testen
> insbesondere wenn mehr als zwei Gruppen vorhanden sind
Warum wird die Varianzanalyse manchmal als irreführend betrachtet?
- Der Begriff “Varianzanalyse” kann irreführend sein
> weil sie Hypothesen über Gruppenmittelwerte testet und nicht unbedingt über Varianzen
Welche Art von Hypothesen werden mit der Varianzanalyse getestet?
Mit der Varianzanalyse werden Hypothesen über Unterschiede zwischen Gruppenmittelwerten getestet
Was ist eine naheliegende Lösung, um das Problem mit multiple Tests zu lösen?
Eine naheliegende Lösung sind multiple Tests
- bei denen jede mögliche Kombination von Faktorstufen mit t-Tests untersucht wird
Welches Problem entsteht mit der Anzahl der Gruppen in Bezug auf multiple Tests?
Mit der Anzahl der Gruppen explodiert die Anzahl der möglichen Vergleiche
Wie ändert sich die Anzahl der möglichen Vergleiche mit der Anzahl der Gruppen?
Bei mehr Gruppen gibt es eine exponentielle Zunahme der möglichen Vergleiche
Was ist ein weiteres Problem, das mit multiple Tests verbunden ist?
- die α-Inflation
> bei der das kumulierte Fehlerniveau bei multiplen unabhängigen Tests zunimmt
Wie wirkt sich die Durchführung von mehreren unabhängigen Tests auf die Wahrscheinlichkeit aus, die Nullhypothese richtig beizubehalten?
Die Wahrscheinlichkeit, die Nullhypothese richtig beizubehalten, nimmt ab, wenn mehrere unabhängige Tests durchgeführt werden
Wie wird die kumulierte Wahrscheinlichkeit berechnet, bei mehreren unabhängigen Tests die korrekte Entscheidung zu treffen?
Die kumulierte Wahrscheinlichkeit wird berechnet als 1 minus das Produkt aus (1 minus α) für die Anzahl der Tests
Was ist α-Inflation und wann tritt sie auf?
- α-Inflation tritt auf, wenn das kumulierte Fehlerniveau bei multiplen unabhängigen Tests zunimmt
> was zu einer erhöhten Wahrscheinlichkeit führt, fälschlicherweise einen Unterschied festzustellen
Was ist ein besserer Weg, um die Nullhypothese zu testen, anstatt multiple unabhängige t-Tests durchzuführen?
- Ein besserer Weg ist die Verwendung der Varianzanalyse
- die speziell entwickelt wurde, um Unterschiede zwischen Gruppen zu untersuchen
Welche Terminologie wird für die Varianzanalyse (ANOVA) benötigt?
Für die Varianzanalyse benötigen wir eine klare Terminologie zur Bezeichnung von Faktoren und Faktorstufen
Wie wird der zu untersuchende Faktor A bezeichnet?
Der zu untersuchende Faktor A wird genannt
Wie werden die verschiedenen Faktorstufen benannt?
- werden mit dem Index i bezeichnet
> wobei i = 1, …, p
Wie wird jede Person innerhalb einer Faktorstufe gekennzeichnet?
- Jede Person innerhalb einer Faktorstufe wird mit dem Index k bezeichnet
> wobei k = 1, …, ni
Wie wird jeder Wert der abhängigen Variablen genau definiert?
Jeder Wert der abhängigen Variablen wird als yik definiert
Was bedeutet yik in diesem Kontext?
yik bezeichnet die Beobachtung von Person k in Faktorstufe i
Wie würde beispielsweise der Wert y11 interpretiert werden?
er Wert y11 wäre die Bewertung der ersten Person in der ersten Faktorstufe
Was ist die Varianz und welche Information liefert sie?
- ein statistisches Maß für die Variabilität von Werten
- Sie beschreibt die mittlere quadrierte Abweichung aller Werte vom Mittelwert
Wie wird der wahre globale Mittelwert definiert und wie wird der beobachtete globale Mittelwert bezeichnet?
- Der wahre globale Mittelwert wird als μ definiert
- während der beobachtete globale Mittelwert als Y bezeichnet wird
Wie wird die Varianz berechnet?
Die Varianz wird erhalten, indem der Abstand jedes Messwerts zum globalen Mittelwert erfasst, quadriert und die Summe durch die Anzahl der Freiheitsgrade geteilt wird
Was ist die Grundidee der ANOVA?
Die Grundidee der ANOVA besteht darin, die Varianz entsprechend dem Effektmodell in die Varianz aufzuschlüsseln, die durch den Einfluss des Faktors entsteht, und die Residualvarianz
Wie wird die Varianz gemäß dem Effektmodell in der ANOVA aufgeschlüsselt?
- durch den Einfluss des Faktors (systematische Unterschiede zwischen den Faktorstufen)
- die Residualvarianz (unsystematische Unterschiede zwischen Personen innerhalb der Faktorstufen)
Warum werden in der ANOVA Quadratsummen betrachtet, obwohl von Varianz die Rede ist?
Obwohl in der ANOVA Quadratsummen betrachtet werden, wird dennoch von Varianzanalyse gesprochen
> da Quadratsummen und Varianzen direkt miteinander in Verbindung stehen
Was ist die Fehlerquadratsumme in Bezug auf die ANOVA?
- Die Fehlerquadratsumme ist die Variabilität innerhalb der Gruppen
- die nicht durch den Faktor beeinflusst wird
> und wird in der ANOVA als Maß für diese Variabilität verwendet
Wie entsteht die Variabilität innerhalb der Faktorstufen?
Personen innerhalb der Faktorstufen können sich aufgrund verschiedener Einflüsse unterscheiden, was zur Variabilität innerhalb der Gruppen führt
Warum dürfen die Unterschiede innerhalb der Faktorstufen nicht durch den Faktor beeinflusst sein?
Da alle Personen mit derselben Faktorstufe zu tun hatten, dürfen die Unterschiede innerhalb der Faktorstufen nicht durch den Faktor beeinflusst sein
Wie wird die Fehlerquadratsumme berechnet?
Die Fehlerquadratsumme berechnet sich als Summe der quadrierten Abweichungen aller Werte von ihren gruppenspezifischen Mittelwerten
Wie unterscheidet sich die Fehlerquadratsumme von der Variabilität zwischen den Gruppen?
- Die Fehlerquadratsumme misst die Variabilität innerhalb der Gruppen
- die Variabilität zwischen den Gruppen ist die Quadratsumme zu Lasten des Faktors (die die Variabilität zwischen den Gruppen beschreibt)
Was besagt die Nullhypothese bezüglich der Gruppenmittelwerte?
Die Nullhypothese besagt, dass sich die Gruppenmittelwerte nicht voneinander unterscheiden
Warum muss die Varianz der Gruppenmittelwerte unter der Nullhypothese 0 sein?
Wenn alle Gruppenmittelwerte gleich sind, gibt es keine Varianz um den globalen Mittelwert
Wie sind mittlere Quadratsummen mit Varianzen verbunden?
- Mittlere Quadratsummen sind Schätzer für Varianzen
- Wenn wir beispielsweise die Fehlerquadratsumme durch ihre Freiheitsgrade teilen, erhalten wir einen erwartungstreuen Schätzer für die Fehler- bzw. Residualvarianz
Was ist der erwartungstreue Schätzer für die Fehler- bzw. Residualvarianz?
die Fehlerquadratsumme geteilt durch ihre Freiheitsgrade
Wie verändert sich die mittlere Quadratsumme der Abweichungen zwischen den Gruppen, wenn es einen Effekt gibt?
Wenn es einen Effekt gibt, ist die mittlere Quadratsumme der Abweichungen zwischen den Gruppen größer als die geschätzte Fehlervarianz
Was ist der entscheidende Test in der ANOVA und worauf bezieht er sich?
- Der entscheidende Test in der ANOVA ist der F-Test
> bezieht sich auf das Verhältnis der Varianz zwischen den Gruppen zur Varianz innerhalb der Gruppen
Wie wird das Verhältnis zwischen der Varianz zwischen den Gruppen und der Varianz innerhalb der Gruppen im F-Test dargestellt?
wird im F-Test dargestellt
Was ist die F-Verteilung und wie wird sie definiert?
- Wird durch zwei Parameter definiert
> Die Freiheitsgrade des Zählers (df1)
> Die Freiheitsgrade des Nenners (df2)
Wie wird der p-Wert im Zusammenhang mit dem F-Test verwendet?
- Der p-Wert quantifiziert die Wahrscheinlichkeit, einen ebenso großen oder noch größeren F-Wert zu erhalten, wenn die Nullhypothese zutrifft
Wann lehnen wir die Nullhypothese im F-Test ab?
Wenn der p-Wert kleiner als das Signifikanzniveau (α) ist
> schließen daraus, dass die Faktorstufenmittelwerte nicht alle identisch sind und der Faktor einen Effekt hat
Was sind standardisierte Effektstärkemaße und warum sind sie wichtig?
- sind wichtige Metriken
- um die Stärke von Effekten in statistischen Analysen zu quantifizieren und zu vergleichen
Was ist η² (Eta-Quadrat) und was beschreibt es im Kontext der ANOVA?
- η² (Eta-Quadrat) beschreibt den Anteil der beobachteten Variabilität
- der auf den Faktor zurückgeht, im Kontext der ANOVA auch bekannt als “Anteil der erklärten Varianz”
Warum wird η² als Effektstärkemaß bei der ANOVA häufig verwendet?
η² wird häufig als Effektstärkemaß bei der ANOVA verwendet, weil es den Anteil der Varianz angibt, der durch den Faktor erklärt wird
Welches Effektstärkemaß weist weniger Verzerrung als η² auf und warum wird es als besser angesehen?
- ω² (Omega-Quadrat) weist weniger Verzerrung als η² auf
> wird als besser angesehen, da es ein erwartungstreuerer Schätzer der Effektstärke ist
Wie können wir mithilfe der erwarteten Effektstärke die benötigte Stichprobengröße vor einem Experiment festlegen?
- Mithilfe der erwarteten Effektstärke können wir vor einem Experiment die benötigte Stichprobengröße festlegen
> um die Teststärke des Tests zu bestimmen
Was ist die Power eines Tests und wie wird sie durch Effektstärke, Stichprobengröße und das α-Niveau beeinflusst?
Die Power eines Tests ist die Wahrscheinlichkeit, ein signifikantes Ergebnis zu beobachten, wenn die Nullhypothese nicht zutrifft
> Sie wird durch die Effektstärke, die Stichprobengröße und das α-Niveau beeinflusst
Was ist Cohens f und wie wird es in der Poweranalyse verwendet?
- Cohens f ist ein Effektstärkemaß
- wird in der Poweranalyse verwendet, um die Stichprobengröße für eine bestimmte erwartete Effektstärke und Teststärke zu ermitteln
Welche Software kann für eine A-priori-Poweranalyse verwendet werden?
Software wie R oder G*Power
> um die benötigte Stichprobengröße für eine bestimmte erwartete Effektstärke sicherzustellen
Was bezeichnet man als Omnibus-Test in der ANOVA und welche Nullhypothese wird dabei getestet?
- Der F-Test in der ANOVA wird als Omnibus-Test bezeichnet
- testet die globale Nullhypothese, dass alle Gruppen auf Populationsebene gleich sind
Was bedeutet es, wenn die Nullhypothese im Omnibus-Test abgelehnt wird?
Dann nehmen wir an, dass es zumindest einen Unterschied zwischen den Gruppen gibt
> wissen aber nicht, welche Gruppen sich unterscheiden
Warum ist es wichtig, den Mittelwertsverlauf zu visualisieren, nachdem der F-Test durchgeführt wurde?
- Es ist wichtig, den Mittelwertsverlauf zu visualisieren
- um zu sehen, welche Gruppen sich mehr oder weniger unterscheiden
- um die Ergebnisse des statistischen Tests besser interpretieren zu können
Was sind Post-hoc-Tests und wann werden sie durchgeführt?
- sind statistische Tests, die nach dem signifikanten Omnibus-F-Test durchgeführt werden
> um festzustellen, welche spezifischen Gruppen sich voneinander unterscheiden
Warum ist es wichtig, Post-hoc-Tests durchzuführen, nachdem der Omnibus-F-Test abgeschlossen wurde?
- um die spezifischen Unterschiede zwischen den Gruppen zu identifizieren
> da der Omnibus-F-Test lediglich feststellt, ob es überhaupt Unterschiede zwischen den Gruppen gibt, aber nicht welche Gruppen sich unterscheiden
Welche Funktion erfüllt die Bonferroni-Methode im Zusammenhang mit Post-hoc-Tests?
- Die Bonferroni-Methode wird im Zusammenhang mit Post-hoc-Tests verwendet
- um das Signifikanzniveau anzupassen und die Wahrscheinlichkeit von Fehlern des ersten Typs zu reduzieren, die durch multiple Vergleiche entstehen können
Was sind paarweise t-Tests und wie werden sie verwendet, um Mittelwerte post-hoc zu überprüfen?
Paarweise t-Tests werden verwendet, um die Mittelwerte von verschiedenen Gruppen miteinander zu vergleichen, nachdem ein signifikanter Omnibus-F-Test durchgeführt wurde
Welches Problem tritt bei der Durchführung multipler unabhängiger t-Tests auf, wenn die Nullhypothese zutrifft?
Bei der Durchführung multipler unabhängiger t-Tests kumulieren sich die Fehlerwahrscheinlichkeiten, was zu einem erhöhten Risiko von Fehlern des ersten Typs führt, insbesondere wenn die Nullhypothese für jeden Test abgelehnt wird
Wie funktioniert die Bonferroni-Korrektur und welches Ziel verfolgt sie?
- reduziert das Signifikanzniveau jedes einzelnen Tests
- um sicherzustellen, dass das kumulierte Fehlerrisiko für die Familie an durchgeführten Tests das gewünschte Niveau nicht überschreitet
Was sind die Nachteile der Bonferroni-Korrektur?
Die Bonferroni-Korrektur führt zu einer geringeren Teststärke, da das Signifikanzniveau jedes einzelnen Tests verringert wird
- was die Wahrscheinlichkeit erhöht, einen tatsächlichen Unterschied zwischen den Gruppen nicht zu finden
> Außerdem ist die Korrektur zu konservativ
Warum sinkt die Power der Tests bei Verwendung der Bonferroni-Korrektur?
- da das Signifikanzniveau jedes einzelnen Tests verringert wird
- was die Wahrscheinlichkeit erhöht, einen tatsächlichen Unterschied zwischen den Gruppen nicht zu finden
Was ist der Scheffé-Test und wie unterscheidet er sich von der Bonferroni-Korrektur?
Der Scheffé-Test ist eine Alternative zur Bonferroni-Korrektur
- die weniger konservativ ist und daher eine höhere Teststärke bietet
> Er kontrolliert das Familienfehlerrisiko, ohne das Signifikanzniveau jedes einzelnen Tests zu reduzieren
Was untersucht die einfaktorielle ANOVA?
Die einfaktorielle ANOVA untersucht den Effekt eines einzelnen Faktors auf die abhängige Variable (AV)
Wie wird die Variabilität innerhalb der Faktorstufen in der einfaktoriellen ANOVA betrachtet?
- Die Variabilität innerhalb der Faktorstufen wird als Fehlervarianz betrachtet
> wobei angenommen wird, dass Abweichungen zufällig sind
Warum ist die Annahme, dass Abweichungen innerhalb der Faktorstufen zufällig sind, eine starke Annahme?
Diese Annahme ist stark, da es andere Faktoren geben kann, die die abhängige Variable auch innerhalb einer Stufe beeinflussen können
Welche Voraussetzungen gelten für die zweifaktorielle ANOVA?
Die Voraussetzungen für die zweifaktorielle ANOVA sind dieselben wie für die einfaktorielle ANOVA
Was ist der Hauptunterschied zwischen der einfaktoriellen und der zweifaktoriellen ANOVA?
- Der Hauptunterschied liegt im Effektmodell
- In der zweifaktoriellen ANOVA werden sowohl der Effekt des Faktors A als auch der Effekt des Faktors B betrachtet
Wie können wir den globalen Effekt in einer zweifaktoriellen ANOVA ausdrücken?
Der globale Effekt wird vollständig durch die Effekte der beiden Faktorstufen ausgedrückt, deren Kombination die Gruppe definiert
Was bezeichnet man als Haupteffekt in einer zweifaktoriellen ANOVA?
Der Haupteffekt ist der Effekt, der auf den alleinigen Einfluss eines Faktors zurückzuführen ist
Was bedeutet es, wenn der Effekt eines Faktors von den Stufen des anderen Faktors abhängt?
Wenn der Effekt eines Faktors von den Stufen des anderen Faktors abhängt, bedeutet dies, dass sich der Effekt eines Faktors je nach den verschiedenen Ausprägungen des anderen Faktors ändert
Wie erfolgt die Berechnung der Quadratsummen in einer zweifaktoriellen ANOVA im Vergleich zur einfaktoriellen ANOVA?
- Die Berechnung der Quadratsummen erfolgt analog zur einfaktoriellen ANOVA
> jedoch mit Berücksichtigung der Interaktion zwischen den Faktoren
Welche Unterschiede gibt es bei der Berechnung der Quadratsummen zu Lasten der Hauptfaktoren (QSA und QSB) im Vergleich zur einfaktoriellen ANOVA?
Die Berechnung der Quadratsummen zu Lasten der Hauptfaktoren (QSA und QSB) erfolgt identisch zur einfaktoriellen ANOVA mit jeweils einem der Hauptfaktoren
Warum ist die QSE bei einer zweifaktoriellen ANOVA in der Regel kleiner als bei einer einfaktoriellen ANOVA mit den gleichen Daten und nur einem der beiden Faktoren?
da ein Teil der Variabilität immer auf den jeweils anderen Faktor und die Interaktion zurückzuführen ist
> was zu einer Verringerung der Fehlervarianz führt
Wie können wir bei der mehrfaktoriellen ANOVA η2 (bzw. ω2) berechnen?
indem wir die Quadratsumme eines Effekts (Haupteffekt oder Interaktion) durch die totale Quadratsumme teilen
Was ist die Idee hinter der Berechnung des partiellen η2 (η2p) bei der mehrfaktoriellen ANOVA?
Die Idee ist, alle Effekte außer dem interessierenden Effekt bei der Berechnung der Effektstärke auszuschließen
> um ein genaueres Bild des interessierenden Effekts zu erhalten
Wie wird der partielle η2 (η2p) berechnet und was sagt seine Größe im Vergleich zu η2 aus?
Der partielle η2 (η2p) wird berechnet, indem die interessierende Quadratsumme durch die Summe der Effekt-Quadratsumme und der Fehlerquadratsumme geteilt wird
η2p muss mindestens so groß wie η2 sein und kann größer sein, wenn andere Quadratsummen größer als 0 sind.
Wann steuern Personen in einem Experiment oft mehrere Datenpunkte bei?
- wenn der Effekt eines Faktors über die Zeit hinweg untersucht wird
oder
- wenn verschiedene Faktorstufen innerhalb derselben Person getestet werden
Was sind Beispiele für Experimente, bei denen jede Person Daten zu mehr als einer Faktorstufe beiträgt?
- Experimente, bei denen der Erfolg eines Treatments über die Zeit hinweg betrachtet wird
- Experimente, bei denen die Auswirkung verschiedener Materialien auf die Leistung einer Person getestet wird
Was versteht man unter einem Messwiederholungsdesign oder Within-Subjects-Design?
liegt vor, wenn alle Personen in einem Experiment in allen Faktorstufen auftauchen, sodass jede Person mehrere Datenpunkte beisteuert
Wie wird im Effektmodell der ANOVA mit Messwiederholung die Abweichung eines individuellen Messwerts vom globalen Mittelwert ausgedrückt?
Die Abweichung wird als:
- lineare Kombination des Effekts des Faktors
- des Effekts der Person
- und eines Restfehlers definiert
Was sind die Komponenten des Restfehlers im Effektmodell der ANOVA mit Messwiederholung?
Der Restfehler besteht aus der Interaktion zwischen dem Faktor und der Person sowie einem unsystematischen Fehler
Warum ist es im Design der ANOVA mit Messwiederholung oft schwierig, den Interaktionseffekt und den unsystematischen Fehler voneinander zu trennen?
- Hier können beide Komponenten des Restfehlers nicht voneinander getrennt werden
> was es schwierig macht, den Interaktionseffekt und den unsystematischen Fehler zu unterscheiden
Wie unterscheidet sich die Quadratsummenzerlegung in der ANOVA mit Messwiederholung vom bisherigen Vorgehen?
In der ANOVA mit Messwiederholung wird die totale Quadratsumme nicht in Fehler- und Effektquadratsummen unterteilt
Welche beiden Quadratsummen werden in der ANOVA mit Messwiederholung unterschieden?
- Die Quadratsumme innerhalb der Personen (QSin)
- die Quadratsumme zwischen den Personen (QSzw)
Was ist ein Vorteil der ANOVA mit Messwiederholung im Vergleich zu einer “normalen” ANOVA?
Ein Vorteil ist, dass ein Messwiederholungsdesign teststärker ist, da weniger Versuchsteilnehmer benötigt werden
Warum wird die Fehlerquadratsumme in einem Messwiederholungsdesign reduziert?
Die Fehlerquadratsumme wird reduziert, da bewusst der Teil der Variabilität zwischen Personen herausgerechnet wird
> was die MQSE kleiner macht
Wann ist die Durchführung einer Messwiederholung möglicherweise nicht möglich oder sinnvoll?
- wenn es nicht praktikabel ist, den gleichen Versuch an denselben Personen mehrmals durchzuführen
> z.B. einer klinischen Studie, in der einem Patienten nicht zunächst ein Treatment oder ein Training gegeben und dann nicht gegeben werden kann
Welche Voraussetzungen gelten für die Residuen in der Messwiederholungs-ANOVA?
Die Residuen sollten normalverteilt sein mit gleicher Varianz
Was ist die Annahme der Sphärizität und warum ist sie wichtig?
Die Sphärizität besagt, dass die Varianz von Messwertunterschieden zwischen zwei Faktorstufen für alle Paare von Faktorstufen gleich ist
> Dies ist wichtig, um die Gültigkeit der ANOVA-Ergebnisse sicherzustellen
Wie wird die Sphärizitätsannahme in der Praxis überprüft und was passiert, wenn sie verletzt ist?
- wird mittels des Mauchly-Tests überprüft
> Wenn die Annahme verletzt ist, werden die Freiheitsgrade korrigiert, um eine verzerrte Teststärke zu vermeiden
Was sind die Freiheitsgrade ε und wie werden sie berechnet?
- Die Freiheitsgrade ε werden verwendet, um die Sphärizitätsverletzung zu korrigieren
> werden entweder nach der Prozedur von Greenhouse-Geisser oder Huynh-Feldt berechnet
Welche Korrekturverfahren werden bei verletzter Sphärizitätsannahme angewendet, und wie unterscheiden sie sich?
- Die Korrekturverfahren nach Greenhouse-Geisser und Huynh-Feldt werden angewendet
> Die Greenhouse-Geisser-Korrektur ist etwas konservativer und reduziert die Freiheitsgrade stärker als die Huynh-Feldt-Korrektur
Was ist Transitivität?
- „Übertragbarkeit“
- Eigenschaft von Bayes-Faktoren, nach der sich der Bayes-Faktor zwischen zwei Modellen aus dem Verhältnis der jeweiligen Bayes-Faktoren dieser Modelle gegenüber einem dritten Modell ergibt
Wie wird die Nullhypothese in der bayesianischen Varianzanalyse formuliert und getestet?
- besagt, dass alle gruppenspezifischen Mittelwerte identisch sind
> Sie wird mittels statistischer Modelle und dem Bayes-Faktor getestet
Welche Methode wird im bayesianischen Hypothesentesten verwendet, um Modelle zu vergleichen, und wie wird sie quantifiziert?
Der Bayes-Faktor wird verwendet, um die Evidenz in den Daten für ein Modell im Vergleich zu einem anderen zu quantifizieren
Was repräsentiert der Bayes-Faktor, und was bedeutet ein hoher oder niedriger Wert?
- Der Bayes-Faktor repräsentiert das Verhältnis der Evidenz für ein Alternativmodell gegenüber dem Nullmodell
- Ein hoher Wert deutet auf starke Evidenz für das Alternativmodell hin
> während ein niedriger Wert auf starke Evidenz für das Nullmodell hinweist
Welche Rolle spielt die Prior-Verteilung bei der bayesianischen Varianzanalyse, und welche Spezifikation ist in der Psychologie am weitesten verbreitet?
- Die Prior-Verteilung wird verwendet, um den möglichen Effekt unter der Alternativhypothese zu spezifizieren
> Die Spezifikation nach Rouder et al. ist in der Psychologie am weitesten verbreitet
Was sind die Hauptkonzepte der bayesianischen Varianzanalyse, und wie werden sie angewendet?
- Die Hauptkonzepte umfassen die Formulierung statistischer Modelle
- den Vergleich dieser Modelle mit dem Bayes-Faktor
- die Bewertung der Evidenz für oder gegen einen Effekt
Was sind die drei wichtigen Annahmen, die der ANOVA zugrunde liegen?
- die Unabhängigkeit der Messwerte
- die Normalverteilung der Residuen
- die Varianzhomogenität
Wie wird mit Verletzungen der Unabhängigkeitsannahme umgegangen, und was ist eine mögliche Lösung?
- Bei Verletzungen der Unabhängigkeitsannahme wird eine ANOVA mit Messwiederholung durchgeführt
> wenn eine Person mehrere Messwerte beisteuert
Warum sollten die Annahmen der Normalverteilung der Residuen und der Varianzhomogenität vor der Durchführung der ANOVA geprüft werden?
Um sicherzustellen, dass die ANOVA gültig ist und die Fehlerwahrscheinlichkeiten der Testprozedur kontrolliert werden können
Unter welchen Bedingungen ist die ANOVA robust gegenüber Verletzungen der Annahmen?
> Die ANOVA ist robust bei großen Stichproben und in balancierten Designs
Was ist die Empfehlung, wenn starke Abweichungen bei den Annahmen auftreten, insbesondere bei kleinen Stichproben und ungleichen Gruppengrößen?
Es kann ratsam sein, auf andere Tests auszuweichen, die weniger starke Annahmen machen und robuster sind als die ANOVA
Was ist der Welch-Test, und wie unterscheidet er sich von der traditionellen ANOVA bei Verletzungen der Annahme der Homoskedastizität?
- Der Welch-Test ist eine Alternative zur ANOVA, die bei Verletzungen der Homoskedastizitätsannahme angewendet wird
> Er korrigiert die Freiheitsgrade der Fehlerquadratsumme, um die Fehlerwahrscheinlichkeiten der Testprozedur zu kontrollieren
Welche Annahme macht das statistische Modell der ANOVA bezüglich der Verteilung der Messwerte?
Das statistische Modell der ANOVA geht von normalverteilten Messwerten aus
Was ist ein nichtparametrischer Test, und wann wird er verwendet?
Ein nichtparametrischer Test wird verwendet, wenn die Annahmen parametrischer Tests, wie die Normalverteilungsannahme, nicht erfüllt sind
Was ist die visuelle Inspektion, und wie kann sie zur Überprüfung der Normalverteilungsannahme genutzt werden?
- die visuelle Inspektion ist die Betrachtung von Daten in Grafiken
- Sie kann genutzt werden, um die Normalverteilungsannahme zu überprüfen
> indem man die Daten in einem Q-Q-Diagramm visualisiert
Was ist ein Q-Q-Diagramm, und wie wird es verwendet, um die Normalverteilungsannahme zu überprüfen?
- Ein Q-Q-Diagramm trägt die beobachteten Quantile der Daten gegen die theoretischen Quantile der Normalverteilung ab
> Wenn die Daten normalverteilt sind, liegen die Punkte entlang einer Diagonalen
Was ist der Shapiro-Wilk-Test, und was testet er?
Der Shapiro-Wilk-Test testet die Nullhypothese, dass die Daten normalverteilt sind
Welche Einschränkungen hat der Shapiro-Wilk-Test in Bezug auf die Stichprobengröße?
Der Shapiro-Wilk-Test hat eine eingeschränkte Teststärke bei kleinen Stichproben und kann bei sehr großen Stichproben auch bei normalverteilten Daten signifikant sein
Warum ist es wichtig, den Shapiro-Wilk-Test nicht isoliert zu betrachten und ihn mit einer visuellen Inspektion der Daten zu kombinieren?
- es ist wichtig, den Shapiro-Wilk-Test nicht isoliert zu betrachten, da er abhängig von der Stichprobengröße ist
> Eine Kombination mit einer visuellen Inspektion der Daten ermöglicht eine zuverlässigere Überprüfung der Normalverteilungsannahme
Was ist der Kruskal-Wallis-Test, und wann wird er angewendet?
- st ein nichtparametrischer Test
> der verwendet wird, wenn die Normalverteilungsannahme für eine ANOVA verletzt ist und die Daten nicht intervallskaliert sind
Wie unterscheidet sich der Kruskal-Wallis-Test von der ANOVA in Bezug auf die Datenanalyse?
- Beim Kruskal-Wallis-Test werden die Daten in Rangreihen gebracht und die Rangwerte analysiert
> anstatt die beobachteten Messwerte direkt zu verwenden
Wie werden die Daten für den Kruskal-Wallis-Test vorbereitet?
Die Daten werden in eine Rangreihe gebracht, indem sie der Größe nach geordnet werden
Was ist der Vorteil des Kruskal-Wallis-Tests gegenüber der ANOVA?
- Der Kruskal-Wallis-Test erfordert keine Annahme über die Verteilung der Daten
- da er sich auf Rangwerte konzentriert, die lediglich die Reihenfolge der Messwerte berücksichtigen
Was passiert, wenn die Nullhypothese beim Kruskal-Wallis-Test abgelehnt wird?
Wenn die Nullhypothese abgelehnt wird, bedeutet dies, dass mindestens eine Gruppe signifikant von den anderen Gruppen abweicht
Welche Verteilung hat die Kruskal-Wallis-Statistik unter der Nullhypothese, und wie viele Freiheitsgrade hat sie?
Die Kruskal-Wallis-Statistik ist unter der Nullhypothese χ2-verteilt mit 𝑝−1
Freiheitsgraden
> wobei 𝑝 die Anzahl der Gruppen ist
Welche Annahmen gelten für die ANOVA mit Messwiederholung?
Die Annahmen sind, dass die Daten intervallskaliert und normalverteilt sind
Was ist der Friedman-Test, und wann wird er angewendet?
- Der Friedman-Test ist ein parameterfreier Test für Messwiederholungsdesigns
- der auf der Analyse der Messwert-Rangfolge basiert
- Er wird angewendet, wenn die Daten nicht intervallskaliert sind oder die Normalverteilungsannahme verletzt ist
Wie wird die Teststatistik des Friedman-Tests unter der Nullhypothese verteilt?
Die Teststatistik des Friedman-Tests ist unter der Nullhypothese χ2-verteilt mit 𝑝−1 Freiheitsgraden
> wobei p die Anzahl der Faktorstufen ist
Was ist der Quade-Test, und wie unterscheidet er sich vom Friedman-Test?
- ist eine weitere nichtparametrische Alternative zur ANOVA mit Messwiederholung
- Er basiert ebenfalls auf der Rangfolge der Messwerte,
- ist jedoch teststärker für eine kleinere Anzahl von Faktorstufen im Vergleich zum Friedman-Test
Welche Verteilung hat die Teststatistik des Quade-Tests unter der Nullhypothese?
Die Teststatistik des Quade-Tests folgt unter der Nullhypothese einer F-Verteilung mit 𝑑𝑓1 = p – 1
und 𝑑𝑓2 = N – 1(p – 1) Freiheitsgraden
Wann wird die Nullhypothese bei Friedman- und Quade-Test abgelehnt?
wenn der p-Wert der beobachteten Teststatistik unter dem spezifizierten α-Niveau liegt
Warum werden nichtparametrische Verfahren nicht grundsätzlich bevorzugt?
Nichtparametrische Verfahren haben in der Regel eine geringere Teststärke als parametrische Verfahren
Was bedeutet es, wenn ein Test robuster ist?
- Ein robuster Test ist weniger anfällig für Verletzungen seiner Annahmen
- kann daher auch bei ungenauen Annahmen korrekte Ergebnisse liefern
Warum haben nichtparametrische Tests in der Regel eine geringere Teststärke als parametrische Tests?
- Nichtparametrische Tests nutzen weniger Informationen
- da sie nur die Rangordnung von Messwerten berücksichtigen
> während parametrische Tests auch die Abstände zwischen den Werten einbeziehen
Was ist der Nachteil eines Tests, der nur die Rangordnung von Messwerten berücksichtigt?
- Ein solcher Test nutzt weniger Informationen
> was zu einer geringeren Wahrscheinlichkeit führt, einen wahren Effekt in der Population zu entdecken und eine falsche Nullhypothese abzulehnen
Warum ist es wichtig, einen teststarken Test durchzuführen?
Ein teststarker Test hat eine höhere Wahrscheinlichkeit, einen tatsächlichen Effekt zu erkennen
> was die Zuverlässigkeit der Ergebnisse erhöht
Unter welchen Umständen sollten wir auf einen nichtparametrischen Test zurückgreifen?
- Wenn ein parametrischer Test fehlspezifiziert ist und daher zu große Fehlerwahrscheinlichkeiten hat
- sollten wir auf einen robusteren nichtparametrischen Test zurückgreifen
Warum sind multiple Paarvergleiche für die Testung von Hypothesen über mehr als zwei Gruppen ungeeignet?
- Die Zahl der möglichen Tests steigt exponentiell mit der Zahl der Gruppen
> was zu einer Inflation des Fehlerrisikos führt
Was ist die grundlegende Idee hinter der Varianzanalyse (ANOVA)?
Die ANOVA zerlegt die Variation in den Daten in die Teile, die auf den Einfluss der Faktoren zurückgehen, und den Teil, der durch zufällige Fehlereinflüsse entsteht
Wie unterscheidet sich die einfaktorielle ANOVA von der mehrfaktoriellen ANOVA?
- die einfaktorielle ANOVA untersucht den Einfluss eines einzelnen Faktors
- die mehrfaktorielle ANOVA untersucht Haupteffekte und Interaktionen von mehreren Faktoren
Was ist das Besondere an der ANOVA mit Messwiederholung?
Jede Person durchläuft mehrere Faktorstufen, wodurch die Variabilität, die durch systematische Unterschiede zwischen Personen entsteht, aus der Analyse herausgerechnet werden kann
Was ist der Bayes-Faktor und wie wird er in der bayesianischen ANOVA verwendet?
- Der Bayes-Faktor vergleicht statistische Modelle, die die Faktoren entweder enthalten oder nicht
- erfasst auf diese Weise die Evidenz für einen Einfluss der Faktoren
Wann werden robuste nichtparametrische Testverfahren verwendet?
- wenn die Grundannahmen der ANOVA verletzt sind
- wenn keine Verteilungsannahmen getroffen werden können
Welcher Test wird verwendet, wenn die Stichproben zwischen den Faktorstufen unabhängig voneinander sind?
Der Kruskal-Wallis-Test wird verwendet, wenn die Stichproben zwischen den Faktorstufen unabhängig voneinander sind
Welche Tests werden bei abhängigen Stichproben, wie sie in Messwiederholungsdesigns vorkommen, eingesetzt?
Bei abhängigen Stichproben kommen der Friedman-Test oder der Quade-Test zum Einsatz
Was ist eine Voraussetzung der ANOVA mit Messwiederholung?
Sphärizität
Was bedeutet Sphärizität?
Sphärizität bedeutet, dass die Varianzen der Differenzen zwischen allen möglichen Paaren von Messzeitpunkten gleich sind
Welchen Test verwendet man, wenn bei einer einfaktoriellen ANOVA die Varianzhomogenität verletzt ist?
Welche-Test
Die Voraussetzung für Savage-Dickey-Densio-Ratio
Eine Hypothese muss Punkthypothese sein
Einfluss eines Faktors auf abhängige Variable abhängig von einem anderen Faktor heißt …
… Interaktion
Was wird beim globalen F-Test getestet?
- Wird in der Varianzanalyse (ANOVA) und in der multiplen linearen Regression verwendet
> um zu testen, ob mindestens eine der unabhängigen Variablen einen signifikanten Einfluss auf die abhängige Variable hat
Eta-Quadrat = 0,06, Cohens f?
0,252
Wie setzt sich die totale Quadratsumme zusammen?
Welches Verfahren verwendet man bei einem Post-Hoc-Test für eine ANOVA, um Gruppen zu vergleichen?
Bonferroni-Korrektur
Was ist der Unterschied zwischen Eta-Quadrat und partiellem Eta-Quadrat?
- Partielles Eta-Quadrat bezieht sich auf einen spezifischen Effekt
- während Eta-Quadrat die gesamte erklärte Varianz berücksichtigt
Wie setzt sich die QStot bei zweifaktorieller ANOVA zusammen und was sind die Bestandteile?
QStot = QSA + QSB + QSAB + QSE
QSA: Quadratsumme des Faktors A / Varianz, die durch den Faktor A erklärt wird
QSB: Quadratsumme des Faktors B / Varianz, die durch den Faktor B erklärt wird
QSAB: Quadratsumme der Interaktion / Varianz, die durch die Interaktion zwischen Faktor A und B erklärt wird
QSE: Quadratsumme der Fehler / Varianz, die nicht durch die Faktoren und nicht durch deren Interaktion erklärt wird
Was macht die zweifaktorielle VARIANZ?
zerlegt die Gesamtvarianz (Total Sum of Squares, QStot) in:
- die Varianz, die durch die einzelnen Faktoren (A und B),
- deren Interaktion und
- den Fehler (Error)
erklärt wird
Sie erheben Daten in ein einem Messwiederholungsdesign. bei der Analyse rechnen Sie
zunächst versehentlich eine ANOVA ohne Messwdh.
Wie werden sich Ihre Ergebnisse verändern, wenn Sie die korrekte Analysis rechnen?
die QSE wird kleiner