3. Einfaktorielle Varianzanalyse Flashcards
Nennen Sie die Voraussetzungen der Varianzanalyse.
- Mindestens Intervallskalenniveau und Normalverteilung innerhalb der Stichprobe bei der abhängigen Variable 🗻
- Mindestens 20 Elemente pro Stichprobe (Gruppe, Zelle) 2️⃣0️⃣
- Ähnlich stark besetzte Gruppen (Zellen) ⚖️
- Varianzhomogenität der abhängigen Variablen zwischen den einzelnen Stichproben
Was bedeutet Varianzhomogenität der einfaktoriellen Varianzanalyse und wie kann diese geprüft werden?
• Varianzhomogenität bedeutet, dass die Varianzen (Streuung) in beiden Gruppen gleich sind 🍩🟰
• Diese muss für die Durchführung einer einfaktoriellen Varianzanalyse erfüllt sein
_________________________________________________
Prüfung der Varianzhomogenität durch:
• Bartlett-Test: Gegenüber Verletzungen der Normalverteilungsannahme sehr empfindlich (sollte eher selten eingesetzt werden), Bartlett-Test nicht signifikant = Varianzhomogenität, basiert auf y-Verteilung
• Levene-test: Durchführung einer einfaktoriellen Varianzanalyse über den Betrag der Abweichungen der individuellen Werte vom Gruppenmittelwert, sehr stabil gegenüber Verletzung der Normalverteilung, progressives Prüfverfahren
• Fmax-Statistik: Durchführung nur bei gleichgroßen Stichproben, hierbei werden die Größte und kleinste Varianz der Faktorstufen ins Verhältnis gesetzt, relativ einfacher Test
Erklären Sie die Bedeutung des Determinantionskoeffizienten R² in einer einfaktoriellen Varianzanalyse.
Definition: ein Gütemaß der linearen Regression, gibt in der einfaktoriellen Varianzanalyse an, wie viel der Variabilität der abhängigen Variablen durch die unabhängige Variable erklärt wird
• die erklärende Varianz wird hierbei zur Gesamtvarianz ins Verhältnis gesetzt
• liegt immer zwischen 0 (0% = unbrauchbares Modell) und 1 (100% = perfekte Modellanpassung) 🚫 - 💯
• je höher der Wert, desto stärker ist die Beziehung zwischen den Variablen (0=die unabhängige Variable hat keinen Einfluss auf die abhängige Variable, 1= die unabhängige Variable erklärt die abhängige Variable vollständig)
Was bedeuten df, SS, MS und p in der Varianzanalyse?
• df: Degrees of Freedom (Freiheitsgrade): beschreiben die Anzahl der Beobachtungen, die für die Berechnung bestimmter statistischer Größen verwendet werden.
• SS: Sum of Squares (Summe der Quadrate): Beschreibt die Quadratsummen über die gesamte Verteilung. Vorstufe zur Berechnung der Varianz.
• MS: Mean Square (Mittelwert der Quadrate): Varianz der ANOVA. Berechnung: Quadratsumme (SS) werden durch die dazugehörigen Freiheitsgerade (df)geteilt.
• p: P-Wert: Gibt die Wahrscheinlichkeit an, dass die beobachteten Unterschiede zwischen den Gruppenmittelwerten unter Annahme der Nullhypothese rein zufällig sind. Signifikanz des p-Werts ist abhängig vom vorab gewählten Signifikanzniveau (a). Meist ist dies 0,05 (5%). Ein kleiner PWert (typischerweise unter 0,05) wird als Indiz dafür angesehen, dass die Nullhypothese abgelehnt werden sollte und dass es einen signifikanten Unterschied zwischen den Gruppen oder Behandlungen gibt.
Erkläre den Vorteil der Varianzanalyse gegenüber der Durchführung mehrerer T-Tests.
❗️Problem bei mehreren tTests:
• bei jedem t-Test besteht die Gefahr eines aFehlers, bei mehreren t-test würde die Summierung dieser Fehler zu einer aFehler-Inflation führen. Je mehr t-Tests durchgeführt werden, desto größer ist also die Wahrscheinlichkeit, bei mindestens einem dieser t-Tests einen aFehler zu begehen.
• Einsatz von Korrekturen, die das AlphaNiveau herabsetzen = Chance signifikante Unterschiede zu finden wird geringer
❗️Warum Varianzanalyse:
• Um Gefahr von aFehler-Inflationierung/große Anzahl von Korrekturen zu umgehen: Varianzanalyse, welche Mittelwertsvergleich mit mehr als zwei Gruppen ohne jegliche Korrektur erlaubt, statt mehrere t-Tests durchzuführen
• Varianzanalyse überprüft, ob statistisch signifikante Unterschiede zwischen mehr als zwei Gruppen vorliegen. Hierfür werden die Mittelwerte der jeweiligen Gruppen miteinander verglichen. Der t-Test prüft hingegen auf Unterschiede zwischen lediglich zwei Gruppen.
Erklären Sie das Prinzip der Quadratsummenzerlegung in der einfaktoriellen Varianzanalyse.
Vorstufe zur Berechnung der Varianz. Aufteilung erfolgt über Zerlegung der Gesamtquadratsumme (SStotal) in die Quadratsumme zwischen den Gruppen (SSbetween) und die Quadratsumme innerhalb der Gruppen (SSwithin)
❗️Demnach gilt: SStotal = SSbetween + SSwithin
_________________________________________________
Qudratsumme innerhalb der Gruppen (SSwithin):
• Fehlervarianz, dieser Fehler kann nicht auf Veränderungen zurückgeführt werden und wird daher als Messfehler betrachtet
• gibt Aufschluss über die Mittelwertsunterschiede, kann somit auf die Variation der unabhängigen Variablen zurückgeführt werden
Erklären Sie den F-Test in der ANOVA
• Signifikanzprüfung für die Varianzanalyse für feste Effekte, überprüft, ob die Varianzen verschiedener Gruppen gleich sind oder nicht
• um herauszufinden, ob die Streuung in der Stichprobe auf den Effekt oder auf den Zufall zurückzuführen ist, vergleicht man die Varianz zwischen den Gruppen (MSbetween) mit Varianz innerhalb der Gruppen (MSwithin)
• gilt nur für gleich große Gruppen (bei unterschiedlicher Gruppengröße muss Gewichtung vorgenommen werden)
• F-Test ist immer ungerichtet, ein signifikanter F-Test gibt nur Aufschluss darüber, dass es mind. es einen signifikanten Mittelwertsunterschied zwischen Gruppenmittelwerten gibt (nicht, welche Gruppenmittelwerte sich signifikant unterscheiden)
• um unsere Nullhypothese ablehnen zu können und ein signifikantes Testergebnis zu erhalten, sollte F-Wert möglichst hoch sein
Erläutern Sie das Prinzip der geplanten Kontraste + Beispiel.
ALTERNATIVE ZU POST HOC TESTS
statistisch signifikante ANOVA sagt uns lediglich, dass sich mindestens zwei Gruppen statistisch voneinander unterscheiden, aber nicht, welche
• Um Unterschied zu lokalisieren: zwei verschiedene Möglichkeiten: post-hoc Tests und Kontraste:
• Definition von orthogonale (unabhängige) und non-orthogonale (abhängige) Kontrasten
• Bei der ersten Form muss keine Korrektur des a-Fehler-Niveaus erfolgen, beim zweiten Typ von post-hoc-Vergleichen allerdings schon.
• Orthogonale Kontraste: werden formuliert, wenn a priori Hypothesen darüber bestehen, welche Gruppenmittelwerte sich in welcher Richtung unterscheiden
• non-orthogonalen Kontraste: erlauben es, spezifische Vergleiche zwischen Gruppen durchzuführen, anstatt nur die statistische Signifikanz des Gesamtunterschieds zwischen allen Gruppen oder Behandlungen zu überprüfen
_________________________________________________
Beispiel: Angenommen, ein Wissenschaftler führt ein Experiment durch, um die Wirksamkeit von drei verschiedenen Diäten (Diät A, Diät B und Diät C) auf Gewichtsverlust zu untersuchen. Er plant geplante Kontraste, um folgende Hypothesen zu überprüfen:
- Diät A ist wirksamer als Diät B
- Diät C ist wirksamer als Diät B
- Diät A ist wirksamer als Diät C
• Vergleich der Mittelwerte/statistischen Signifikanz der Unterschiede der drei Gruppen
• auf spezifische Hypothesen über die Unterschiede zwischen den Diäten kann so näher eingegangen werden
Erläutere das Post hoc Testprinzip
• Signifikante ANOVA selbst zeigt nur, ob ein Unterschied zwischen Gruppen besteht, nicht, welche Gruppenpaare signifikant voneinander abweichen
- Post-hoc-Tests sind ein statistisches Verfahren, das nach einer signifikanten ANOVA verwendet wird, um festzustellen, welche Gruppen in einer Varianzanalyse signifikant voneinander abweichen.
• Ziel: spezifische Unterschiede/Mittelwertsdifferenzen zwischen allen möglichen Gruppenpaaren identifizieren, die für das signifikante Ergebnis verantwortlich sind
• Einsatz wenn a priori keine Hypothesen über Mittelwertsdifferenzen definiert werden können
• 8 Post-hoc-Verfahren: LSD-Test, Tuckey-HSD-Test, Tukey-Kramer-Test, Scheffe-Test
- Effizienz der Post-hoc-Tests werden über die Teststärke (1-ß) erfasst
• Fordern im Gegensatz zu Kontrasten keine Unabhängigkeit der vorgenommenen Mittelwertsvergleiche
Nenne 3 gängige Post hoc Tests.
• Tukey HSD Test
• Scheffé Test
• LSD Test