3. Einfaktorielle Varianzanalyse Flashcards

Question 1

Q

Nennen Sie die Voraussetzungen der Varianzanalyse.

Answer

A

Mindestens Intervallskalenniveau und Normalverteilung innerhalb der Stichprobe bei der abhängigen Variable 🗻
Mindestens 20 Elemente pro Stichprobe (Gruppe, Zelle) 2️⃣0️⃣
Ähnlich stark besetzte Gruppen (Zellen) ⚖️
Varianzhomogenität der abhängigen Variablen zwischen den einzelnen Stichproben

Question 2

Q

Was bedeutet Varianzhomogenität der einfaktoriellen Varianzanalyse und wie kann diese geprüft werden?

Answer

A

• Varianzhomogenität bedeutet, dass die Varianzen (Streuung) in beiden Gruppen gleich sind 🍩🟰

• Diese muss für die Durchführung einer einfaktoriellen Varianzanalyse erfüllt sein
_________________________________________________

Prüfung der Varianzhomogenität durch:

• Bartlett-Test: Gegenüber Verletzungen der Normalverteilungsannahme sehr empfindlich (sollte eher selten eingesetzt werden), Bartlett-Test nicht signifikant = Varianzhomogenität, basiert auf y-Verteilung

• Levene-test: Durchführung einer einfaktoriellen Varianzanalyse über den Betrag der Abweichungen der individuellen Werte vom Gruppenmittelwert, sehr stabil gegenüber Verletzung der Normalverteilung, progressives Prüfverfahren

• Fmax-Statistik: Durchführung nur bei gleichgroßen Stichproben, hierbei werden die Größte und kleinste Varianz der Faktorstufen ins Verhältnis gesetzt, relativ einfacher Test

Question 3

Q

Erklären Sie die Bedeutung des Determinantionskoeffizienten R² in einer einfaktoriellen Varianzanalyse.

Answer

A

Definition: ein Gütemaß der linearen Regression, gibt in der einfaktoriellen Varianzanalyse an, wie viel der Variabilität der abhängigen Variablen durch die unabhängige Variable erklärt wird

• die erklärende Varianz wird hierbei zur Gesamtvarianz ins Verhältnis gesetzt

• liegt immer zwischen 0 (0% = unbrauchbares Modell) und 1 (100% = perfekte Modellanpassung) 🚫 - 💯

• je höher der Wert, desto stärker ist die Beziehung zwischen den Variablen (0=die unabhängige Variable hat keinen Einfluss auf die abhängige Variable, 1= die unabhängige Variable erklärt die abhängige Variable vollständig)

Question 4

Q

Was bedeuten df, SS, MS und p in der Varianzanalyse?

Answer

A

• df: Degrees of Freedom (Freiheitsgrade): beschreiben die Anzahl der Beobachtungen, die für die Berechnung bestimmter statistischer Größen verwendet werden.

• SS: Sum of Squares (Summe der Quadrate): Beschreibt die Quadratsummen über die gesamte Verteilung. Vorstufe zur Berechnung der Varianz.

• MS: Mean Square (Mittelwert der Quadrate): Varianz der ANOVA. Berechnung: Quadratsumme (SS) werden durch die dazugehörigen Freiheitsgerade (df)geteilt.

• p: P-Wert: Gibt die Wahrscheinlichkeit an, dass die beobachteten Unterschiede zwischen den Gruppenmittelwerten unter Annahme der Nullhypothese rein zufällig sind. Signifikanz des p-Werts ist abhängig vom vorab gewählten Signifikanzniveau (a). Meist ist dies 0,05 (5%). Ein kleiner PWert (typischerweise unter 0,05) wird als Indiz dafür angesehen, dass die Nullhypothese abgelehnt werden sollte und dass es einen signifikanten Unterschied zwischen den Gruppen oder Behandlungen gibt.

Question 5

Q

Erkläre den Vorteil der Varianzanalyse gegenüber der Durchführung mehrerer T-Tests.

Answer

A

❗️Problem bei mehreren tTests:

• bei jedem t-Test besteht die Gefahr eines aFehlers, bei mehreren t-test würde die Summierung dieser Fehler zu einer aFehler-Inflation führen. Je mehr t-Tests durchgeführt werden, desto größer ist also die Wahrscheinlichkeit, bei mindestens einem dieser t-Tests einen aFehler zu begehen.

• Einsatz von Korrekturen, die das AlphaNiveau herabsetzen = Chance signifikante Unterschiede zu finden wird geringer

❗️Warum Varianzanalyse:

• Um Gefahr von aFehler-Inflationierung/große Anzahl von Korrekturen zu umgehen: Varianzanalyse, welche Mittelwertsvergleich mit mehr als zwei Gruppen ohne jegliche Korrektur erlaubt, statt mehrere t-Tests durchzuführen

• Varianzanalyse überprüft, ob statistisch signifikante Unterschiede zwischen mehr als zwei Gruppen vorliegen. Hierfür werden die Mittelwerte der jeweiligen Gruppen miteinander verglichen. Der t-Test prüft hingegen auf Unterschiede zwischen lediglich zwei Gruppen.

Question 6

Q

Erklären Sie das Prinzip der Quadratsummenzerlegung in der einfaktoriellen Varianzanalyse.

Answer

A

Vorstufe zur Berechnung der Varianz. Aufteilung erfolgt über Zerlegung der Gesamtquadratsumme (SStotal) in die Quadratsumme zwischen den Gruppen (SSbetween) und die Quadratsumme innerhalb der Gruppen (SSwithin)

❗️Demnach gilt: SStotal = SSbetween + SSwithin
_________________________________________________

Qudratsumme innerhalb der Gruppen (SSwithin):

• Fehlervarianz, dieser Fehler kann nicht auf Veränderungen zurückgeführt werden und wird daher als Messfehler betrachtet

• gibt Aufschluss über die Mittelwertsunterschiede, kann somit auf die Variation der unabhängigen Variablen zurückgeführt werden

Question 7

Q

Erklären Sie den F-Test in der ANOVA

Answer

A

• Signifikanzprüfung für die Varianzanalyse für feste Effekte, überprüft, ob die Varianzen verschiedener Gruppen gleich sind oder nicht

• um herauszufinden, ob die Streuung in der Stichprobe auf den Effekt oder auf den Zufall zurückzuführen ist, vergleicht man die Varianz zwischen den Gruppen (MSbetween) mit Varianz innerhalb der Gruppen (MSwithin)

• gilt nur für gleich große Gruppen (bei unterschiedlicher Gruppengröße muss Gewichtung vorgenommen werden)

• F-Test ist immer ungerichtet, ein signifikanter F-Test gibt nur Aufschluss darüber, dass es mind. es einen signifikanten Mittelwertsunterschied zwischen Gruppenmittelwerten gibt (nicht, welche Gruppenmittelwerte sich signifikant unterscheiden)

• um unsere Nullhypothese ablehnen zu können und ein signifikantes Testergebnis zu erhalten, sollte F-Wert möglichst hoch sein

Question 8

Q

Erläutern Sie das Prinzip der geplanten Kontraste + Beispiel.

Answer

A

ALTERNATIVE ZU POST HOC TESTS

statistisch signifikante ANOVA sagt uns lediglich, dass sich mindestens zwei Gruppen statistisch voneinander unterscheiden, aber nicht, welche

• Um Unterschied zu lokalisieren: zwei verschiedene Möglichkeiten: post-hoc Tests und Kontraste:

• Definition von orthogonale (unabhängige) und non-orthogonale (abhängige) Kontrasten

• Bei der ersten Form muss keine Korrektur des a-Fehler-Niveaus erfolgen, beim zweiten Typ von post-hoc-Vergleichen allerdings schon.

• Orthogonale Kontraste: werden formuliert, wenn a priori Hypothesen darüber bestehen, welche Gruppenmittelwerte sich in welcher Richtung unterscheiden

• non-orthogonalen Kontraste: erlauben es, spezifische Vergleiche zwischen Gruppen durchzuführen, anstatt nur die statistische Signifikanz des Gesamtunterschieds zwischen allen Gruppen oder Behandlungen zu überprüfen
_________________________________________________

Beispiel: Angenommen, ein Wissenschaftler führt ein Experiment durch, um die Wirksamkeit von drei verschiedenen Diäten (Diät A, Diät B und Diät C) auf Gewichtsverlust zu untersuchen. Er plant geplante Kontraste, um folgende Hypothesen zu überprüfen:

Diät A ist wirksamer als Diät B
Diät C ist wirksamer als Diät B
Diät A ist wirksamer als Diät C

• Vergleich der Mittelwerte/statistischen Signifikanz der Unterschiede der drei Gruppen

• auf spezifische Hypothesen über die Unterschiede zwischen den Diäten kann so näher eingegangen werden

Question 9

Q

Erläutere das Post hoc Testprinzip

Answer

A

• Signifikante ANOVA selbst zeigt nur, ob ein Unterschied zwischen Gruppen besteht, nicht, welche Gruppenpaare signifikant voneinander abweichen

Post-hoc-Tests sind ein statistisches Verfahren, das nach einer signifikanten ANOVA verwendet wird, um festzustellen, welche Gruppen in einer Varianzanalyse signifikant voneinander abweichen.

• Ziel: spezifische Unterschiede/Mittelwertsdifferenzen zwischen allen möglichen Gruppenpaaren identifizieren, die für das signifikante Ergebnis verantwortlich sind

• Einsatz wenn a priori keine Hypothesen über Mittelwertsdifferenzen definiert werden können

• 8 Post-hoc-Verfahren: LSD-Test, Tuckey-HSD-Test, Tukey-Kramer-Test, Scheffe-Test

Effizienz der Post-hoc-Tests werden über die Teststärke (1-ß) erfasst

• Fordern im Gegensatz zu Kontrasten keine Unabhängigkeit der vorgenommenen Mittelwertsvergleiche

Question 10

Q

Nenne 3 gängige Post hoc Tests.

Answer

A

• Tukey HSD Test

• Scheffé Test

• LSD Test