Einfaktorielle ANOVA Flashcards
1
Q
Varianzanalyse - was ist das?
A
- Varianzanalyse = ANOVA - Analysis of Variances
- Varianzanalysen sind mit die meist verwendeten inferenzstatistischen Verfahren in der Psychologie.
- Varianzanalysen sind Erweiterungen des t-Tests
- Varianzanalysen dienen also dem Mittelwertvergleich!
- Varianzanalysen sind parametrische Verfahren
- Sie werden angewendet, wenn mehr als zwei Mittelwerte miteinander verglichen werden sollen.
Es gibt sehr viele verschiedene Designs für die Varianzanalyse. Es gilt aber immer: kategoriale UVs und kontinuierliche AVs
- Einfaktorielle Varianzanalyse
- Eine diskrete UV mit mehr als zwei Ausprägungen
- Zweifaktorielle Varianzanalyse
- Zwei diskrete UVs mit jeweils mind. zwei Ausprägungen
- Mehrfaktorielle Varianzanalyse
- Drei oder mehr diskrete UVs mit jeweils mind. zwei Ausprägungen
- Multivariate Varianzanalyse
- Mehr als eine AV
2
Q
Warum nicht mehrere t-Tests?
A
Beispiel: Experiment
- die UV hat 3 Ausprägungen: Kaffee, koffeinfreier Kaffe, schwarzes Getränk. Die VPN werden also in 3 Gruppen aufgeteilt
- die AV ist die subjektive Aktivierung
- prinzipiell lassen sich 3 Nullhypothesen aufstellen
- einfacher ist die allgemeine Nullhypothese: die subjektive Aktivierung für jede der 3 Gruppen genau gleich
- Warum macht man nicht drei t-Tests für die drei möglichen Mittelwertsvergleiche? –> α-Fehler-Inflation (oder α-Fehler-Kumulierung)
- Für α = 5% ergibt sich 1 - (1 – 0,05)^3 = 14,3%
- Und ein t-Test lässt sich nicht für drei Ausprägungen der UV zusammen durchführen, denn:
- Die Differenz zweier Mittelwerte werden in Relation zum Standardfehler betrachtet.
- Ab drei Mittelwerten kann keine einfache Differenz mehr berechnet werden. Man benötigt ein Maß, dass Differenzen aufaddiert –> Varianz
- Die Varianzanalyse ist quasi ein t-Test mit der Varianz anstatt der Differenz über dem Bruchstrich
- Die Varianzanalyse testet ausschließlich ungerichtet
- H0: Es gibt keine Mittelwertunterschiede
- Wenn ich ein signifikantes Ergebnis bekomme (d.h. es unterscheiden sich mind. 2 Mittelwerte), sind weitere Verfahren notwendig
3
Q
Voraussetzungen für die einfaktorielle Varianzanalyse
A
Voraussetzungen:
- Intervallskalenniveau der AV (und Nominalskalenniveau der UV - wir brauchen Kategorien/Gruppen)
- Die AV ist in der Population normalverteilt (und innerhalb der Gruppen)
- Unabhängigkeit der Stichproben
- Varianzhomogenität
4
Q
Varianzschätzung
A
Logik:
- Bei einer UV mit k Ausprägungen (bedeutet ich betrachte die VPN als k “Gruppen”) entspricht der Gesamtmittelwert dem Mittelwert der Mittelwerte einzelnen Gruppen.
- Die Populationsvarianz setzt sich zusammen aus der Varianz zwischen den Gruppen und der Varianz innerhalb der Gruppen.
- Varianz zwischen = die Streuung der Mittelwerte der Gruppen / Stichproben um den Gesamtmittelwert. Die Varianz zwischen ist die n-fache geschätzte Populationsvarianz der Mittelwerte
- Varianz innerhalb = die Streuung der einzelnen Werte um den Mittelwert ihrer Gruppe. Die Varianz innerhalb ist die mittlere geschätzte Populationsvarianz innerhalb der Gruppen / Stichproben
- Wenn tatsächlich nur eine einzige Verteilung vorliegt, d.h. die Nullhypothese richtig ist, dann sollten bis auf zufällige Schwankungen die beiden Schätzungen gleich sein.
- Varianz innerhalb ≈ Varianz zwischen
5
Q
Varianzzerlegung
A
- Ansatz der Varianzschätzung ist in seiner Anwendung eingeschränkt, denn nur für gleich große Gruppen möglich
- Varianzzerlegung ist die allgemeinere und gebräuchlichere Methode
- Bei der Varianzzerlegung können …
- die Gruppen verschieden groß sein
- mehrere Variablen berechnet werden
- Interaktionen (Zusammenwirken verschiedener Variablen) dargestellt werden
Logik:
- Ausgangspunkt ist die Gesamtvariation basierend auf der Abweichung einzelner Werte vom Gesamtmittelwert
- Diese Abweichung lässt sich ähnlich wie bei der Regression in zwei Komponenten zerlegen:
- Die Abweichung des einzelnen Wertes zum zugehörigen Gruppenmittelwert – unsystematische Variation / Fehlervariation. Nicht erklärbar, weil keine UV manipuliert wurde
- Die Abweichung vom Gruppenmittelwert zum Gesamtmittelwert –systematische Variation
-
Zur Berechnung der einzelnen Variationen kann nicht einfach addiert werden: Summe würde Null ergeben –> Quadrierung der Abweichungen – Quadratsummen (QS) oder sum of squares (SS)
- QS gesamt = QS innerhalb + QS zwischen, wobei Varianz = QS / df
6
Q
F-Verteilung und Prüfgröße F
A
F-Verteilung
- Die F-Verteilung ist abhängig von Zähler- und Nennerfreiheitsgraden.
- Da Varianzen immer positiv sind, nimmt F auch nur positive Werte an.
- F ist one-tailed
Prüfgröße
- F = Varianz zwischen / Varianz innerhalb
- k-1 Zählerfreiheitsgrade und n-k Nennerfreiheitsgrade
7
Q
Effektgröße Eta-Quadrat
A
Für Varianzanalysen gibt es eigene Effektgrößen.
d, g oder r gelten nur für jeweils zwei Stichproben
Eta-Quadrat η2 :
- Anteil der systematischen Variation an der Gesamtvariation
- Eta-Quadrat η2 = QS zwischen / QS gesamt
- Entspricht dem Anteil erklärter Varianz durch den Determinationskoeffizienten: r^2
Konvention nach Cohen:
- 0,01 –> kleiner Effekt
- 0,06 –> mittel
- 0,14 –> groß