ANOVA Flashcards
Ab welcher Gruppenzahl ist eine Varianzanalyse (ANOVA) für gewöhnlich am sinnvollsten?
Ab drei. Für zwei lassen sich einfach t-Tests durchführen.
Welche vier Voraussetzungen gelten für die einfaktorielle Varianzanalyse?
- Normalverteilte Werte
- Gruppen müssen unabhängig sein
- Varianzen müssen gleich sein (homogen)
- Intervallskalenniveau
Wie lautet für gewöhnlich die Nullhypothese in der einfaktoriellen Varianzanalyse?
“Die Mittelwerte unterscheiden sich nicht”
Was lässt sich bezüglich der Mittelwerte herausfinden, wenn man mehr als zwei Gruppen miteinander vergleicht?
Mindestens ein Mittelwert unterscheidet sich – oder nicht.
Welche beiden Varianzen braucht es für eine einfaktorielle ANOVA?
Varianz zwischen den Gruppen
Varianz innerhalb der Gruppen

Wofür steht σ̂2zw?
Geschätzte Varianz zwischen den Gruppen
(Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert)
Wofür steht σ̂2inn?
Geschätzte Varianz innerhalb der Gruppen
(Abweichungen der Messwerte von jeweiligem Gruppenmittelwert)
Im Kontext der ANOVA heißen Fehler…
Residuen (Residuals)
Freiheitsgrade (Df) teilen sich in Zählerfreiheitsgrade und Nennerfreiheitsgrade.
Zählerfreiheitsgrade berechnen sich durch…
Anzahl der Gruppen minus 1
(n – 1)
Freiheitsgrade (Df) teilen sich in Zählerfreiheitsgrade und Nennerfreiheitsgrade.
Nennerfreiheitsgrade berechnen sich durch…
Anzahl der Fälle minus Anzahl der Gruppen
z.B.
84 – 3 = 81

“Mean Squares” stellt in der Formel was dar?

Mittelquadrate = Varianzschätzungen, also in der Formel σ̂2
Berechnet durch die Quadratsumme geteilt durch zugeh. Freiheitsgrad
Was sind “Quadratsummen”?
(Sum Sq, Sum of Squares)
- Zählerquadratsumme (Quadratsumme zwischen den Gruppen):
Summe der quadrierten Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert - Nennerquadratsumme (Quadratsumme innerhalb der Gruppen oder Fehlerquadratsumme)
Summe der quadrierten Abweichungen der Messwerte von ihrem Gruppenmittelwert
Wie berechnet sich der F-Wert?
Quotient aus dem Mittelquadrat des Zählers und dem Mittelquadrat des Nenners
Was ist der p-Wert in Worten?
die Wahrscheinlichkeit, einen solchen oder noch extremeren F-Wert zu erhalten, wenn eigentlich die Nullhypothese gilt.
Der p-Wert beträgt im Beispiel p=.000437, die Wahrscheinlichkeit für einen solchen oder noch extremeren F-Wert unter Gültigkeit der Nullhypothese ist also .04 %. Das ist ein recht kleiner p-Wert.
Im dichotomen Ansatz würde man sich (bei einem Signifikanzniveau von 5 %) für die Alternativhypothese entscheiden.
Benenne alle Teile der Formel zur Wiederholung:

- Df: Freiheitsgrade (Zähler- und Nenner-Freiheitsgrade)
- Quadratsummen (Sum Sq) (Zähler- und Nenner-QS)
- Mittelquadrate (Mean Sq) Varianzschätzung (auch σ̂ )
- F-Wert
- p-Wert
Was wird in dieser Tabelle ausgegeben?
(2 Punkte)

Die Tabelle fasst zusammen,
- wie man auf den F-Wert kommt und
- wie wahrscheinlich dieser unter Zugrundelegung der Nullhypthese ist.
Was ist der F-Test?
Das Prüfverfahren für die ANOVA
Warum sollte man statt einer ANOVA lieber nicht mehrere t-Tests durchführen?
Die Wahrscheinlichkeit für mindestens eine Fehlentscheidung würde steigen.
Dies nennt sich kumuliertes α
Wie berechnet sich das kumulierte α und wie kann man es korrigieren?
kumuliertes α = 1 – (1 – α) j
Durch die Bonferroni-Korrektur lässt sich bei Bedarf das kumulierte α korrigieren.
Nachteil: Teststärke sinkt + P(ß-Fehler) steigt

Warum nennt man die Alternativhypothese bei der ANOVA manchmal Omnibus-Hypothese?
Weil sie ungerichtet ist und kein konkretes Ergebnis zeigt.
Welche zwei Ansätze kann man nutzen, um eine ANOVA durchzuführen?
- zwei geschätzte Populationsvarianzen ins Verhältnis setzen
- Varianzzerlegung
Welchem Wert würde sich F annähern, wenn H0 stimmt?
Eins 1
Weil: Wenn beide Varianzen im Verhältnis zueinander (siehe Formel) sehr ähnlich sind, ist das Ergebnis gegen 1
Wir schätzen die Populationsvarianz:
- Varianz der Messwerte innerhalb der einzelnen Stichproben
- Varianz zwischen den Mittelwerten der Stichproben
Wenn die beiden Varianzschätzungen sehr ähnlich sind, …?
stimmt die Nullhypothese.
Was wird hier berechnet und wie beschreiben wir den Vorgang?

Die geschätzte gemittelte Varianz der Stichproben (σ̂2inn)
Wir addieren alle ermittelten Varianzen und teilen sie durch k, die Anzahl der Stichproben
Welche Voraussetzung muss erfüllt werden, um die Formel für die geschätzte gemittelte Varianz anwenden zu können?
Alle Stichproben müssen die gleiche Größe haben
Diese Formel nützt uns, um die Varianz zwischen den Stichprobenmittelwerten zu schätzen. der zweite Teil fehlt uns aber noch: Wie berechnet sich σ2x̄?

- wird in allen Stichproben die gleiche Teilnehmerzahl untersucht, ist der Gesamtmittelwert identisch mit dem Mittelwert der Stichprobenmittelwerte!
- Bei Gültigkeit der Nullhypothese entsprechen die Daten in den verschiedenen Bedingungen mehreren Stichproben aus der gleichen Population!

Welche ist die Grundidee der Varianzanalyse?
Trifft die Alternativhypothese zu, fällt die Varianzschätzung zwischen den Gruppen höher aus als als innerhalb der Gruppen.
Kann ein F-Wert negativ sein?
Nein. Es stehen zwei Varianzen im Verhältnis σ2, die an sich auch nie negativ sein können.
Was sagt uns eine F-Verteilung?
Wie viel größer der F-Wert als 1 sein muss um ein signifikantes Ergebnis anzuzeigen
Wovon hängt die Form der F-Verteilung ab?
Von der Anzahl der Freiheitsgrade df
Wie errechnen sich bei der ANOVA die Freiheitsgrade?
auf zwei Wegen:

Wo können wir einen kritischen F-Wert ablesen und was müssen wir dafür tun?
In einer Tabelle der F-Verteilung kann man mit df und α einen kritischen F-Wert ablesen, ab dem das Ergebnis signifikant ist.
Welcher Ansatz für die ANOVA ist der gebräuchlichere und flexiblere?
die Varianzzerlegung
Welchen Vorteil hat die Varianzzerlegung hinsichtlich der Stichprobengrößen?
Sie können unterschiedlich groß sein - yay!
Was versteht man unter Varianzzerlegung?

Wie nennt man die Abweichung vom Messwert vom Gruppenmittelwert?
Fehlervarianz

Wie nennt man die Abweichung des Gruppenmittelwerts vom Gesamtmittelwert?
systematische Variation

Wieso muss man bei der Varianzzerlegung mit Quadratsummen arbeiten?
Da die Summe positiver und negativer Abweichungen immer Null ergibt
Formel für die Fehlervariation?

Formel für systematische Variation?

Was gilt für QSgesamt ?


Es gibt einen Unterschied zwischen Variation und Varianz. Die Formeln für die Fehler- und systematische Variation kennen wir bereits. Wie ergeben sich die Formeln für die jeweiligen Varianzschätzungen?
Wir teilen durch die jeweiligen Freiheitsgrade (df )

Wie werden F-Werte in wissenschaftlichen Artikeln oft angegeben?
verkürzt mit Freiheitsgraden und p-Wert

Welche Voraussetzungen braucht es für eine ANOVA?
- Normalverteilung der Stichprobenwerte
- Varianzhomogenität
Angenommen, nach einer ANOVA nehmen wir H1 an. Wir wissen nun, dass es einen Unterschied zwischen den Proben gibt. Wie gehen wir weiter vor?
Post-Hoc-Test
Was verrät uns ein Post-hoc-Test?
Durch den Post-Hoc-Test lassen sich Hinweise finden, welche Mittelwerte sich unterscheiden.
Welche Nachteile könnte ein post-hoc-Test für die Signifikanz der Ergebnisse bringen?
je mehr Tests man durchführt, desto größer das Risiko, dass
- die Power sinkt
- P(α-Fehler) steigt
Was sind gängige post-hoc-Tests?
- Scheffé-Test
- Tukey-Test
- Newman-Keuls-Methode
- Duncan-Methode
Was wird beim Scheffé-Test gemacht und was ist das für ein Test?
Post-Hoc-Test
Es werden einzelne Mittelwerte miteinander verglichen - jeder mit jedem und für jedes Paar ein F-Wert gewonnen.
Welche Effektgröße gibt es in der Varianzanalyse und nach welcher Konvention können wir ihre Werte einordnen?
Eta Quadrat (umstritten)

Wie setzt sich Eta-Quadrat ( η2 ) zusammen und welche Werte kann es annehmen?
η2 kann Werte zwischen 0 und 1 annehmen.

Wann ist η2 genau null und wann genau eins?
η2 = 0
Kein Mittelwertsunterschied zwischen den Gruppen
(Gesamtvariation d. Daten gehen ausschliesslich auf Unterschied INNERHALB d. Gruppen zurück)
η2 = 1
Unterschied zwischen den Gruppen, nicht aber innerhalb der Gruppen
Wie kann man η2 noch berechnen? (Formel)

Wie definiert man η2 ?
Das Effektstärkemaß η2
gibt den Anteil der aufgeklärten Varianz an der Gesamtvarianz auf der Stichprobenebene mittels Quadratsummen an
Was braucht man in der ANOVA zur Bestimmung der Power
- Effektstärke in Population
- Signifikanzkriterium α
- Stichprobengröße d. einzelnen Gruppen
- Anzahl d. Gruppen
Zur Ermittlung der Power: Nutzung umfangreicher Tabellen