einfaktorielle between-Subject Varianzanalyse Flashcards
Ziel: Der Varianzanalyse
Auswertung von Stichproben von mehr als zwei Bedingungen/Gruppen
was bedeutet einfaktoriell?
eine unabhängige Variable (ein “Faktor”) mit (i.d.R.)
mehr als zwei Stufen
Was bedeutet between-subject?
jede Stufe wird an einer separaten Stichprobe
erhoben; die Stichproben sind unabhängig voneinander gezogen
(vgl. t-Test für zwei unabhängige Stichproben)
Wenn wir wissen wollen, ob sich die drei µ´s der drei Populationen unterschieden: warum nicht drei t-tests?
aufgrund von α-Kumulation
Das Problem: Die Wahrscheinlichkeit, dass ein Test signifikant wird, obwohl alle Nullhypothesen gelten, ist kleiner als die Wahrscheinlichkeit, dass mindestens einer der Tests signifikant wird, obwohl alle Nullhypothesen gelten.
Wie groß ist die Wahrscheinlichkeit, dass ein Test fälschlicherweise signifikant wird?
α (Fehler 1. Art) = 0,05
α-Kumulation: Als was kann jeder einzelne Test gesehen werden? Mit welcher Verteilung kann die Wahrscheinlichkeit berechnet werden, dass mind. eine Test signifikant wird?
- als Bernoulli-Experiment
- Die Wahrscheinlichkeit dafür, dass m von k Tests signifikant werden, kann dann mit der Binomialverteilung berechnet werden.
Mögliche Korrekturen der α-Kumulation
- α-Adjustierung
- Varianzanalyse
Mögliche Korrekturen der α-Kumulation:
1. α-Adjustierung
Wahl eines kleineren α´, sodass die Gesamtwahrscheinlichkeit mindestens einer Fehlentscheidung α nicht überschreitet.
Bonferroni-Korrektur:
α′ = α/k
Das würde heißen alle k t-Tests mit α′ durchführen
Varianzanalyse: Faktor
Begriff für die unabhängige (manipulierte) Variable in der Varianzanalyse
im Beispiel: 1 Faktor “Schlafentzug”
ein Faktor hat J Stufen (im Beispiel: J = 3)
Varianzanalyse: abhängige Variable
Variable, die gemessen wird (üblicherweise hier: Y )
im Beispiel: Anzahl erinnerter Wörter
Varianzanalyse: Stichproben müssen sie gleich groß sein?
Stichproben hinter den J Faktorstufen müssen nicht gleich groß sein, d.h.
wir schreiben den Umfang jeder Stichprobe als nj
Was beschreibt im Allgemeinen der Wert Yij?
den Wert (Y) einer Person (i) in der Stichprobe/Stufe (j)
Annahmen bei der einfaktoriellen between-subject Varianzanalyse
- J Stichproben werden unabhängig voneinander gezogen
- abhängige Variable Y (mindestens) intervallskaliert
- abhängige Variable in jeder Population j normalverteilt mit einer gemeinsamen Varianz (=Varianzhomogenität):
Yj ∼ N(µj, σ2) ∀j ∈ {1, . . . , J}
Hypothesen der einfaktoriellen between-subject Varianzanalyse
die hier behandelte Varianzanalyse ist eine Verallgemeinerung des t-Tests für zwei unabhängige Stichproben daher werden auch die Hypothesen entsprechend verallgemeinert:
H0 :µ1 = µ2 = . . . = µJ
H1 :µk ≠ µm für mindestens ein Paar k, m ∈ {1, . . . , J}
Die H0 schließt wie immer auf die Gleichheit von (in diesem Fall) Erwartungswerten
Die konzeptuelle Idee der Varianzanalyse: Charakteristika
- Je unterschiedlicher die Gruppen- /Bedingungsmittelwerte sind, desto eher unterscheiden sich vermutlich auch die Populationsmittelwerte
- Bei großer Populationsvarianz sind größere
Unterschiede der Mittelwerte sowieso wahrscheinlich
Die konzeptuelle Idee der Varianzanalyse:
Mittelwertsunterschiede bei steigender Populationsvarianz
- Differenz zwischen Mittelwerten: je größer Populationsvarianz, desto größer im Mittel die Differenz der beiden Gruppenmittelwerte
- Mehr als zwei Gruppen: ist eine Differenz nicht mehr berechenbar:
a) Lösung: die Varianz der Mittelwerte berechnen: sie bildet auch die Unterschiedlichkeit der Mittelwerte ab und ist auch bei mehr als zwei Gruppen/Bedingungen anwendbar - Die Varianz von zwei Mittelwerten nimmt zu, wenn die Populationsvarianz steigt.
S. F 25
Die konzeptuelle Idee der Varianzanalyse:
Was spricht gegen die Nullhypothese und für eine Unterschiedlichkeit in den Populationsmittelwerten?
- eine große Varianz der Gruppen- /Bedingungsmittelwerte
2 eine kleine Varianz innerhalb jeder Population
Die konzeptuelle Idee der Varianzanalyse:
Welche Eigenschaften muss die Gesuchte Prüfgröße erfüllen?
- die beide Aspekte so vereint, dass sie umso extremere Werte annimmt, je mehr die Daten gegen die Nullhypothese sprechen
- deren theoretische Dichtefunktion bestimmbar ist.
-> der F-Bruch
F-Bruch Sprachlich ausgedrückt
F = Variabilität der Stichprobenmittelwerte/Populationsmittelwerte geteilt durch die Variabilität in den Stichproben/den Populationen
Anders Ausgedrückt:
F =
Variabilität zwischen den Gruppen (Zähler)
Variabilität innerhalb der Gruppen (Nenner)
=
Effekte + Messfehler
Messfehler
F-Bruch bei An- und Abwesenheit von Effekten
bei Abwesenheit von Effekten: F ≈ 1
bei Anwesenheit von Effekten: F > 1
-> Der F-Bruch wird also umso größer, je “stärker” Effekte sind.
Rechnerische Durchführung:
Gruppenmittelwerte und -varianz
Im allgemeinen Fall gehen wir davon aus, dass es J-viele Gruppen/Bedingungen mit jeweils nj VP gibt.
Dann berechnen sich Gruppenmittelwerte und -Varianzen so wie üblich, lediglich einige Indizes müssen eingeführt werden, um klar zu machen, zu
welcher Gruppe der Wert gehört
s. F. 33
Rechnerische Durchführung:
Quadratsummenzerlegung
Wir teilen die Gesamtvariabilität in einen systematischen Anteil und einen Messfehleranteil
auf.
Die Variabilitäten werden in der Regel Quadratsummen (QS) bzw. Sums of Squares (SS) genannt und wir benötigen hier drei Quadratsummen:
- Gesamt-QS (Sums of Squares total): SStot
- QS zwischen den Gruppen (Sums of Squares between)2: SSA
- QS innerhalb der Gruppen (Sums of Squares within): SS
Die Formel der Quantifizierung
SStot = SSA + SSw
Wie viele Freiheitsgrade hat SSa?
J-1
das ist der Zählerfreiheitsgrad oder df1
Wie viele Freiheitsgrade hat SSw?
N-J
Das ist der Nennerfreiheitsgrad oder df2
Wie wird der F-Bruch berechnet?
F = MSA / MSW
Wie wird MSW berechnet und was ist MSW?
MSW = SSw / (N-J)
1. Mittlere Abweichung innerhalb der Gruppen: MSW ist die mittlere Abweichung innerhalb der Gruppen und wir auch als Mittlere Fehler-Quadratsumme bezeichnet: sie quantifiziert die Variabilität innerhalb der Gruppen
2. MSW spiegelt also die Abweichung der einzelnen Datenpunkte innerhalb einer Gruppe vom Gruppenmittelwert wieder und stellt damit eine nicht-erklärte “zufällige” Variabilität dar.
Wie wird MSA berechnet und was ist MSA? Wann wird MSA größer?
MSA = SSA / (J-1)
1. Mittlere Quadratsumme zwischen den Gruppen: MSA ist die mittlere Quadratsumme zwischen den Gruppen. Sie quantifiziert die Variabilität der Gruppenmittelwerte
2. In die MSA gehen die Abweichungen der Gruppenmittelwerte zueinander bzw. vom Gesamtmittelwert ein.
3. Je MSA wird umso größer, je stärker die Mittelwerte voneinander abweichen.
Wie ist eine Zufallsvariable F verteilt, die jeder
Kombination von J Stichproben den empirischen F-Bruch zuweist?
- nicht symmetrisch
- Werte < 0 kommmen nicht vor
- ähnelt auf den ersten Blick einer χ²-Verteilung
- Tatsächlich kann man zeigen, dass bei Gültigkeit der H0 der F-Bruch (zentral) F-verteilt ist.
- Eine (zentrale) F-Verteilung hat zwei Parameter:
a) Zähler- und
b) Nennerfreiheitsgrade - Bei F (2,2) dreht sich der Funktion um, und ist nach oben geöffnet
S. F. 50
Welche Parameter hat die F-Verteilung?
Zählerfreiheitsgrade: die Freiheitsgrade von SSA, also J − 1
Nennerfreiheitsgrade: die Freiheitsgrade von SSw, also N − J
Merkmale der F-Verteilung mit m und n Freiheitsgraden
Erwartungswert:
E(F) = n / (n-2) für n >2
Varianz:
Var(F)= (2n²(m + n-2)) / (m(n-2)²(n-4)) für n > 4
was ist fkrit?
- einen Wert Fkrit, rechts von dem noch 5% der Fläche unter der Dichteverteilung liegen (bei einem festgelegten α = 0.05)
- Dieser Wert ist das (1 − α)-Quantil der F-Verteilung mit m und n Freiheitsgraden:
Fkrit = Fm,n;1−α