Einfaktorielle Varianzanalyse Flashcards
Welches Verfahren wird genutzt um 3 oder mehr Gruppen zu vergleichen
Varianzanalyse
Was ist der t Test für unabhängige Stichproben (wozu gehört er?)
Spezialfall der einfaktoriellen Varianzanalyse
Was ist die Idee der Anova
In der ANOVA werden Unterschiede in einer metrischen AV zurückgeführt auf Unterschiede in den Ausprägungen eines Faktors (der UV).
Wofür steht nZ
Personen in einer Zelle
Was sind die Voraussetzungen für die Residuen bei der ANOVA
Unabhängigkeit der Residuen zwischen den Bedingungen
Unabhängigkeit der Residuen innerhalb der Bedingungen
Homoskedastizität
Normalverteilung: Die Residuen innerhalb jeder Bedingung sind normalverteilt.
Was passiert wenn die Voraussetzungen nicht erfüllt sind
ANOVA kommt zu verzerrten Ergebnissen
Wofür steht müj
Gruppenmittelwert aller Personen der Faktorstufe j
Wofür steht mü
Gesamtmittelwert
Wofür steht (müj -mü) & tauj
Die Abweichung des Gruppen- mittelwertes vom Gesamtmittelwert = der Effekt der Faktorstufe
Wofür steht emj
Die individuelle Abweichung vom Gruppenmittelwert
Nullypothesen bei Einfaktoriellen ANOVA
Tj=0 für alle j
H1 1faktorielle ANOVA
Tj ungleich 0 für mind ein j
Was beschreibt die Zwischen-Quadratsumme 𝑄𝑆𝑧𝑤
beschreibt die Unterschiede zwischen den Faktorstufen. Da wir den Fall gleichgroßer Gruppen betrachten, kann das 𝑛𝑍 vor das Summenzeichen gezogen werden.
Dieser Wert ist größer, wenn sich die Mittelwerte der Faktorstufen stark unterscheiden. Die Quadratsumme ist klein, wenn die Populationsmittelwerte gleich sind (dann entsteht die Quadratsumme nur durch zufällige Schwankungen durch die Stichprobenziehung)
Was beschreibt die Innerhalb-Quadratsumme 𝑄𝑆𝑖𝑛𝑛
beschreibt die Unterschiede zwischen den Messwerten innerhalb der Faktorstufen. Wenn alle Personen innerhalb der Gruppen den gleichen Wert haben, hätte die 𝑄𝑆𝑖𝑛𝑛 den Wert 0.
Da diese Quadratsumme die Schwankung um die Mittelwerte bezeichnet, wird sie auch als Fehlerquadratsumme bezeichnet.
Umgang mit Verletzung der Voraussetzungen
Umgang mit Verletzung der Voraussetzungen
❖Verletzung der Normalverteilungsannahme: ▪ Transformation der Variablen
▪ Verteilungsfreies Verfahren: Kruskal-Wallis-Test
❖Verletzung der Homoskedastizität:
▪ Alternative Tests (Welch-Test; Brown-Forsythe-Test)
❖Abhängige Gruppen
▪ Varianzanalyse mit Messwiederholung
❖Abhängigkeit der Beobachtungseinheiten innerhalb einer Gruppe
▪ Verfahren für verschachtelte („nested“) Gruppen, z. B. Multilevelverfahren
Grundlage Varianzanalyse
Vergleich von 3 oder mehr Gruppen
Was ist der t TEst für unabhängige Stichproben
ein Spezialfall der einfaktoriellen Varianzanalyse
Unterschiede in einer metrischen AV zurückgeführt auf
unterschiede in den Ausprägungen eines Faktors der UV
Messwert einer Person in der UV wird als
xmj bezeichnet
Die Ausprägungen des Faktors werden mit
j bezeichnet. Es gibt J Faktorausprägungen
In jeder Gruppe j werden die Personen mit
m durchnummeriert. Wir betrachten den Fall dass jede Gruppe gleichviele Personen (=nz für Zelle) enthält
Was passiert wenn Voraussetzungen nicht gegeben sind
die ANOVA hat verzerrte Ergebnisse
müj
Der Gruppenmittelwert aller Personen der Faktorstufe j
mü
Der Gesamtmittelwert
Emj
Die individuelle Abweichung vom Gruppenmittelwert
(müj-mü) & Tj
Die Abweichung des Gruppenmittelwerts vom Gesamtmittelwert = Effekt der Faktorstufe
Messwertzerlegung
xmj= xstrichj +emj =xstrich +(xstrichj-xstrich)+emj
Wie entsteht eine Quadratsumme
durch quadrieren & addieren
Was beschreibt die QStot
beschriebt die Abweichung aller Werte vom Mittelwert
Woher kennt man die QStot
aus der Formel der Varianz
Was beschreit die QSzw
die Unterschiede zwischen den Faktorstufen
Was kann gemacht werden mit der QSzw, wenn gleich große Gruppen betrachtet werden
nz kann vor das Sumenzeichen gezogen werden
QSzw ist größer wenn
sich die Mittelwerte der Faktorstufen stark unterscheiden
QSzw ist klein wenn
die Populationsmittelwerte gleich sind (dann entsteht die QS nur duch zufällige Schwankungen durch die Stichprobenziehung)
Was beschreibt die QSinn
die Unterschiede zwischen den Messwerten innerhalb der Faktorstufen
Wann hat die QSinn den Wert 0
Wenn alle Personen innerhalb der Gruppe den gleichen Wert haben
warum wird die QSinn auch Fehlerquadratsumme bezeichnet
da die QS die Schwankung um die Mittelwerte bezeichnet
die totale Quadratsumme setzt sich additiv aus
der QSzw & der QSinn zusammen
Die Populationsresidualvarianz
ist diejenige Variation in den Messwerten, die auf unsystematische Einflüsse zurückzuführen ist.Dahinter steckt also die Schwankung der Residuen um die Mittelwerte in den jeweiligen Bedingungen (also die QSinn).Dadurch kann sie auch durch die MQS geschätzt werden
Was ist der Standardfehler
die Schwankung der MIttelwerte um den wahren Populationsmittelwert
Wenn die H0 gilt dann unterschieden sich die Mittelwerte der Bedingungen nur
aufgrund von Stichprobenfehern
Wofür können die verschiedenen Bedingungsmittelwerte in der ANOVA dienen
um sigma xstrich quadrat zu schätzen
Populationsresidualvarianz =
MQSinn
sigma xstrich quadrat
MQSzw
Wenn die H0 gilt unterschieden sich die wahren Gruppenmittelwerte nicht, daher
sollte die gesamte Varianz der Residualvarianz entsprechen
Unter Gültigkeit der H0 erwarten wir
dass die MQS gleich sind (in der Prüfgröße untersucht)
MQtot ist die
Schätzung der Gesamtvarianz in der Population
Zählerfreiheitsgrade
dfzw
Nennerfreiheitsgrade
dfinn
EIn größerer FWert spricht
gegen die H0
Weshalb spricht ein größerer F wert gegen die H0
da die Unterschiede zwischen den Gruppenmittelwerten nur in die MQSzw nicht aber die MQSinn eingehen
Effektgröße
DerAnteil der systematischen Variation an der Gesamtvariation
eta quadrat grenzen
0,01 klein
0,06 mittel
0,14 groß
Wertebereich Eta
Werte zwischen 0 und 1
Was wird durch die effektgröße Eta geschätzt
die Effektgröße auf Populationsebene
Was ist eine Alternative Effektgröße ohne systematische positive Überschätzung der Populationsgröße
omega2
Warum sollte eta quadrat nicht verwendet werden
weil sie kein erwartungsgetreuer schätzer ist
Varianzanalyse ist robus gegen Verletzungen der Voraussetzungen unter Bedingungen:
symmetrische Verteilung (bei gegebener Varianzgleichheit) Varianzunterschiede (bei gegebener Normalverteilung &gleichen Gruppengrößen): (größte Varianz)/(kleinste Varianz) < 4
Varianzanalyse ist nicht robust bei
Varianzheterogenität &ungleichen Gruppengrößen
Bei gleichzeitiger Verletzung der Homoskedastizität &Normalverteilungsannahme
abhängigen Beobachtungen
Umgang mit Verletzung der Voraussetzungen : Normalverteilungsannahme
Transformation der Vraiablen
Verteilungsfreies Verfahren : Kruskal-Wallis-Test
Umgang mit Verletzung der Voraussetzungen :
Homoskedastizität
Alternative Tests (Welch Test,Brown Forsythe Test)
Umgang mit Verletzung der Voraussetzungen :
Abhängige Gruppen
ANOVA mit Meswiederholung
Umgang mit Verletzung der Voraussetzungen :
Abhängigkeit der Beobachtungseinheiten innerhalb einer Gruppe
Verfahren für verschachteltete (nested) Gruppen z.B. Multilevelverfahren
Wann ist die Anwendung der Varianzanalyse problematisch
bei kleinen (n<10) &ungleich großen stichproben (Aussagen über die Populationsverteilungen schwierig)
Welch Test / Brown forsythe Test
Gleichgropße Gruppen!
Was beschreibt die QStot
die Abweichung aller Werte vom Mittelwert
Was schätzt die Gesamtvarianz in der Population
MQS tot