Mehrfaktorielle Varianzanalyse Flashcards

1
Q

Annahmen der mehrfaktoriellen Varianzanalyse

A
  1. Es gibt mind. zwei Faktoren:
    Faktor 1: Faktor A mit J Stufen
    Faktor 2: Faktor B mit K Stufen.
    Alle J · K Kombinationen beider Faktoren werden dann an unabhängigen Stichproben realisiert
  2. Die abhängige Variable sei in den jeweiligen Populationen normalverteilt, wobei wir für jede Population einen eigenen Erwartungswert zulassen, aber die gleiche Varianz annehmen:
    Yjk ∼ N(µjk , σ²).
    a) Die AV muss also innerhalb jeder Faktorstufenkombination (= innerhalb jeder Zelle des Designs) normalverteilt sein. Es darf durchaus sein, dass die abhängige Variable ohne die Beachtung der Faktorstufen nicht normalverteilt ist.
    b) Die Varianz der AV muss ebenfalls nur innerhalb der Faktorstufenkombinationen normalverteilt sein
  3. (mindestens) Intervallskalenniveau der abhängigen Variablen
  4. Unabhängigkeit der einzelnen Stichproben. Wir machen hier weiter die Einschränkung, dass die einzelnen Gruppen alle gleich groß sind. Der Stichprobenumfang pro Gruppe ist also n.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Grundlagen und Begriffe der zweifaktoriellen Varianzanalyse: Globale Erwartungswerte

A

Werden mit µj· und µ·k bezeichnet. . .
. . . und werden für jede Stufe des einen Faktors über alle Stufen des anderen Faktors hinweg berechnet. Der Punkt ersetzt dabei den Index des Faktors, über dessen Stufen hinweg gemittelt wird.
beispiel s. F. 10/ 11

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Haupteffekte

A
  1. Eine einfaktorielle Varianzanalyse mit dem Faktor A
    durchführen und dabei den Faktor B außer Acht lassen
    und andersherum –> In etwa das ist mit Haupteffekten gemeint, allerdings steigt die Power durch die Berücksichtigung des jeweils anderen Faktors
  2. testen die Unterschiedlichkeit der globalen Erwartungswerte der einzelnen Stufen jedes Faktors; dabei gibt es immer so viele Haupteffekthypothesen, wie es Faktoren gibt.
  3. Die Effekte des Faktors A nennen wir wieder αj (wie in der einfaktoriellen Varianzanalyse) und die Effekte des Faktors B nennen wir ganz analog βk :
    αj = µj· − µ und βk = µ·k − µ
  4. Dass ein Haupteffekt vorliegt muss nicht unbedingt bedeuten, dass der Faktor unter jeder Stufe des anderen Faktors einzeln betrachtet ebenfalls einen signifikanten Effekt hat –> das kann sei, aber der Haupteffekt ist ja über die Stufen gemittelt daher muss nicht in jeder Stufe ein signifikanter Effekt vorliegen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Haupteffekte - Aussagekraft

A

ein Haupteffekt sagt nicht darüber aus, wie die einzelnen Faktoren zueinander stehen, sondern die die Faktoren zur AV stehen, wenn es den jeweils anderen Faktor nicht geben würde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Haupteffektmodell

A

der Gruppenerwartungswert setzt sich additiv zusammen aus Gesamterwartungswert und Effekt der Stufe j bzw. der Messwert setzt sich additiv zusammen aus Gesamterwartungswert, Effekt der Stufe j und dem
Messfehler.
Vorläufige Modellgleichung auf Basis der Effekte αj und βk (“Hauteffektmodell”):
µjk = µ + αj + βk
z.B.: für µ11 würde gelten: µ11 = µ + α1 + β1
Es wird klar, die von Haupteffektmodell vorhergesagten Werte und die empirischen Werte stimmen nicht überein! -> daher Interaktionseffekte bestimmen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion -Definition

A

Interaktionen sind Abweichungen der vom Haupteffektmodell vorhergesagten Erwartungswerte von den tatsächlichen Erwartungswerten, also
µjk − (µ + αj + βk )
Wir bezeichnen die Interaktion für jede Zelle mit (αβ)jk und berechnen sie also als:
(αβ)jk = µjk − (µ + αj + βk ) = µjk − µ − αj − βk
sind nichts anderes als Abweichungen von der reinen Additivität der Haupteffekte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Warum reicht das Haupteffektmodell nicht aus?

A
  1. Gäbe es keine Abweichungen, dann würde das rein additive Haupteffektmodell bereits zur Erklärung der Daten ausreichen.
  2. Da es allerdings Abweichungen gibt, reicht diese reine Additivität nicht aus.
  3. Diese Abweichungen sind das, was man Interaktion (hier der zwei Faktoren A und B) nennt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Modellgleichung auf Parameter- und Messwertebene

A
  1. Parameterebene:
    µjk = µ + αj + βk + (αβ)jk
  2. Messwerte-Ebene:
    yijk = µ + αj + βk + (αβ)jk + eijk
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Interaktionshypothese

A

Interaktionseffekt AB (Schlafentzug × Altersgruppe):
H0AB: (αβ)jk = 0
H1AB: es gibt mindestens ein (αβ)jk ≠ 0
Die Nullhypothese des Interaktionseffekts AB nimmt an, dass es keine Abweichung von reiner Additivität gibt, d.h. die Daten rein durch die Haupteffekte erklärt werden können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Vorgehen

A

Empirisch: selten bis nie der Fall, dass Interaktionen komplett 0 sind, auch wenn dies in der Population tatsächlich zutreffen würde.

Das Vorgehen ist das Übliche:
1. Annahme der H0 zum Test der Interaktionseffekthypothese
2. Wie wahrscheinlich sind die beobachteten oder extremere Abweichungen (also die Interaktionen) unter dieser Annahme?
3. Sind sie sehr unwahrscheinlich, zweifeln wir an der Annahme der H0 und gehen davon aus, dass eine Interaktion beider Faktoren vorliegt, also eine Abweichung von reiner Additivität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Visualisierung von Daten

A
  1. Wenn Linien nicht parallel zueinander verlaufen, ist dies ein Hinweis auf das Vorliegen einer Interaktion.
  2. Wenn beide Linien parallel zueinander sind, würde man keine Interaktion vermuten, sondern sagen, beide Effekte verhalten sich additiv zueinander (vgl. Folie 23).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Grundlagen und Begriffe der zweifaktoriellen
Varianzanalyse: Interaktion - Interpretation einer Interaktion

A

Eine signifikante Zweifach-Interaktion bedeutet nicht, dass unter einer Stufe des einen Faktors ein signifikanter Effekt des anderen Faktors vorliegt, und unter anderen Stufen nicht. Es reicht, wenn die einzelnen Effekte der verschiedenen Stufen unterschiedlich stark sind. Dies impliziert übrigens
auch: Um festzustellen, ob der Effekt eines Faktors unterschiedlich stark ist bei verschiedenen Stufen eines anderen Faktors, muss die Interaktion berechnet werden. Einzelne Vergleiche reichen nicht; selbst dann nicht, wenn ein Vergleich signifikant wird, ein anderer nicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Berechnung der zweifaktoriellen Varianzanalyse: allgemeines Vorgehen

A

Berechnung ist konzeptuell identisch mit der einfaktoriellen Varianzanalyse:
1. Erfassung der Gesamtvariation der Daten mit der totalen Quadratsumme SStot
2. Zerlegung in einzelne Bestandteile
3. Überführung in Mittlere Quadratsummen
4. Berechnung der (3) F-Brüche zur Entscheidungsfindung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Berechnung der zweifaktoriellen Varianzanalyse: Quadratsummenzerlegung

A

Hier bei einer zweifaktoriellen Varianzanalyse wird SStot jetzt in insgesamt vier Bestandteile aufgeteilt:

  1. diejenigen Anteile, die auf die Haupteffekte der Faktoren A und B zurückgehen (SSA bzw. SSB)
  2. den Anteil der Interaktion AB (SSAB)
  3. den Anteil, der auf den Messfehler (SSw) zurückgeht
  4. Auch hier gilt die gleiche Additivität:
    SStot = SSA + SSB + SSAB + SSw

-> Genau wie in der einfaktoriellen Varianzanalyse wird SSw die Grundlage für den Fehlerterm bilden
s. F. 41

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was bedeutet Yijk?

A

Mit yijk ist der Messwert von Versuchsperson i in der Gruppe gemeint, die sich durch die Kombination von Stufe j des Faktors A und Stufe k des Faktors B ergibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welche Freiheitsgrade haben die Quadratsummen jeweils?

A

SStot: dftot= N-1
SSA: dfA= J-1
SSB= dfB= K-1
SSAB = dfAB= (J-1) * (K-1)
SSW= dfW = JK* (n-1) = N-JK

17
Q

F-Bruch

A

Pro Hypothesenpaar ein F-Bruch:
Zähler: die Mittlere Quadratsumme des relevanten Effekts
Nenner: immer MSw, also immer der gleiche Fehlerterm
FA= MSA /MSW
FB= MSB / MSW
FAB= MSAB / MSW
S. f. 52

18
Q

Welche Eigenschaften erfüllen die F-Brüche?

A
  1. Sie nehmen besonders extreme Werte an, je stärker die Daten gegen die H0 sprechen
  2. Ihr Verteilung unter der Annahme der Gültigkeit der entsprechenden H0 ist bekannt, alle drei F-Brüche sind f-verteilt, i.d.R. aber mit ver. Zählerfreiheitsgraden (die Nennerfreiheitsgrade sind immer gleich, da in allen drei Fällen MSw den Fehlerterm bildet
19
Q

Entscheidungsregeln

A

verwirf die H0, falls F> = Fkrit bzw. falls p <= Alpha ist

20
Q

Wichtigstes Maß der Effektstärke für Varianzanalysen

A

Anteil der Effektvarianz an der Gesamtvarianz
Eta² = Sigma² / Sigma²tot

21
Q

Auf welches Maß wird bei Mehreren Faktoren (Mehrfaktorielle Varianzanalyse) zurückgegriffen?

A

auf das partielle Eta²
- Hier wird die Effektvarianz an Summe aus relevanter Effektvarianz und Fehlervarianz (statt Gesamtvarianz) relativiert
Eta²p = Sigma² Effekt / (Sigma²Effekt + Sigma)

22
Q

Welche Eigenschaften hat das partielle Eta²?

A
  1. da der Nenner für das partielle Eta² ist kleiner als für Eta², gilt i.d.R. Eta²p > Eta²
  2. Daher kann die Summe der Eta²p aller Effekte auch größer werden als 1 (für Eta² ist dies nicht möglich)
23
Q

Schätzung von Eta²

A

(mit Hilfe der Mittleweren) Quadratsummen, wobei die meisten Computerprogramme folgende Formel benutzten:
Eta²p = SSeffekt /( SSeffekt + SSw)
Alternativ kann auch wieder eine konservative Schätzung genutzt werden:
Eta²p = (SSEffekt - dfEffekt * MSw) / (SSeffekt +(N-dfEffekt) * MSw)

24
Q

Ein- vs. zweifaktorielle Varianzanalyse

A
  1. Interaktionseffekt: zusätzlich zu den zwei Haupteffektehypothesen kann die Interaktion getestet werden. Teile der Gesamtvariabilität werden durch den zweiten Faktor bzw. die Interaktion gebunden (Sieht man an 4. Zusammensetzung von SSW) und daher sind zweifaktorielle ANOVA eher signifikant als einfaktorielle ANOVA
  2. Power-Erhöhung: Da der F-Bruch deutlich größer ist, d.h. der Haupteffekt würde leichter signifikant werden als bei der einfaktoriellen Varianzanalyse
  3. MSW kleiner: dies liegt daran, dass der Fehlerterm MSw im Nenner des F-Bruchs im zweifaktoriellen Fall kleiner geworden ist
  4. SSW: im einfaktoriellen Fall ist genau die Summe von SSB + SSAB + SSW der zweifaktoriellen Varianzanalyse. SSW ist im einfaktoriellen Fall kleiner als im Zweifaktoriellen

5

25
Q

Varianzanalyse mit mehr als zwei Faktoren: dreifaktorielles Design

A
  1. drei hautpeffektetypothesen A, B und C
  2. darüber hinaus kann jeder Faktor mit jedem anderen Faktor interagieren, also gibt es drei Interaktionshypothesen 1. Ordunung (d.h. Zweifach-Interaktionen: AB; AC und BC)
  3. eine Interaktion zweiter Ordnung, nämlich die Dreifach-Interaktion ABC. Wird diese Interaktion signifikant, bedeutet dies, dass die Interaktionen 1. Ordnung in ABhängigkeit von der Stufe des jeweil dritten Faktors unterschiedlich stark ausfallen
    s.F: 74
  4. Insgesamt können wir also schon 7 Hypothesenpaare aufstellen
  5. Die Quadratsummenzerlegung sieht wie folgt aus:
    SStot = SSA + SSB + SSAB +SSAC + SSBC + SSABC + SSW
26
Q

Wie funktioniert aggregate und was kann ich damit ausrechnen?

A

aggregate(AV ~ Prädiktor1, mean oder var)
gibt mir eine Tabelle mit den bedingten Mittelwerten oder den Varianzen. Aus den Mittelwerten der Tabelle lässt sich wieder der Grandmean berechnen. Wenn nach den Haupteffekte gefragt wird model.tables(aov_ergebnis), typ = “effects”)

27
Q

Wie setzt sich die Gesamtvarianz im Falle mehrerer Faktoren zusammen?

A

Aus den Varianzen aller beteiligten Effekte sowie der Fehlervarianz