2 Moderierte Regression und Kovarianzanalyse Flashcards
Was gehört zum allgemeinen lindearen Modell (ALM)?
- Regressionsanalysen (einfache + multiple) -> bisher nur mit metrischen UV’s gelernt
- Varianzanalyse (mit/ohne Messwiederholung)(t-test) -> bisher nur mit kategorialen UV’s gelernt
Was wäre eine Regressionsanalysen mit kateogrialen Variablen?
Eine Moderierte Regression (prüfen)
Was wäre eine Varianzanalyse mit metrischen Variablen?
Eine Ko-varianzanalyse (prüfen)
Was ist eine moderierte Regression?
Eine Regressionsanalyse, bei der eine dritte Variable (Moderator) den Einfluss einer unabhängigen Variable auf die abhängige Variable verändert.
Woran erkennt man eine Moderation?
Wenn der Effekt einer unabhängigen Variable auf die abhängige Variable je nach Ausprägung des Moderators variiert.
Wie wird eine Moderation mathematisch dargestellt?
Y = b0 + b1X + b2Z + b3(X*Z) + e
Welche Variablen sind in einer moderierten Regression enthalten?
Unabhängige Variable (X), Moderator (Z), Interaktionsterm (X*Z), abhängige Variable (Y).
Warum ist eine Zentrierung der Variablen in der moderierten Regression sinnvoll?
Um Multikollinearität zwischen der unabhängigen Variable (X) und dem Interaktionsterm (X*Z) zu reduzieren und eine bessere Interpretation der Haupteffekte zu ermöglichen. Ansonsten sollten Haupteffekte nicht interpretiert werden, nur die Interaktion (was durchaus auch das Ziel sein kann).
Wie zentriert man eine Variable?
Man zieht von jedem Wert den Mittelwert der Variable ab: X_zentriert = X - Mittelwert(X).
Was passiert, wenn man Variablen in der moderierten Regression nicht zentriert?
Die Korrelation zwischen X und X*Z kann stark steigen, was zu hohen Standardfehlern und instabilen Regressionskoeffizienten führt.
Wann kann man auf die Zentrierung verzichten?
Wenn man sich nur für die Gesamtvorhersage des Modells interessiert und nicht die einzelnen Haupteffekte von X oder Z interpretieren möchte.
Wann ist eine Zentrierung nicht nötig?
Wenn X und Z bereits standardisiert sind oder die Werte um einen sinnvollen Nullpunkt interpretiert werden können (z. B. Alter ab Geburt).
Wie überprüft man, ob eine Moderation signifikant ist?
Durch den t-Test oder das Konfidenzintervall des Interaktionsterms (b3).
Was bedeutet ein signifikanter Interaktionseffekt?
Dass sich der Effekt von X auf Y je nach Wert des Moderators Z verändert.
Welche Codierungen werden in der Vorlesung behandelt?
- Dummy Codierung
- Ungewichtete Effektcodierung
- Gewichtete Effektcodierung
Warum braucht es für Codiervariablen immer eine weniger, als es Ausprägungen gibt?
Weil eine der Ausprägungen immer die Referenzgruppe (Interzept) darstellt und darum nicht zusätzlich als Variable gezählt wird.
Was ist eine Dummy-Codierung?
Eine Technik zur Umwandlung kategorialer Variablen in numerische Variablen (z.B. 0 = Gruppe A, 1 = Gruppe B).
In welchen Schritten erfolgt eine Dummy-Codierung?
- Wähle eine der c Kategorien der unabhängigen Variablen als Referenzkategorie aus.
- Weise dieser Referenzkategorie auf allen Codiervariablen den Wert 0 zu.
- Weise allen anderen Kategorien der unabhängigen VAriablen Werte auf den Codervariablen derart zu, dass:
- jede Kategorie nura uf einer einzigen Codiervariablen einen Wert von 1 aufweist, auf allen anderen den Wert 0
- jede Codiervariable nur für eine einzige Kategorie den Wert 1 aufweist, für alle anderen den Wert 0.
Was bedeuten die Regressionsgewichte bei der Dummy-Codierung?
β1 = Differenz zwischen dem Mittelwert der Kategorie, die auf X1 eine 1 hat (hier: Grosstadt) und der Referenzkategorie (hier: Kleinstadt)
β2 = Differenz zwischend em Mittelwert der Kategorie, die auf X2 eine 1 hat (hier: Mittelstadt) und der Referenzkategorie (hier: Kleinstadt). Im
Wie berechnet man bei der Dummy Codierung die Differenz zwischen dem Mittelwert der Nicht-Referenz-Kategorien? (Hier: Grosstadt und Mittelstadt)
Was ist eine ungewichtete Effekt-Codierung?
Eine Alternative zur Dummy-Codierung, bei der die Referenzgruppe den Wert -1 anstelle von 0 erhält.
Wie lautet die allgemeine Regel der ungewichteten Effektcodierung?
- Wähle eine der c Kategorien der unabhängigen Variablen als Referenzkategorie aus.
- Weise der Referenzkategorie auf allen Codiervariablen den Wert -1 zu.
- Weise allen anderen Kategorien der unabhängigen Variablen einen Wert auf den c - 1 Codervariablen derart zu, dass:
- jede Kategorie nur auf einer einzigen Codiervariablen einen Wert 1 aufweist, auf allen anderen Codiervariablen, den Wert 0
- jede Codiervariable nur für eine einzige Kategorie den Wert 1 und für die Referenzkategorie den Wert -1 aufweist, für alle anderen Kategorien den Wert 0.
Wie würde eine Regressionsanalyse mit ungewichteten Effektcodierten Variablen als UVs aussehen?
Was Bedeuten Achsenabschnitt und Regressionsgewichte bei der ungewichteten Effektcodierung?
β0 (Achsenabschnitt) = ungewichteter Mittelwert der Mittelwerte in den Kategorien (Hier: M Kleinstadt + M Mittelstadt + M Grossstadt) / 3
β1 (Regressionsgewicht) = Differenz zwischen dem Mittelwert der Kategorie, die auf X1 eine 1 hat (hier: Grosstadt) und dem ungewichteten Gesamtmittelwert
β2 (Regressionsgewicht) = Differenz zwischen dem Mittelwert der Kategorie, die auf X2 eine 1 hat (hier: Mittelstadt) und dem ungewichteten Gesamtmittelwert
Wie berechnet man den Mittelwert der Referenzkategorie (hier: Kleinstadt?) bei einer ungewichteten Effektcodierung?
Was ist eine gewichtete Effektcodierung?
Ähnlich wie eine ungewichtete, sie verwendet aber nicht -1, sondern passt die Zahl an, so dass unterschiedliche Stichprobengrössen ausgeglichen werden und er Mittelwert repräsentativ bleibt.
Wie lautet die allgemeine Regel der gewichteten Effektcodierung?
- Wähle eine der c Kategorien der unabhängigen Variablen als Referenzkategorie aus.
- Weise der Referenzkategorie auf der Codiervariablen Xj den Wert - (nxj/nR) zu.
- Weise allen anderen Kategorien der unabhängigen Variablen einen Wert auf den c - 1 Codervariablen derart zu, dass:
- jede Kategorie nur auf einer einzigen Codiervariablen einen Wert 1 aufweist, auf allen anderen Codiervariablen, den Wert 0
- jede Codiervariable nur für eine einzige Kategorie den Wert 1 und für die Referenzkategorie den Wert - (nxj/nR) aufweist, für alle anderen Kategorien den Wert 0.
Wie würde eine Regressionsanalyse mit gewichteten Effektcodierten Variablen als UVs aussehen?
Was Bedeuten Achsenabschnitt und Regressionsgewichte bei der gewichteten Effektcodierung?
β0 (Achsenabschnitt) = gewichteter Mittelwert der Mittelwerte in den Kategorien
β1 (Regressionsgewicht) = Differenz zwischen dem Mittelwert der Kategorie, die auf X1 eine 1 hat (hier: Grosstadt) zum gewichteten Gesamtmittelwert
β2 (Regressionsgewicht) = Differenz zwischen dem Mittelwert der Kategorie, die auf X2 eine 1 hat (hier: Mittelstadt) und dem gewichteten Gesamtmittelwert
Wie berechnet man den Mittelwert der Referenzkategorie (hier: Kleinstadt?) bei einer gewichteten Effektcodierung?
Wann verwendet man eine Dummy-Codierung?
Wenn man die Wirkung einer kategorialen Variable mit einer Referenzgruppe untersuchen möchte. D.h. wenn sich eine Referenzgruppe klar festlegen lässt und sie danach gar nicht so interessiert. (z.B. Häufig bei einer Kontrollgruppe)
Wann verwendet man eine Effekt-Codierung?
Wenn man die Mittelwerte aller Gruppen vergleichen möchte, nicht nur relativ zur Referenzgruppe. D.h. wenn es keine sinnvolle Referenzgruppe gibt.
Was ist der Unterschied zwischen einer ungewichteten und gewichteten Effektcodierung.
Ungewichtete Effektcodierung ist einfacher und wird genutzt, wenn alle Gruppen gleich behandelt werden.
Gewichtete Effektcodierung ist nützlich, wenn Gruppen unterschiedliche Stichprobengrössen haben und der Mittelwert repräsentativ bleiben soll.
Was ist der Unterschied zwischen Dummy- und Effekt-Codierung?
Dummy-Codierung vergleicht jede Gruppe mit einer Referenzgruppe, Effekt-Codierung vergleicht alle Gruppen relativ zum Gesamtmittelwert.
Wie analysiert man mehrere kategoriale Variablen bei einer Regression?
Durch die Aufnahme mehrerer Dummy- oder Effekt-Codierte Variablen in das Regressionsmodell.
Wie werden ordinale Variablen behandelt?
Sie können als kontinuierliche Prädiktoren aufgenommen oder durch Dummy-Codierung in Kategorien unterteilt werden.
Wie kombiniert man kategoriale und metrische Variablen in der Regression?
Durch eine additive Verknüpfung der Hauptvariablen sowie durch Interaktionsterme zwischen kategorialen und kontinuierlichen Variablen.
Was bedeutet eine Interaktion zwischen kategorialen und kontinuierlichen Variablen?
Dass der Effekt der kontinuierlichen Variable je nach Kategorie unterschiedlich sein kann.
Was ist eine Kovarianzanalyse (ANCOVA)?
Eine Kombination aus ANOVA (Varianzanalyse) und Regression. D.h. die Ergänzung der Varianzanalyse, die n ormalerweise kategoriale Prädiktoren enthält, durch metrische Prädiktoren.
-> sie testet den Einfluss einer unabhängigen kategorialen Variable auf eine abhängige Variable, während eine Kovariate kontrolliert wird.
Wofür wird die Kovarianzanalyse verwendet?
Um den Effekt einer unabhängigen Variable zu bereinigen, indem man Störvariablen (Kovariaten) statistisch herausrechnet.
Was ist eine Kovariate?
Eine metrische Variable, die mit der abhängigen Variable korreliert ist und deren Einfluss kontrolliert werden soll.
Welche Annahmen muss eine Kovarianzanalyse erfüllen?
- Lineare Beziehung zwischen Kovariate und AV
- Homogenität der Regressionsgeraden
- Normalverteilung der Residuen
- Homoskedastizität
Interagieren die kategorialen und metrischen Prädiktoren bei der Kovarianzanalyse? Wovon geht man aus?
Sie interagieren nicht.
Welche Schritte sind für eine Kovarianzanalyse vorzunehmen?
- Repräsentiere die kategorielen unabhängigen Variablen durch Codiervariablen
- Nimm die Codiervariablen und die kontinuierlichen unabhängigen Variablen in die multiple Regressionaanalyse auf.
- Lasse keine Interaktionen zwischen kategorialen und kontinuierlichen Variablen zu.
Was Bedeuten Achsenabschnitt und Regressionsgewichte bei der Kovarianzanalyse?
β0 = Erwarteter Wert Y (hier: LZ von Chinesen)(X2 = 0), die keinerlei positive affekte berichten (x1 = 0)
β1 = Anstieg von Y (hier: LZ um 0,699) für jede Einheit der Zunahme von X1 (hier: PA) bei Konstanthaltung von x2 (0 = China oder 1 = USA)
β2: Hier: Personen, die gleichviel PA erleben, haben in den usa (X2 = 1) eine um 2,971 höhere LZ als in China (X2 = 0)
Was muss man tun um sicherzustellen, dass keine Interaktion zwischen kategorialen und kontinuierlichen Variablen besteht?
Berechnen.