Multiple Regression Flashcards

1
Q

Was ist eine Partialkorrelation?

A

Der Zusammenhang zwischen 2 Variablen, nachdem der Einfluss einer dritten Variable kontrolliert (“auspartialisiert”) wurde: Korrelation zwischen Regressionsresiduen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definition von Residuen bei der Regression

A
  • Differenz zwischen beobachtetem & vorhergesagtem Wert
  • Unterschiede, die nicht durch Prädiktor(en) erklärt werden können
  • Residuen sind Variablen, da jeder Datenpunkt seinen eigenen Residualwert hat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Ablauf der Partialkorrelation

A

Es besteht eine Korrelation von X und Y, die durch Z beeinflusst wird

  • Regression von X auf Z
  • Regression von Y auf Z
  • Korrelation der Residualvariablen von X & Y, ohne Einfluss von Z
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Formel zur Partialkorrelation

A

Formel zum mit der Hand ausrechnen in der Formelsammlung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist eine Semipartialkorrelation?

A

Der Zusammenhang von 2 Variablen, nachdem der EInfluss einer dritten auf eine der beiden auspartialisiert worden ist.

Von der anderen Variable können die Rohwerte verwendet werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Verwendung von Partial- oder Semipartialkorrelation?

A

Entscheidung aufgrund theoretischer Überlegungen/Hypothese

  • Partial: Annahme, dass X und Y durch Z kausal beeinflusst werden
  • Annahme, dass nur X oder nur Y durch Z kausal beeinflusst wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Bedingungen für Kausalität

A
  • Zusammenhang zweier Variablen
  • zeitliche Ordnung
  • Kontrolle von Störvariablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Modellgleichung für tatsächliche/beobachtete Werte in der multiplen Regression

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Modellgleichung für vorhergesagtre Werte in der multiplen Regression

A

b0: Achsenabschnitt, vorhergesagter Y-Wert für X1 = 0 und X2 = 0

b1: Steigungskoeffizient für X1; Veränderung in Y, wenn X1 um eine Einhiet erhöht und X2 konstant gehalten/kontrolliert wird

b2: Steigungskoeffizient für X2; Veränderung in Y, wenn X2 um eine Einhiet erhöht und X1 konstant gehalten/kontrolliert wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Determinationkoeffizient

A

R2 ist kein erwartungstreuer Schätzer für den Populations-Determinantionskoeffizient 𝚸2, korrigiertes in Formelsammlung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Annahmen der Regression

A
  • Unabhängigkeit der Resiuden: dürfen nicht korreliert sein
    • Verletzung durch hierarchisch geschachtelte Daten oder Messwiederholungen
  • Komoskedastizität: bedingte Residualvarianzen unterscheiden sich in der Population nicht
  • Normalverteilung der Residuen um die Regressionsgrade
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hypothesen des Tests der multiplen Regression

A

H0: 𝚸2 = 0 bzw. β1 = … = βj = βk = 0

H1: 𝚸2 ≠ 0 bzw. mind. ein βj ≠ 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Freiheitsgrade beim Test der multiplen Determination R2

A

dfRegression = k

dfResiduen = n - k - 1

k = Anzahl Prädiktoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hypothesen des Tests für einen einzelnen Regressionskoeffizienten

A

H0: βj = 0

H1: βj ≠ 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Freiheitsgrade beim Test für einen einzelnen Regressionskoeffizienten

A

df = n - k - 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ablauf des Tests für mehrere Regressionskoeffizienten

A

Modellvergleich: Modell A ohne interessierende Variable, Modell B mit

➜ Vergleich der Determinationskoeffizienten R2 beider Modelle

  1. Bestimmte R2 für Modell A
  2. Bestimmte R2 für Modell B
  3. Berechne die Differenz der beiden R2
  4. Teste die Differenz auf Signifikanz
17
Q

Voraussetzungen für den Modellvergleich

A
  • beide Modelle sind mit der selben Stichprobe geschätzt
  • Die Modelle sind geschachtelt: von einem Modell kann in das andere überführt werden, indem entweder Prädiktoren hinzugefügt oder entwernt werden (niemals beides!)
18
Q

Wieso muss noch ein Signifikanztest durchgeführt werden, wenn ein Unterschied zwischen den R2 zweier Modelle besteht?

A

Aufnahme zusätzlicher Prädiktoren führt immer zu einer Verbesserung der Varianzaufklärung (höheres R2), Da wir zwar das bestmögliche aber auch das einfachste Modell suchen (Parsimonität), ist die Aufnahme zusätzlicher Prädiktoren nur dann sinnvoll, wenn die Zunahme von R2 statistisch signifikant ist

19
Q

Hypothesen für Modellvergleiche

A

H0: 𝚸1 = 𝚸2

H1: 𝚸1 < 𝚸2

20
Q

Effektgrößen beim Modellvergleich/der multiplen Regression

A

R2 ist ein standardisiertes Maß & eignet sich als Effektgröße

für a-priori-Poweranalysen wird aber meistens Cohens f2 verwendet:

f2 = .02: kleiner Effekt

f2 = .15: mittlerer Effekt

f2 = .35: großer Effekt

21
Q

Interpretation einer Modellgleichung eines Modells mit Dummy-Variablen

A
22
Q

Parsimonität

A

Ein Modell sollte den Zusammenhang zwar bestmöglich beschreiben, gleichzeitig aber auch so unkompliziert (sparsam) wie möglich sein