(Einkommens-)Regression Flashcards
Was ist eine Regression?
Rückführung einer abhängigen Variable (Regressand) auf unabhängige Variablen (Regressoren)
- ein Regressor: bivariante Regression
- mehrere Regressoren: multivariante Regression
einfache lineare Regression: yi = ß0 + ß1x1i + ß2x2i + ….
zwischen den Regressoren und der abhängigen Variablen wird ein linearer Zusammenhang angenommen
“Schätzung”
- Eine lineare Funktionsgerade wird durch die Punktewolke gelegt (=Regressionsgerade)
- Die Lage der Regressionsgeraden gibt den Zusammenhang dann “am besten” wieder, wenn die Summe der quadrierten Abweichungen am geringsten ist
Regressionsmodelle
- Level-Level
- Log-Level
- Level-Log
- Log-Log
Level-Level
y = ß0 + ß1*x + …. + u
u = Errorterm
Erhöht man x um eine Einheit, so verändert sich (c.p.) im Durchschnitt y um ß1 Einheiten.
Log-Level
loge(y) = ß0 + ß1*x + … + u
Erhöht man x um eine Einheit, so verändert sich (c.p.) im Durchschnitt y (approx.) um 100 * ß1%
Erhöht man x um eine Einheit, so verändert sich (c.p.) im Durchschnitt y (exakt) um 100*(e^ß1-1)%
Unterschiede werden bei Werten |ß1| > 0,1 bemerkbar
Level-Log
y = ß0 + ß1*loge(x) + …. + u
Erhöht man x um ein Prozent, so verändert sich (c.p.) im Durchschitt y um ß1/100 Einheiten
Log-Log
loge(y) = ß0 + ß1*loge(x) + … + u
Erhöht man x um ein Prozent, so verändert sich (c.p.) im Durchschnitt y um ß1%
Signifikanztest
Aussage kann nur nach Signifikanztest getroffen werden
Annahme: Es besteht kein Zusammenhang (Nullhypothese)
- bei F-Test (Gesamtmodell): alle Koeffizienten gleich Null
- bei t-Test: der jeweilige Koeffizient gleich Null
Signifikanzniveau = Irrtumswahrscheinlichkeit = Fehler 1. Art
von 1% -> mit 99% Wahrscheinlichkeit macht man keinen Fehler bei Ablehnung der Nullhypothese
F-Test
Gesamtschätzung:
- Bestimmtheitsmaß R^2 als Anteil der erklärten Varainz an der Gesamtvarianz der abhängigen Variable
-> höheres R^2 ist besser
-> zwischen 0 und 1
T-Test
Einzelne Regressoren: T-Wert: Koeffizient/Standardfehler
- T > 1,6: Signifikanz auf dem 10% Niveau (schwach signifikant bzw. *)
- T > 2: Signifikanz auf dem 5% Niveau (signifikant bzw. **)
- T > 2,6: Signifikanz auf dem 1% Niveau (hoch signifikant bzw. ***)y