Lineare Regression Flashcards
Ziel einer linearen Regression
- Vorhersage einer Variable (kriterium)
durch eine andere Variable (Praediktor)
Lineare Regression: Voraussetzungen
- X und Y sind intervallskaliert
- X und Y sind normalverteilt
- Homoskedastizitaet
- Residuen muessen unabhaengig und normalverteilt sein
Lineare Regression: Anwendungsbeispiel
- Werte von X wurden bereits erhoben, Werte von Y sind nicht bekannt
- X ist leicht, schnell zu erfassen, Y nur durch teure aufwaendige Untersuchung
Was sind Residuen?
die Abstaende der Werte zur Gerade
viele Werte nahe an der Gerade,
wenige Werte weiter weg
keine Homoskedastizitaet
Was beschreibt die Gerade?
den Zusammenhang zwischen X und Y
- jedes Wert von X kann ein Wert von Y vorhersagen
Was kann aus einer Regressionsgerade bestimmt werden
Regressionsgewicht (b) additive Konstante (a)
- wenn Streuungen, Mittelwerte und die Korrelation bekannt sind
Was fuer zwei moegliche Formen der Regressionsgeraden gibt es?
- unstandardisiert
- standardisiert (Konstante = 0)
Was ist der Standardschaetzfehler?
- die Standardabweichung der Residuen
- -> Streuung der y-Werte um die Regressionsgerade
- Mass dafuer wie stark die geschaetzten y-Werte von den tatsaechlichen y-Werten abweichen
- Guetemassstab fuer die Genauigkeit der Vorhersage
Welche Phaenomene muessen bei der Regression beachtet werden?
1) Regression zur Mitte
2) Restriction of Range
Regression zur Mitte
ein extremer Wert zu Zeitpunkt A wird sich zu Zeitpunkt B ueberzufaellig haeufig zu einem weniger extremen Wert veraendern wird
Regression zur Mitte: wie kann man dieses Phaenomen erklaeren?
Anhand der Normalverteilung
Regression zur Mitte: Problem
diese stat. Veraenderungen koennen inhaltlich interpretiert werden
Restriction of Range
- Variationseinschraenkung
- Streuung wird kuenstlich eingeschraenkt
Restriciton of Range: Problem?
Korrelation der Population wird unterschaetzt
–> Normalverteilungsannahme wird moeglicherweise verletzt