Einfache lineare Regression Flashcards
Was besagt die einfache lineare Regressionsanalyse
beschreibt die Art des Zusammenhangs (nicht die Stärke)
welches Ziel verfolgt die einfache lineare Regressionsanalyse?
eine Ausprägung der Variable y (Kriterium) durch eine andere x (Prädiktor) vorherhzusagen
unterschiedlicher Stellenwert der Variablen, da Festlegung von Kriterium und Prädiktor
Welche Voraussetzungen müssen für eine einfache lineare Regression erfüllt sein?
Intervallskalierung
Bivariate Normalverteilung von x und y (Dichtefunktion!)
Homoskedastizität
Unabhängigkeit und Normalverteilung der Residuen
Warum wird sie in den Sozialwissenschaften benutzt?
weil nicht ein deterministischer, sondern ein stochastischer Zusammenhang relevant ist ( = nicht exakte Vorhersage, sondern geringster Fehler)
Wie geht man dabei vor?
Ermittlung einer Regressionsgeraden mit geringstem Vorhersagefehler (=Differenz zw. tats. und erwart. Werten)
y^= b(yx)x + a(yx)
–> Methode der kleinsten Quadrate (= Summe der quadr. Abweichungen ist minimal)
b(yx) = Regressionsgewicht: Maß für Einfluss der Variable (um wie viel der Wert y steigt, wenn x sich um eine Einheit erhöht)
a(yx) = y-Achsenabschnitt = Interzept
wie ist die Güte der Vorhersage zu bewerten?
keine exakte Vorhersage, sondern kleinster Fehler
- -> Ausmaß abhängig von Höhe der Korrelation
- -> StandardSCHÄTZfehler zur Berechnung der Fehler
Was besagt der Standardschätzfehler s(e)
Maß für die Ungenauigkeit der Vorhersage (je kleiner, desto genauer)
wie stark beobachtete Werte um vorhergesagte Werte streuen (Abstand = Residuen)
Was ist die Gesamtvarianz?
Maß für Unterschiede im Kriterium
setzt sich zusammen aus Regressionsvarianz und Residualvarianz
y(i) - y(quer) = Residualvarianz + Regressionsvarianz
y(i) - y(quer) = (y(i) - y^) + (y^- yquer) –> Varianzzerlegung
Was ist die Regressionsvarianz?
Anteil der durch die Regression aufgeklärt wird
Maß für die Güte ist der Anteil der RV an GV (großer Anteil: Prädiktor ist bedeutsam)
Was ist der Determinationskoeffizient r²?
Anteil der Regressionsvarianz an der Gesamtvarianz
Anteil von y, der durch x aufgeklärt werden kann (wie genau/bedeutsam y durch x vorhergesagt werden kann)