Einfache lineare Regression Flashcards
(10 cards)
Was besagt die einfache lineare Regressionsanalyse
beschreibt die Art des Zusammenhangs (nicht die Stärke)
welches Ziel verfolgt die einfache lineare Regressionsanalyse?
eine Ausprägung der Variable y (Kriterium) durch eine andere x (Prädiktor) vorherhzusagen
unterschiedlicher Stellenwert der Variablen, da Festlegung von Kriterium und Prädiktor
Welche Voraussetzungen müssen für eine einfache lineare Regression erfüllt sein?
Intervallskalierung
Bivariate Normalverteilung von x und y (Dichtefunktion!)
Homoskedastizität
Unabhängigkeit und Normalverteilung der Residuen
Warum wird sie in den Sozialwissenschaften benutzt?
weil nicht ein deterministischer, sondern ein stochastischer Zusammenhang relevant ist ( = nicht exakte Vorhersage, sondern geringster Fehler)
Wie geht man dabei vor?
Ermittlung einer Regressionsgeraden mit geringstem Vorhersagefehler (=Differenz zw. tats. und erwart. Werten)
y^= b(yx)x + a(yx)
–> Methode der kleinsten Quadrate (= Summe der quadr. Abweichungen ist minimal)
b(yx) = Regressionsgewicht: Maß für Einfluss der Variable (um wie viel der Wert y steigt, wenn x sich um eine Einheit erhöht)
a(yx) = y-Achsenabschnitt = Interzept
wie ist die Güte der Vorhersage zu bewerten?
keine exakte Vorhersage, sondern kleinster Fehler
- -> Ausmaß abhängig von Höhe der Korrelation
- -> StandardSCHÄTZfehler zur Berechnung der Fehler
Was besagt der Standardschätzfehler s(e)
Maß für die Ungenauigkeit der Vorhersage (je kleiner, desto genauer)
wie stark beobachtete Werte um vorhergesagte Werte streuen (Abstand = Residuen)
Was ist die Gesamtvarianz?
Maß für Unterschiede im Kriterium
setzt sich zusammen aus Regressionsvarianz und Residualvarianz
y(i) - y(quer) = Residualvarianz + Regressionsvarianz
y(i) - y(quer) = (y(i) - y^) + (y^- yquer) –> Varianzzerlegung
Was ist die Regressionsvarianz?
Anteil der durch die Regression aufgeklärt wird
Maß für die Güte ist der Anteil der RV an GV (großer Anteil: Prädiktor ist bedeutsam)
Was ist der Determinationskoeffizient r²?
Anteil der Regressionsvarianz an der Gesamtvarianz
Anteil von y, der durch x aufgeklärt werden kann (wie genau/bedeutsam y durch x vorhergesagt werden kann)