7 Einfache lineare Regression Flashcards
Was interessiert uns bei der einfachen linearen Regression?
Der Zusammenhang zwischen der unabhänigen Variablen X und der abhängigen Variablen Y (d.h. die Regression einer abhängigen Variablen auf die unabhängige Variable)
Wie wird die unabhängige Variable in der Regressionsanalyse bezeichnet?
Prädikator
Wie wird die abhängige Variable in der Regressionsanalyse bezeichnet?
Kriterium
Welche drei Fragen werden mit der Regressionsanalyse beantwortet?
- Gibt es einen Zusammenhang zwischen der unabhängigen Variablen (UV) und der abhängigen Variablen (AV?) Wie stark hängen die Variablen zusammen? → Lässt sich auch nur mit Korrelation beantworten.
- Wie verändert sich die AV, wenn sich die UV verändert?
- Können die Werte der AV durch die Werte der UV vorhergesagt werden?
Warum ist es bei der Regressionsanalyse wichtig, die Daten anzuschauen?
Weil einzelne Ausreisser das Resultat komplett verfälschen können.
Weshalb brauchen wir die Regressionsanalyse zusätzlich zur Korrelation?
Weil die Korrelation meist nicht perfekt ist und deswegen keine Vorhersage möglich ist. Die Regressionsanalyse minimiert den Vorhersagefehler.
Wann verwendet man unstandardisierte Regressionsgewichte?
- wenn man an der Vorhersage der Y-Werte interessiert ist
- wenn man den Koeffizienten zwischen verschiedenen Gruppen vergleichen will
Wann verwendet man standardisierte Regressionsgewichte?
wenn man verschiedene Studien vergleicht, in denen dasselbe Konstrukt mit unterschiedlichen Messintstrumenten gemessen wurde
Was sind die Eigenschaften der Residualwerte?
- Die Summe aller Regressionsresiduen ist gleich Null
- Die Summe aller quadrierten Regressionsresiduen ist minimal
- Die Korrelation zwischen X und E ist gleich 0
- Die Korrelation zwischen Y^ und E ist gleich 0
Was ist der Standardschätzfehler?
Die Streuung der y-Werte um die Regressionsgerade (sE); Genauigkeit der Vorhersage
Was ist die Residualvarianz?
Der quadrierte Standardschätzfehler
Was ist der Determinationskoeffizient?
Der Anteil erklärter Varianz, Güte der Vorhersage
Zwischen welchen Werten liegt der Determinationskoeffizient und was bedeutet das?
- zwischen 0 und 1
- 0 = Gesamtvarianz ist auf Fehler zurückzuführen, die Regression erklärt nichts
- 1 = Die Varianz der vorhergesagten Werte entspricht der Gesamtvarianz, die Regression erklärt alles
Was sind die Voraussetzungen der einfachen linearen Regressionsanalyse?
- homoskedastizität
- Normalverteilung des Residuums
- Unabhängigkeit der Fehler
- Beide Variablen bivariat normalverteilt
- Linearität, beide Variablen sind indervallskaliert, oder dichotome Daten
Was bedeuten die Werte in der Tabelle “Model Fit Measures” aus Jamovi bei der linearen Regressionsanalyse?
R = Korrelation
R2 = gemeinsame Varianz der beiden Variablen
Adjusted R2 = Populations-Determinationskoeffizient
RMSE = Standardschätzfehler (root mean square error)