VL 2 - Einfache lineare Regression Flashcards
Was beschreibt die Korrelation?
Stärke/Enge des Zusammenhangs (r)
Was beschreibt die Regression?
Art d. Zusammenhangs zweier Variablen (ermöglicht Vorhersage der einen aus der anderen Variable)
Was ist das Ziel einer linearen Regression?
Vorhersage des Kriteriums durch den Prädiktor
Mit welchem Kriterium wird die Regressionsfunktion bestimmt?
Kriterium der kleinsten (Fehler)Quadrate (“least squares method”)
Was sind Eigenschaften bzw. Vorteile beim Kriterium der kleinsten Quadrate? (2)
- Werte sind immer positiv
- Größere Abweichungen werden stärker gewichtet als kleine
Was ist ein Residuum (“error”)?
Abweichung des beobachteten Werts vom vorhergesagten Wert
Was sind zwei Eigenschaften von Residualwerten?
- Residuen sind mit Prädiktorvariablen X unkorreliert
- Residuen sind mit den vorhergesagten Werten unkorreliert (weil Residuen zufällig sind)
Was ist die Interpretation des Regressionsgewichts b1?
- wie stark die Regressionsgerade ansteigt bzw. abfällt
- “Um wie viele Einheiten ändert sich der vorhergesagte Wert für Y, wenn X um eine Einheit erhöht wird?”
Was ist die Interpretation des Achsenabschnitts b0?
vorhergesagter Y-Wert für X=0
Was entspricht dem standardisierten Regressionsgewicht in der linearen Regression?
Korrelation
Welchen Wert hat der standardisierte Achsenabschnitt immer i. d. linearen Regression?
0
Wann sollte man NICHT standardisieren? (3)
- wenn Originalmetrik sinnvoll interpretiert werden kann (z.B. Anzahl Ex-Partner)
- Regression zur Vorhersage von Werten genutzt wird (z.B. Vorhersage d. Dauer einer Beziehung in Monaten)
- Gruppen verglichen werden sollen
Wann sollte man standardisieren? (2)
- wenn Originalskala nicht sinnvoll interpretierbar ist
- verschiedene Prädiktoren verglichen werden sollen, die sich in Originalmetrik, Mittelwerte und/oder Varianzen unterscheiden
Was sind Indikatoren der Schätzgenauigkeit/ für ein gutes Regressionsmodell?
Residuen = Indikator f. “Ähnlichkeit” der beobachteten und vorhergesagten Werte
(je kleiner, desto besser beschreibt das Modell die Daten)
Welcher Wert drückt aus wie “groß” die Residuen sind?
Standardschätzfehler (=Standardabweichung d. Residuen)
(NICHT standardisiert)
Welchen Wert würde man für eine Person vorhersagen, über
die man keine weiteren Informationen hat?
Mittelwert (bester Schätzer)
Wann führt eine Regressionsgerade zu einer besseren Vorhersage als der Mittelwert?
Wenn sich diese von den Mittelwerten unterscheidet
Was macht die Gesamtvarianz aus?
Erklärte Varianz (Regressionsvarianz) + unerklärte Varianz (Fehlervarianz)
Was beschreibt der Determinationskoeffizient?
Anteil der Varianz in Y, der auf systematische Varianz von X zurückgeführt werden kann
= Anteil der erklärten Varianz an der Gesamtvarianz
Was entspricht dem Determinationskoeffizienten?
R² (=quadrierte Korrelation)
Was sind vier Eigenschaften des Determinationskoeffizienten (R²)?
- Range: von 0 bis 1
- Standardisiertes Maß für die Modellgüte
- Kann als Effektgröße verwendet werden
- Entspricht eta² (Effektgröße in der Varianzanalyse)
Was prüft der Signifikanztest der Regression?
ob der Zusammenhang in der Stichprobe stärker ist als zufällig zu erwarten wäre
Wovon ist das Ergebnis des Signifikanztests d. linearen Regression abhängig? (3)
- Stärke des Zusammenhangs zwischen Prädiktor und Kriterium (r oder r²)
- Stichprobenumfang N
- Signifikanzniveau a
Welche Signifikanztests d. einfachen linearen Regression gibt es? (3)
- t-Test der Korrelation
- t-Tests des Regressionsgewichts
- F-Test der Regression
Welche Hypothese prüft der t-Test der Korrelation?
die Hypothese, dass in der Population ein bzw. kein Zusammenhang existiert
Was prüft der t-Test des Regressionsgewichtes?
Die Frage, ob die Varianzaufklärung durch den Prädiktor statistisch signifikant ist (“Ist die Steigung der Geraden überzufällig?”)
Was prüft der Signifikanztest der linearen Regression (F-Test)?
- ob die Quadratsumme der Regression größer ist als zufällig zu erwarten bzw. ob sich der Determinationskoeffizient signifikant von 0 unterscheidet
- ob die SSReg größer ist als die zufällig entstandene SSRes
Ist das Ergebnis der drei Signifikanztest der einfachen linearen Regression gleich?
Ja
Was testet der “Shapiro-Wilk-Normality Test”?
ob Residuen normalverteilt sind -> sollte nicht sign. sein