Vorlesung 2 Einfache lineare Regression Flashcards
Was beschreibt die Korrelation?
Stärke/Enge des Zusammenhanges
Was beschreibt die Regression ?
Art des Zusammenhanges zweier Variablen (ermöglicht Vorhersage der einen aus der anderen Variable
Was ist das Ziel einer linearen Regression ?
Vorhersage des Kriteriums durch den Prädiktor
Mit welchem Kriterium wird die Regressionsfunktion bestimmt ?
Kriterium der kleinsten (Fehler)Quadrate (“least squares method”)
Was sind Eigenschaften bzw. Vorteile beim Kriterium der kleinsten Quadrate?
- Werte sind immer positiv
- Größere Abweichungen werden stärker Gewichtet
Was ist ein Residuum ?
Abweichung des beobachteten Wertes vom vorhergesagten Wert
Was sind zwei Eigenschaften von Residualwerten?
1.Residuen sind mit Prädiktorvariable X unkorreliert
2.Residuen sind mit dem vorhergesagten Werten unkorreliert (weil Residuen zufällig sind )
Wie interpretiert man das Regressionsgewicht?
- gibt an wie stark die Regressionsgerade ansteigt bzw. abfällt
- gibt an um wie viele Einheiten sich der vorhergesagt Kriteriumswert Y ändert, wenn sich der Prädiktor X um eine Einheit verändert
Wie interpretiert man den Achsenabschnitt ?
Vorhergesagter Y- Wert für X=0
Was entspricht dem standardisierten Regressionsgewicht in der linearen Regression?
Korrelation
Welchen Wert hat der standardisierte Achsenabschnitt immer in der linearen Regression ?
0
Was sollte man nicht standardisieren ?
- wenn Orginalmetrik sinnvoll interpretiert werden kann (z.B Anzahl der Ex- Partnern)
- Regression zur Vorhersage von Werten genutzt wird (z.B Vorhersage Dauer einer Beziehung in Monaten
- Gruppen verglichen werden
Wann sollte man standardisieren?
- wenn Orginalskala nicht sinnvoll interpretierbar ist
- verschiedene Prädiktoren verglichen werden sollen, die sich in Orginalmetrik, Mittelwert und/ oder Varianz unterscheiden
Was sind Indikatoren der Schätzgenauigkeit / für ein gutes Regressionsmodell?
Residuen= Indikator für “Ähnlichkeit” der beobachteten und vorhergesagten Werten
(Je kleiner, desto besser beschreibt das Modell die Daten)
Welcher Wert drückt aus, wie “groß” die Residuen sind ?
Standardschätzfehler
(Standardabweichung der Residuen)
(Nicht standardisiert)
Welchen Wert würde man für eine Personen vorhersagen, über die man keine weiteren Informationen hat?
Mittelwert (bester Schätzer)
Wann führt eine Regressionsgerade zu einer besseren Vorhersage als der Mittelwert ?
Wenn sich diese von den Mittelwerten unterscheidet
Was macht die Gesamtvarainz aus ?
Regressionsvarianz (erklärte Varianz) + Fehlervarianz (unerklärte Varianz)
Was beschreibt der Determinationskoeffizient?
Anteil der Varianz im Kriterium Y, der auf die Varianz von X zurückzuführen ist
= Anteil der erklärten Varianz an der Gesamtvarianz
Was entspricht dem Determinationkoeffizienten ?
R^2 (quadrierter Korrelation)
Was sind 4 Eigenschaften des Deternimationskoeffizient (R^2)?
- Range von 0-1
- Standardiesertes Maß für die Modellgüte
- kann als Effktgröße verwendet werden
- entspricht eta^2 (Effektgröße in der Varianzanalyse)
Was prüft der Signifikanztest der Regression ?
Ob Zusammenhang in der Stichprobe stärker ist als zufällig zu erwarten wäre
Wovon ist das Ergebnis des Signifikanztestes der linearen Regression abhängig ?
- Stärke des Zusammenhanges zwischen Prädiktor und Kriterium (r oder r^2)
- Stichprobenumfang
- Signifikanzniveau a
Welche Signifikanztest der einfachen linearen Regression gibt es?
- t-Test der Korrelation
- t-Test des Regressionsgewichts
- F- Test der Regression
Welche Hypothese prüft der t-Test der Korrelation
Die Hypothese, dass in der Population ein bzw. kein Zusammenhang existiert
Was prüft der t-Test des Regressionsgewichtes?
Die Frage, ob die Varianzaufklärung durch den Prädiktor statistisch signifikant ist (“ist die Steigung der Geraden überzufällig?”)
Was prüft der Signifikanztest der linearen Regression (F-Test)
- ob die Quadratsumme der Regression größer ist als zufällig zu erwarten bzw. ob sich der Determinationskoeffizinent signifikant von 0 unterscheidet
- ob SSReg größer ist als die zufällig entstandene SSRes
Ist das Ergebnis der drei Signifikanztests der einfachen linearen Regression gleich?
Ja