Tag 4 - Regressionen Flashcards
1
Q
Lineare Regression
A
- Beziehung zwischen 2 metrischen Variablen x und y
- sagen wie viel der Variation von y durch lineare Beziehung zu x erklärt werden kann
- können neue Werte von y durch x vorhersagen
- Regressionsgerade sodass SSq minimal ist
- y = a + b*x
- im Allgemeinen darf man die Gerade nicht über den Wertebereich hinaus extrapolieren
- Stärke des Zusammenhangs = Korrelationskoeff (r)
- Bestimmtheitsmaß = r², sagt Anteil der Var von y die durch Var in x erklärt wird
2
Q
Ist Zusammenhang signifikant?
A
- Anova machen, gibt ja MW gesamt, vorhergesagte und echte Werte
- Regression hat immer 1df
- statistisch: yi = b0 + bi *xi + Ei
- Ei sind Residuen
- nicht signifikanter Zusammenhang kann auch heißen Zsm ist nicht linear! immer einmal graphisch gucken!
- auch Annahmen prüfen: Normvert Residuen, Varianzhomogenität
3
Q
Leverage-Werte
A
- sagen ob bestimmte Punkte besonders hohen Einfluss auf fit des Modells haben (genau wie Cook’s distance)
- oft hoch bei Ausreißern
- Leverage Werte > 0.5 sind Problem, oder auch schon > 0.3
4
Q
Multiple Regression
A
- mehrere unabhänigige Variablen, schauen welche am wichtigsten
- eher für vergleichende Studien als für Experimente
- Variablen sind idR untereinander korreliert
- y muss numerisch sein (und intervallskaliert, also abstände bedeuten immer das Gleiche)
- unabh Variablen können numerisch oder binomial sein (0-1 codiert)
- Regressionskoeffs geben an wie viel y sich ändert wenn x um 1 Einheit zunimmt
5
Q
Probleme multipler Regressionen
A
- sind ANOVA Typ 2 Modell, also shared variance fehlt
- man kann auch Typ 1 machen wenn man 1 Faktor als Störgröße annimmt
- man kann Partielle Regressionskoeffs machen: sind Koeffs wenn man außer einem alle Effekte konstant hält, schauen wie viel Effekt zusätzlicher dann noch hat, also schauen um wie viele Stabw sich y ändert wenn sich x um eine Stabw ändert