Multiple Regression Flashcards
Wozu braucht man eine multiple Regression?
berechnet, wie gut MEHRERE Prädiktoren das Ergebnis hervorsagen (Aufschluss über Einfluss)
Wie berechnet man eine MR?
Durch Berechnung einer gewichteten Linearkombination in der Analyse
y^ = b(1)x(1) + b(2)x(2) + b(3)x(3)….. + b(n)x(n) + a
(jeder Prädiktor hat eigenes Regressionsgewicht)
Wie setzt sich das Kriterium zusammen?
aus R² (aufgeklärte V.) und 1-R² (Residualvarianz)
Was sind Residuen?
Abstände der Punkte (gemessene Werte) zur Ebene (erwartete Werte)
Vorhersagefehler
Wozu braucht man das standardisierte Regressionsgewicht β?
macht Gewichte vergleichbar, da durch z-Transformation gleiche Maßeinheit
Wertebereich -1 bis 1
ändert sich x um eine Einheit, ändert sich y^um β-Einheiten
Wie sind die Gütemaße der MR?
MR gibt an, wie hoch y^ mit y-Werten korrelieren (je höher,desto genauere Vorhersage aufgrund der Prädiktoren)
Modell umso besser, je höher R² (aufgeklärte V./Gesamtvarianz) –> Prozentanteil
Was ist das Ziel einer MR?
Prädiktoren mit möglichst hoher spezifischer Varianz finden, da diese einen großen Beitrag zur Vorhersage leisten
Wie wird die Güte eines Modells überprüft?
F-Test prüft Anteil von R² auf Signifikanz (von 0 verschieden)
- -> nicht signif.? –> unpassendes Modell, Stop
- -> signif.? –> passendes Modell, weiter mit t-Test um herauszufinden, WELCHE Prädiktoren signifikanten Einfluss haben (Vergleich β-Gewichte)
Was ist bei der multiplen Regression bzg. der Multikollineraität zu beachten?
wenn Prädiktoren untereinander hoch korrelieren (Multikollinearität), schlechtes Modell, da geringe spezifische Varianz
–> ein Prädiktor ist redundant und wird nicht benötigt
–> Korrelation IMMER betrachten, da in R² sowohl spezifische als auch gemeinsame Varianzen sind
Überprüfung durch Modell mit allen 3 bzw nur 2 Prädiktoren –> verändert sich R² nicht, ist er redundant
Regressionsgewichte sind…
…nicht Merkmal des Kriteriums, sondern Merkmal des Modells
–> ändern sich bei unterschiedlichen Prädiktoren!
Was ist ein Supressoreffekt?
liegt vor, wenn ein Prädiktor ein hohes β-Gewicht durch Unterdrückung unerwünschter Varianzanteile andere Prädiktoren bekommt
!keine Korrelation mit Kriteriom, dennoch signifikantes β-Gewicht (negativ!)!
Supressorvariablen sind unerwünscht, besser Modell ohne sie!
Welche Prädiktorselektionsverfahren gibt es? Warum gibt es sie?
Ziel der Modellbildung: möglichst hohes R² durch möglichst wenige Prädiktoren (nur die, die tatsächlich bedeutsam sind)
exploratives Vorgehen, um bedeutsame P. herauszufiltern
Beurteilung, wie sich R² ändert durch Hinzunahme /Weglassen
Vorwärts- und Rückwärtsverfahren
Beschreibe das Rückwärtsverfahren
1.Start mit vollständigem Prädiktorensatz
- Prädiktor mit geringstem nicht-signif. Gewicht wird entfernt
- -> solange, bis signifikante Verschlechterung erzielt wird
–> ja? Verfahren stoppt, bestmöglichster P.-satz
Beschreibe das Vorwärtsverfahren
- Start mit dem Prädiktor, der die höchste Korrelation hat (höchstes Gewicht)
- Hinzunahme des nächst höheren
- -> solange, bis keine signifikante Verbesserung mehr erzielt wird