Wozu braucht man eine multiple Regression?
berechnet, wie gut MEHRERE Prädiktoren das Ergebnis hervorsagen (Aufschluss über Einfluss)
Wie berechnet man eine MR?
Durch Berechnung einer gewichteten Linearkombination in der Analyse
y^ = b(1)x(1) + b(2)x(2) + b(3)x(3)….. + b(n)x(n) + a
(jeder Prädiktor hat eigenes Regressionsgewicht)
Wie setzt sich das Kriterium zusammen?
aus R² (aufgeklärte V.) und 1-R² (Residualvarianz)
Was sind Residuen?
Abstände der Punkte (gemessene Werte) zur Ebene (erwartete Werte)
Vorhersagefehler
Wozu braucht man das standardisierte Regressionsgewicht β?
macht Gewichte vergleichbar, da durch z-Transformation gleiche Maßeinheit
Wertebereich -1 bis 1
ändert sich x um eine Einheit, ändert sich y^um β-Einheiten
Wie sind die Gütemaße der MR?
MR gibt an, wie hoch y^ mit y-Werten korrelieren (je höher,desto genauere Vorhersage aufgrund der Prädiktoren)
Modell umso besser, je höher R² (aufgeklärte V./Gesamtvarianz) –> Prozentanteil
Was ist das Ziel einer MR?
Prädiktoren mit möglichst hoher spezifischer Varianz finden, da diese einen großen Beitrag zur Vorhersage leisten
Wie wird die Güte eines Modells überprüft?
F-Test prüft Anteil von R² auf Signifikanz (von 0 verschieden)
Was ist bei der multiplen Regression bzg. der Multikollineraität zu beachten?
wenn Prädiktoren untereinander hoch korrelieren (Multikollinearität), schlechtes Modell, da geringe spezifische Varianz
–> ein Prädiktor ist redundant und wird nicht benötigt
–> Korrelation IMMER betrachten, da in R² sowohl spezifische als auch gemeinsame Varianzen sind
Überprüfung durch Modell mit allen 3 bzw nur 2 Prädiktoren –> verändert sich R² nicht, ist er redundant
Regressionsgewichte sind…
…nicht Merkmal des Kriteriums, sondern Merkmal des Modells
–> ändern sich bei unterschiedlichen Prädiktoren!
Was ist ein Supressoreffekt?
liegt vor, wenn ein Prädiktor ein hohes β-Gewicht durch Unterdrückung unerwünschter Varianzanteile andere Prädiktoren bekommt
!keine Korrelation mit Kriteriom, dennoch signifikantes β-Gewicht (negativ!)!
Supressorvariablen sind unerwünscht, besser Modell ohne sie!
Welche Prädiktorselektionsverfahren gibt es? Warum gibt es sie?
Ziel der Modellbildung: möglichst hohes R² durch möglichst wenige Prädiktoren (nur die, die tatsächlich bedeutsam sind)
exploratives Vorgehen, um bedeutsame P. herauszufiltern
Beurteilung, wie sich R² ändert durch Hinzunahme /Weglassen
Vorwärts- und Rückwärtsverfahren
Beschreibe das Rückwärtsverfahren
1.Start mit vollständigem Prädiktorensatz
–> ja? Verfahren stoppt, bestmöglichster P.-satz
Beschreibe das Vorwärtsverfahren