Multiple Lineare Regression Flashcards
Was ist eine multiple lineare Regression?
Eine Regression, bei der mehr als ein Prädiktor verwendet wird, um das Kriterium vorherzusagen.
Was versteht man unter dem Prädiktor in der multiplen Regression?
Eine unabhängige Variable, die zur Vorhersage des Kriteriums verwendet wird.
Was ist das Kriterium in der multiplen Regression?
Die abhängige Variable, deren Werte vorhergesagt werden sollen.
Was ist das Ziel der multiplen linearen Regression?
Das Vorhersagen des Werts einer abhängigen Variable basierend auf mehreren unabhängigen Variablen.
Welche Voraussetzungen müssen für eine multiple lineare Regression erfüllt sein?
Lineare Beziehung, keine Multikollinearität, Normalverteilung der Residuen, Homoskedastizität.
Was ist Multikollinearität?
Wenn zwei oder mehr Prädiktoren hoch miteinander korrelieren und somit redundant sind.
Was ist Homoskedastizität?
Die Residuen sollten über alle Prädiktoren hinweg gleiche Varianzen haben.
Was ist die Gleichung der multiplen linearen Regression?
Y = b_0 + b_1X_1 + b_2X_2 + … + b_nX_n + ε.
Was bedeutet R^2 in der multiplen Regression?
Der Anteil der Varianz im Kriterium, der durch die Prädiktoren erklärt wird.
Was ist der Adjusted R^2?
Ein korrigierter R^2-Wert, der die Anzahl der Prädiktoren berücksichtigt.
Was bedeutet ein signifikanter F-Test in der multiplen Regression?
Dass mindestens einer der Prädiktoren signifikant zur Vorhersage des Kriteriums beiträgt.
Wie wird die Signifikanz der Prädiktoren in der multiplen Regression getestet?
Mit einem t-Test für jeden Prädiktor.
Was zeigt ein hoher t-Wert bei einem Prädiktor an?
Dass der Prädiktor signifikant zur Vorhersage des Kriteriums beiträgt.
Was ist der standardisierte Regressionskoeffizient β?
Ein Koeffizient, der die Stärke des Effekts eines Prädiktors in z-standardisierten Einheiten angibt.
Was ist der unstandardisierte Regressionskoeffizient b?
Ein Koeffizient, der angibt, wie stark sich das Kriterium ändert, wenn der Prädiktor um eine Einheit steigt.
Was sind Residuen?
Die Differenz zwischen den beobachteten und den vorhergesagten Werten.
Was ist der Durbin-Watson-Test?
Ein Test, der prüft, ob die Residuen unabhängig voneinander sind.
Wie wird Multikollinearität in der multiplen Regression diagnostiziert?
Mit dem Variance Inflation Factor (VIF).
Was zeigt ein hoher VIF-Wert an?
Dass Multikollinearität vorliegt.
Was bedeutet es, wenn der VIF größer als 10 ist?
Es liegt eine problematische Multikollinearität vor.
Wie wird die Vorhersagegenauigkeit der multiplen Regression gemessen?
Mit dem R^2-Wert.
Was passiert, wenn Multikollinearität vorliegt?
Die Schätzungen der Regressionskoeffizienten werden ungenau.
Was ist die Partielle Korrelation in der multiplen Regression?
Die Korrelation zwischen einem Prädiktor und dem Kriterium, nachdem die anderen Prädiktoren kontrolliert wurden.
Was ist eine Schrittweise Regression?
Ein Verfahren, bei dem Prädiktoren schrittweise in das Modell aufgenommen oder entfernt werden.
Was ist eine Vorwärtsselektion in der multiplen Regression?
Ein Verfahren, bei dem der Prädiktor mit dem höchsten Beitrag zuerst in das Modell aufgenommen wird.
Was ist eine Rückwärtselimination in der multiplen Regression?
Ein Verfahren, bei dem der Prädiktor mit dem geringsten Beitrag zuerst entfernt wird.
Wann wird die standardisierte Version der Koeffizienten verwendet?
Wenn man die Stärke der Prädiktoren miteinander vergleichen möchte.
Was ist die Dummy-Kodierung?
Eine Methode, um nominalskalierte Variablen in eine binäre Form zu überführen.
Was ist der Unterschied zwischen einfacher und multipler linearer Regression?
Bei der einfachen Regression gibt es nur einen Prädiktor, bei der multiplen mehrere.
Was zeigt ein negativer Regressionskoeffizient an?
Dass der Prädiktor eine negative Beziehung zum Kriterium hat.
Was zeigt ein positiver Regressionskoeffizient an?
Dass der Prädiktor eine positive Beziehung zum Kriterium hat.
Was ist eine Interaktion in der multiplen Regression?
Wenn der Effekt eines Prädiktors auf das Kriterium von einem anderen Prädiktor abhängt.
Was ist die Methode der kleinsten Quadrate?
Ein Verfahren zur Schätzung der Regressionskoeffizienten, das die Summe der quadrierten Residuen minimiert.
Warum sollte Multikollinearität vermieden werden?
Sie erschwert die Interpretation der Prädiktoren und führt zu unzuverlässigen Ergebnissen.
Was ist eine Moderation in der multiplen Regression?
Ein dritter Prädiktor, der den Zusammenhang zwischen zwei Variablen verändert.
Wie überprüft man die Normalverteilung der Residuen?
Mit einem Q-Q-Plot oder dem Shapiro-Wilk-Test.
Was ist Heteroskedastizität?
Wenn die Varianz der Residuen nicht konstant ist.
Wie kann Heteroskedastizität entdeckt werden?
Durch einen Residual-Plot.
Was ist der Zweck einer Regressionsdiagnose?
Sicherzustellen, dass die Annahmen der Regression nicht verletzt werden.
Wie kann eine multiple Regression mit nominalen Prädiktoren durchgeführt werden?
Durch die Dummy-Kodierung der Prädiktoren.