Vorlesung 8 Flashcards
Was ist das Hauptziel der linearen Regression?
Vorhersage einer abhängigen Variable anhand einer oder mehrerer unabhängiger Variablen.
Was beschreibt die Regressionsgerade?
Den besten linearen Zusammenhang zwischen unabhängiger und abhängiger Variable.
Wie lautet die allgemeine Formel der linearen Regression?
y = b_0 + b_1 \cdot x
Was bedeutet b_0 in der Regressionsformel?
Der Achsenabschnitt (intercept), also der Wert von y, wenn x = 0 ist.
Was bedeutet b_1 in der Regressionsformel?
Die Steigung der Regressionsgeraden, also die Änderung von y bei einer Einheit Änderung von x.
Was zeigt die Steigung b_1 an?
Den Einfluss der unabhängigen Variable auf die abhängige Variable.
Wie nennt man b_1 auch?
Regressionskoeffizient
Was ist die abhängige Variable?
Die zu erklärende Variable, auch Kriteriumsvariable genannt.
Was ist die unabhängige Variable?
Die Variable, die zur Vorhersage genutzt wird, auch Prädiktor genannt.
Was ist der Fehlerterm in der linearen Regression?
Die Differenz zwischen den beobachteten und den vorhergesagten Werten von y.
Was zeigt die Regressionsanalyse?
Ob und wie stark die unabhängige Variable die abhängige Variable vorhersagt.
Was ist das Ziel der einfachen linearen Regression?
Den Zusammenhang zwischen zwei Variablen zu beschreiben.
Was versteht man unter “Residuen”?
Die Differenzen zwischen den beobachteten und den geschätzten Werten.
Wie wird die Güte einer Regression gemessen?
Durch das Bestimmtheitsmaß R^2
Was gibt R^2 an?
Den Anteil der Varianz der abhängigen Variable, der durch die unabhängige Variable erklärt wird.
Wie wird R^2 interpretiert?
Als Prozentsatz der erklärten Varianz.
Was ist der Unterschied zwischen R^2 und r?
r ist der Korrelationskoeffizient, R^2 ist der Anteil der erklärten Varianz.
Was bedeutet ein R^2-Wert von 0?
Die unabhängige Variable erklärt keine Varianz der abhängigen Variable.
Was bedeutet ein R^2-Wert von 1?
Die unabhängige Variable erklärt die gesamte Varianz der abhängigen Variable.
Was ist die Adjustierung von R^2?
Eine Korrektur des R^2-Wertes für die Anzahl der Prädiktoren und die Stichprobengröße.
Warum wird R^2 adjustiert?
Um eine Überschätzung bei kleinen Stichproben oder vielen Prädiktoren zu vermeiden.
Was bedeutet eine hohe Korrelation zwischen x und y?
Eine starke lineare Beziehung.
Was sind “Ausreißer” in der Regressionsanalyse?
Datenpunkte, die stark von der Regressionslinie abweichen.
Wie beeinflussen Ausreißer die Regression?
Sie können die Schätzung der Regressionsgerade stark verzerren.
Wie kann man Ausreißer in der Regressionsanalyse erkennen?
Durch grafische Darstellungen wie Streudiagramme oder Residuenplots.
Was bedeutet Homoskedastizität?
Die Varianz der Residuen ist für alle Werte von x gleich.
Was bedeutet Heteroskedastizität?
Die Varianz der Residuen ändert sich mit den Werten von x.
Wie überprüft man Homoskedastizität?
Mit einem Plot der Residuen gegen die vorhergesagten Werte.
Was ist Multikollinearität?
Wenn zwei oder mehr unabhängige Variablen stark miteinander korrelieren.
Warum ist Multikollinearität problematisch?
Sie macht es schwer, die einzelnen Effekte der Prädiktoren zu isolieren.
Wie kann man Multikollinearität testen?
Mit dem Variance Inflation Factor (VIF).
Was ist ein hoher VIF-Wert?
Ein Hinweis auf mögliche Multikollinearität.
Was bedeutet ein VIF-Wert größer als 10?
Eine starke Multikollinearität.
Was ist das Durbin-Watson-Statistik?
Ein Test auf Autokorrelation der Residuen.
Was bedeutet Autokorrelation?
Wenn die Residuen aufeinanderfolgender Beobachtungen korrelieren.
Was ist das Ziel der multiplen linearen Regression?
Die Vorhersage einer abhängigen Variable durch mehrere unabhängige Variablen.
Wie unterscheidet sich die multiple von der einfachen Regression?
Es gibt mehr als eine unabhängige Variable.
Wie lautet die Formel der multiplen linearen Regression?
(y = b_0 + b_1 \cdot x_1 + b_2 \cdot x_2 + \dots + b_n \cdot x_n)
Was zeigt die Standardisierung der Regressionskoeffizienten an?
Die relative Bedeutung der Prädiktoren.
Was ist der standardisierte Regressionskoeffizient?
Der Regressionskoeffizient, wenn alle Variablen z-standardisiert sind.
Was bedeutet ein standardisierter Koeffizient von 0?
Kein Zusammenhang zwischen Prädiktor und Kriterium.
Was zeigt ein standardisierter Koeffizient größer als 0 an?
Ein positiver Zusammenhang zwischen Prädiktor und Kriterium.
Was zeigt ein standardisierter Koeffizient kleiner als 0 an?
Ein negativer Zusammenhang zwischen Prädiktor und Kriterium.
Was ist ein t-Test in der Regression?
Ein Test zur Überprüfung, ob ein Regressionskoeffizient signifikant ist.
Was zeigt ein signifikanter t-Wert an?
Der Prädiktor hat einen signifikanten Einfluss auf die abhängige Variable.
Was ist das F-Test in der Regression?
Was zeigt ein signifikanter F-Wert an?
Das Modell erklärt signifikant Varianz der abhängigen Variable.
Was ist der Standardfehler der Schätzung?
Ein Maß für die durchschnittliche Größe der Residuen.
Was bedeutet ein kleiner Standardfehler der Schätzung?
Das Modell sagt die abhängige Variable gut voraus.
Was bedeutet ein hoher Standardfehler der Schätzung?
Das Modell hat eine geringere Vorhersagegenauigkeit.
Was bedeutet es, wenn der p-Wert kleiner als 0,05 ist?
Der Effekt ist statistisch signifikant.
Was ist eine Regression mit Dummy-Variablen?
Was ist ein Interaktionseffekt in der Regression?
Wenn der Effekt eines Prädiktors von einem anderen Prädiktor abhängt.
Wie überprüft man einen Interaktionseffekt in der Regression?
Durch Hinzufügen eines Interaktionsterms im Modell.
Was ist eine Hierarchische Regression?
Eine Regression, bei der Prädiktoren schrittweise in das Modell eingefügt werden.
Wann wird die hierarchische Regression verwendet?
Wenn die relative Bedeutung von Prädiktoren in verschiedenen Modellen verglichen werden soll.
Was bedeutet der Begriff “Overfitting”?
Das Modell passt sich zu stark an die spezifischen Daten an und ist nicht generalisierbar.
Wie kann Overfitting vermieden werden?
Durch die Verwendung einer Test- und Trainingsdatenaufteilung.
Was ist Kreuzvalidierung?
Eine Methode, um die Vorhersagegenauigkeit eines Modells zu überprüfen.
Was bedeutet ein nicht-signifikanter t-Wert?
Der Prädiktor hat keinen signifikanten Einfluss auf die abhängige Variable.
Was zeigt ein Residuenplot?
Ob die Annahmen der Regression, wie Lineareität und Homoskedastizität, erfüllt sind.
Was ist der Vorhersagefehler?
Die Differenz zwischen dem beobachteten und dem vorhergesagten Wert.
Was ist der Einfluss eines Prädiktors?
Die Veränderung in y, die durch eine Einheit Veränderung in x verursacht wird.
Was ist eine robuste Regression?
Eine Regression, die unempfindlich gegenüber Ausreißern ist.
Was ist eine logarithmische Transformation?
Eine Transformation, um nicht-lineare Beziehungen zu linearisieren.
Wann wird eine logistische Regression verwendet?
Wenn die abhängige Variable dichotom ist (z.B. Ja/Nein).
Was bedeutet ein negativer Regressionskoeffizient?
Ein Anstieg in x führt zu einem Rückgang in y.
Was ist die Annahme der Normalverteilung der Residuen?
Die Residuen sollten normalverteilt sein, um eine valide Regressionsanalyse zu gewährleisten.
Was ist die multivariate Regression?
Eine Regression mit mehr als einer abhängigen Variablen.
Was bedeutet der Koeffizient b_0?
Der geschätzte Wert von y, wenn alle x-Werte 0 sind.
Was ist der Zweck einer Dummy-Variable?
Um kategoriale Daten in numerische Daten für die Regression umzuwandeln.
Was ist der Unterschied zwischen einfacher und multipler Regression?
Die einfache Regression hat einen Prädiktor, die multiple Regression mehrere.
Was zeigt ein hoher F-Wert in der Regression an?
Das Modell ist insgesamt signifikant.
Was ist ein Einflusswert in der Regression?
Ein Maß für den Einfluss eines Datenpunkts auf die Schätzung der Regressionskoeffizienten.
Wann wird ein polynomiales Regressionsmodell verwendet?
Wenn der Zusammenhang zwischen den Variablen nicht linear ist.