Vorlesung 8 Flashcards
Was ist das Hauptziel der linearen Regression?
Vorhersage einer abhängigen Variable anhand einer oder mehrerer unabhängiger Variablen.
Was beschreibt die Regressionsgerade?
Den besten linearen Zusammenhang zwischen unabhängiger und abhängiger Variable.
Wie lautet die allgemeine Formel der linearen Regression?
y = b_0 + b_1 \cdot x
Was bedeutet b_0 in der Regressionsformel?
Der Achsenabschnitt (intercept), also der Wert von y, wenn x = 0 ist.
Was bedeutet b_1 in der Regressionsformel?
Die Steigung der Regressionsgeraden, also die Änderung von y bei einer Einheit Änderung von x.
Was zeigt die Steigung b_1 an?
Den Einfluss der unabhängigen Variable auf die abhängige Variable.
Wie nennt man b_1 auch?
Regressionskoeffizient
Was ist die abhängige Variable?
Die zu erklärende Variable, auch Kriteriumsvariable genannt.
Was ist die unabhängige Variable?
Die Variable, die zur Vorhersage genutzt wird, auch Prädiktor genannt.
Was ist der Fehlerterm in der linearen Regression?
Die Differenz zwischen den beobachteten und den vorhergesagten Werten von y.
Was zeigt die Regressionsanalyse?
Ob und wie stark die unabhängige Variable die abhängige Variable vorhersagt.
Was ist das Ziel der einfachen linearen Regression?
Den Zusammenhang zwischen zwei Variablen zu beschreiben.
Was versteht man unter “Residuen”?
Die Differenzen zwischen den beobachteten und den geschätzten Werten.
Wie wird die Güte einer Regression gemessen?
Durch das Bestimmtheitsmaß R^2
Was gibt R^2 an?
Den Anteil der Varianz der abhängigen Variable, der durch die unabhängige Variable erklärt wird.
Wie wird R^2 interpretiert?
Als Prozentsatz der erklärten Varianz.
Was ist der Unterschied zwischen R^2 und r?
r ist der Korrelationskoeffizient, R^2 ist der Anteil der erklärten Varianz.
Was bedeutet ein R^2-Wert von 0?
Die unabhängige Variable erklärt keine Varianz der abhängigen Variable.
Was bedeutet ein R^2-Wert von 1?
Die unabhängige Variable erklärt die gesamte Varianz der abhängigen Variable.
Was ist die Adjustierung von R^2?
Eine Korrektur des R^2-Wertes für die Anzahl der Prädiktoren und die Stichprobengröße.
Warum wird R^2 adjustiert?
Um eine Überschätzung bei kleinen Stichproben oder vielen Prädiktoren zu vermeiden.
Was bedeutet eine hohe Korrelation zwischen x und y?
Eine starke lineare Beziehung.
Was sind “Ausreißer” in der Regressionsanalyse?
Datenpunkte, die stark von der Regressionslinie abweichen.
Wie beeinflussen Ausreißer die Regression?
Sie können die Schätzung der Regressionsgerade stark verzerren.
Wie kann man Ausreißer in der Regressionsanalyse erkennen?
Durch grafische Darstellungen wie Streudiagramme oder Residuenplots.
Was bedeutet Homoskedastizität?
Die Varianz der Residuen ist für alle Werte von x gleich.
Was bedeutet Heteroskedastizität?
Die Varianz der Residuen ändert sich mit den Werten von x.
Wie überprüft man Homoskedastizität?
Mit einem Plot der Residuen gegen die vorhergesagten Werte.
Was ist Multikollinearität?
Wenn zwei oder mehr unabhängige Variablen stark miteinander korrelieren.
Warum ist Multikollinearität problematisch?
Sie macht es schwer, die einzelnen Effekte der Prädiktoren zu isolieren.