Einfache Lineare Regression Flashcards
Was ist eine einfache lineare Regression?
Eine Methode, um den Zusammenhang zwischen zwei Variablen zu analysieren.
Was ist das Ziel der einfachen linearen Regression?
Vorhersage der abhängigen Variablen anhand einer unabhängigen Variablen.
Was ist die Regressionsgerade?
Die Linie, die den besten linearen Zusammenhang zwischen Prädiktor und Kriterium beschreibt.
Wie lautet die Grundformel der Regressionsgeraden?
y = a + bx.
Was stellt y in der Regressionsgleichung dar?
Die vorhergesagte abhängige Variable.
Was stellt x in der Regressionsgleichung dar?
Die unabhängige Variable.
Was bedeutet a in der Regressionsgleichung?
Der Achsenabschnitt, d.h., wo die Gerade die y-Achse schneidet.
Was bedeutet b in der Regressionsgleichung?
Die Steigung, die den Anstieg oder Abfall der Linie pro Einheit von x zeigt.
Was beschreibt die Steigung b?
Wie stark sich y ändert, wenn x um eine Einheit zunimmt.
Wie wird die beste Regressionsgerade bestimmt?
Mit dem Kriterium der kleinsten Fehlerquadrate.
Was sind Residuen?
Die Differenz zwischen den beobachteten und den vorhergesagten Werten.
Was ist der Regressionskoeffizient b?
Er zeigt, wie sich y ändert, wenn x um eine Einheit zunimmt.
Was ist der standardisierte Regressionskoeffizient β?
Der Regressionskoeffizient, nachdem die Variablen z-standardisiert wurden.
Was beschreibt der Determinationskoeffizient R^2?
Wie viel Varianz der abhängigen Variablen durch die unabhängige erklärt wird.
Was bedeutet ein R^2-Wert von 0?
Kein Zusammenhang zwischen den Variablen.
Was bedeutet ein R^2-Wert von 1?
Die unabhängige Variable erklärt die gesamte Varianz der abhängigen Variablen.
Was ist der Unterschied zwischen R^2 und β?
R^2 gibt die erklärte Varianz an, β den Einfluss von x auf y.
Welche Annahmen gelten für die lineare Regression?
Lineare Beziehung, Homoskedastizität, Normalverteilung der Residuen.
Was bedeutet Homoskedastizität?
Die Varianz der Residuen ist für alle Werte von x gleich.
Wie testet man Homoskedastizität?
Mit einem Residualplot (Fitted vs. Residuals).
Was ist der Durbin-Watson-Test?
Ein Test auf Autokorrelation der Residuen.
Was ist ein p-Wert in der Regression?
Er zeigt, ob der Regressionskoeffizient signifikant von null verschieden ist.
Wann ist der p-Wert signifikant?
Wenn er kleiner als 0,05 ist.
Was passiert, wenn die Annahmen der Regression verletzt werden?
Die Schätzungen könnten verzerrt oder ineffizient sein.
Wie wird die Signifikanz der Regressionsgerade getestet?
Mit einem F-Test in der Varianzanalyse.
Was zeigt der F-Test in der Regression?
Ob die Regressionsgerade signifikant von null verschieden ist.
Was ist ein Streudiagramm?
Eine grafische Darstellung des Zusammenhangs zwischen zwei Variablen.
Wofür wird ein Streudiagramm in der Regression verwendet?
Zur Überprüfung des linearen Zusammenhangs.
Was zeigt eine perfekte lineare Beziehung im Streudiagramm?
Alle Punkte liegen auf einer Linie.
Was sind Ausreißer in der Regression?
Werte, die stark von der Regressionslinie abweichen.
Wie werden Ausreißer in der Regression behandelt?
Mit Verfahren wie dem Cook’s Distance.
Was ist Cook’s Distance?
Ein Maß für den Einfluss eines Ausreißers auf die Regressionsgerade.
Was passiert, wenn die Residuen nicht normalverteilt sind?
Die Schätzungen sind möglicherweise nicht effizient.
Wie testet man die Normalverteilung der Residuen?
Mit dem Shapiro-Wilk-Test oder einem Q-Q-Plot.
Was zeigt ein Q-Q-Plot?
Ob die Residuen normalverteilt sind.
Was passiert bei Multikollinearität?
Die Regressionskoeffizienten können unzuverlässig werden.
Kann eine lineare Regression mit kategorialen Variablen durchgeführt werden?
Ja, mittels Dummy-Kodierung.
Was ist eine Dummy-Variable?
Eine binäre Variable, die Gruppen in einer Regression repräsentiert.
Was ist die Einschränkung einer einfachen linearen Regression?
Sie kann nur den Zusammenhang zwischen zwei Variablen analysieren.
Was bedeutet der Residualstandardfehler?
Ein Maß für die Genauigkeit der Vorhersagen der Regressionslinie.