Einfache Lineare Regression Flashcards

1
Q

Was ist eine einfache lineare Regression?

A

Eine Methode, um den Zusammenhang zwischen zwei Variablen zu analysieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist das Ziel der einfachen linearen Regression?

A

Vorhersage der abhängigen Variablen anhand einer unabhängigen Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist die Regressionsgerade?

A

Die Linie, die den besten linearen Zusammenhang zwischen Prädiktor und Kriterium beschreibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie lautet die Grundformel der Regressionsgeraden?

A

y = a + bx.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was stellt y in der Regressionsgleichung dar?

A

Die vorhergesagte abhängige Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was stellt x in der Regressionsgleichung dar?

A

Die unabhängige Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was bedeutet a in der Regressionsgleichung?

A

Der Achsenabschnitt, d.h., wo die Gerade die y-Achse schneidet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was bedeutet b in der Regressionsgleichung?

A

Die Steigung, die den Anstieg oder Abfall der Linie pro Einheit von x zeigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was beschreibt die Steigung b?

A

Wie stark sich y ändert, wenn x um eine Einheit zunimmt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie wird die beste Regressionsgerade bestimmt?

A

Mit dem Kriterium der kleinsten Fehlerquadrate.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind Residuen?

A

Die Differenz zwischen den beobachteten und den vorhergesagten Werten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Regressionskoeffizient b?

A

Er zeigt, wie sich y ändert, wenn x um eine Einheit zunimmt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist der standardisierte Regressionskoeffizient β?

A

Der Regressionskoeffizient, nachdem die Variablen z-standardisiert wurden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was beschreibt der Determinationskoeffizient R^2?

A

Wie viel Varianz der abhängigen Variablen durch die unabhängige erklärt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was bedeutet ein R^2-Wert von 0?

A

Kein Zusammenhang zwischen den Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was bedeutet ein R^2-Wert von 1?

A

Die unabhängige Variable erklärt die gesamte Varianz der abhängigen Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist der Unterschied zwischen R^2 und β?

A

R^2 gibt die erklärte Varianz an, β den Einfluss von x auf y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Welche Annahmen gelten für die lineare Regression?

A

Lineare Beziehung, Homoskedastizität, Normalverteilung der Residuen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was bedeutet Homoskedastizität?

A

Die Varianz der Residuen ist für alle Werte von x gleich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wie testet man Homoskedastizität?

A

Mit einem Residualplot (Fitted vs. Residuals).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist der Durbin-Watson-Test?

A

Ein Test auf Autokorrelation der Residuen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was ist ein p-Wert in der Regression?

A

Er zeigt, ob der Regressionskoeffizient signifikant von null verschieden ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wann ist der p-Wert signifikant?

A

Wenn er kleiner als 0,05 ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was passiert, wenn die Annahmen der Regression verletzt werden?

A

Die Schätzungen könnten verzerrt oder ineffizient sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wie wird die Signifikanz der Regressionsgerade getestet?

A

Mit einem F-Test in der Varianzanalyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was zeigt der F-Test in der Regression?

A

Ob die Regressionsgerade signifikant von null verschieden ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Was ist ein Streudiagramm?

A

Eine grafische Darstellung des Zusammenhangs zwischen zwei Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Wofür wird ein Streudiagramm in der Regression verwendet?

A

Zur Überprüfung des linearen Zusammenhangs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Was zeigt eine perfekte lineare Beziehung im Streudiagramm?

A

Alle Punkte liegen auf einer Linie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was sind Ausreißer in der Regression?

A

Werte, die stark von der Regressionslinie abweichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Wie werden Ausreißer in der Regression behandelt?

A

Mit Verfahren wie dem Cook’s Distance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was ist Cook’s Distance?

A

Ein Maß für den Einfluss eines Ausreißers auf die Regressionsgerade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Was passiert, wenn die Residuen nicht normalverteilt sind?

A

Die Schätzungen sind möglicherweise nicht effizient.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Wie testet man die Normalverteilung der Residuen?

A

Mit dem Shapiro-Wilk-Test oder einem Q-Q-Plot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was zeigt ein Q-Q-Plot?

A

Ob die Residuen normalverteilt sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Was passiert bei Multikollinearität?

A

Die Regressionskoeffizienten können unzuverlässig werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Kann eine lineare Regression mit kategorialen Variablen durchgeführt werden?

A

Ja, mittels Dummy-Kodierung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Was ist eine Dummy-Variable?

A

Eine binäre Variable, die Gruppen in einer Regression repräsentiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Was ist die Einschränkung einer einfachen linearen Regression?

A

Sie kann nur den Zusammenhang zwischen zwei Variablen analysieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Was bedeutet der Residualstandardfehler?

A

Ein Maß für die Genauigkeit der Vorhersagen der Regressionslinie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Was zeigt der t-Wert eines Regressionskoeffizienten?

A

Ob der Regressionskoeffizient signifikant von null verschieden ist.

42
Q

Was bedeutet es, wenn der t-Wert hoch ist?

A

Der Prädiktor hat einen starken Einfluss auf die abhängige Variable.

43
Q

Was passiert, wenn der t-Wert nahe null ist?

A

Der Prädiktor hat wenig Einfluss auf die abhängige Variable.

44
Q

Kann die einfache lineare Regression Kausalität beweisen?

A

Nein, sie zeigt nur Korrelation, nicht Kausalität.

45
Q

Was bedeutet eine negative Steigung b?

A

Ein negativer Zusammenhang zwischen den Variablen.

46
Q

Was bedeutet eine positive Steigung b?

A

Ein positiver Zusammenhang zwischen den Variablen.

47
Q

Was ist das Konfidenzintervall eines Regressionskoeffizienten?

A

Ein Bereich, in dem der wahre Wert des Koeffizienten mit hoher Wahrscheinlichkeit liegt.

48
Q

Was zeigt ein schmales Konfidenzintervall an?

A

Genaue Schätzungen des Koeffizienten.

49
Q

Was zeigt ein breites Konfidenzintervall an?

A

Unsichere Schätzungen des Koeffizienten.

50
Q

Was ist eine Vorhersage in der Regression?

A

Die Schätzung der abhängigen Variable basierend auf der unabhängigen.

51
Q

Was bedeutet extrapolieren in der Regression?

A

Vorhersagen außerhalb des Bereichs der beobachteten Daten.

52
Q

Warum ist Extrapolation problematisch?

A

Die Beziehung zwischen den Variablen könnte sich außerhalb des Datenbereichs ändern.

53
Q

Was ist Interpolation in der Regression?

A

Vorhersagen innerhalb des Bereichs der beobachteten Daten.

54
Q

Was ist eine Korrelation?

A

Ein Maß für die Stärke und Richtung des Zusammenhangs zwischen zwei Variablen.

55
Q

Was ist der Unterschied zwischen Korrelation und Regression?

A

Korrelation misst den Zusammenhang, Regression sagt Werte vorher.

56
Q

Was ist der Korrelationskoeffizient?

A

Ein Wert zwischen -1 und 1, der die Stärke und Richtung des Zusammenhangs angibt.

57
Q

Was bedeutet eine Korrelation von 1?

A

Perfekter positiver Zusammenhang.

58
Q

Was bedeutet eine Korrelation von -1?

A

Perfekter negativer Zusammenhang.

59
Q

Was bedeutet eine Korrelation von 0?

A

Kein Zusammenhang zwischen den Variablen.

60
Q

Was ist eine Partielle Korrelation?

A

Der Zusammenhang zwischen zwei Variablen unter Kontrolle anderer Variablen.

61
Q

Wie hängen Korrelation und Regression zusammen?

A

Eine starke Korrelation kann auf eine nützliche Regressionsbeziehung hinweisen.

62
Q

Was ist ein Standardfehler in der Regression?

A

Ein Maß für die Genauigkeit der Schätzungen der Regressionskoeffizienten.

63
Q

Was passiert, wenn der Standardfehler groß ist?

A

Die Schätzungen der Koeffizienten sind weniger genau.

64
Q

Was ist ein Residualplot?

A

Ein Diagramm, das Residuen gegen die vorhergesagten Werte darstellt.

65
Q

Warum sind Residualplots wichtig?

A

Sie helfen, Annahmen der Regression zu überprüfen, wie Homoskedastizität.

66
Q

Was sind Prädiktoren?

A

Die unabhängigen Variablen in einer Regressionsanalyse.

67
Q

Was sind Zielvariablen?

A

Die abhängigen Variablen in einer Regressionsanalyse.

68
Q

Was ist der Unterschied zwischen erklärender und abhängiger Variable?

A

Die erklärende Variable ist die unabhängige, die abhängige ist die zu prognostizierende Variable.

69
Q

Was ist ein Regressionstest?

A

Ein statistischer Test, um zu prüfen, ob die unabhängige Variable die abhängige signifikant beeinflusst.

70
Q

Was ist der Unterschied zwischen linearer und nichtlinearer Regression?

A

Die lineare Regression modelliert eine lineare Beziehung, die nichtlineare eine kurvige.

71
Q

Wann ist eine lineare Regression nicht geeignet?

A

Wenn der Zusammenhang zwischen den Variablen nicht linear ist.

72
Q

Was ist eine logarithmische Transformation in der Regression?

A

Eine Methode, um nicht-lineare Beziehungen zu linearisieren.

73
Q

Was ist der Adjusted R^2?

A

Ein korrigierter R^2, der die Anzahl der Prädiktoren berücksichtigt.

74
Q

Warum wird der Adjusted R^2 verwendet?

A

Um den Erklärungswert der Regression besser einzuschätzen, wenn mehrere Prädiktoren im Spiel sind.

75
Q

Was bedeutet ein hoher Adjusted R^2?

A

Die unabhängigen Variablen erklären einen großen Teil der Varianz.

76
Q

Was passiert, wenn der Adjusted R^2 sinkt?

A

Ein zusätzlicher Prädiktor bringt keine Verbesserung in der Erklärung der Varianz.

77
Q

Was bedeutet multivariate Regression?

A

Eine Regression mit mehr als einer unabhängigen Variablen.

78
Q

Was ist der Unterschied zwischen einfacher und multipler Regression?

A

Die einfache Regression hat nur eine unabhängige Variable, die multiple mehrere.

79
Q

Was ist Multikollinearität?

A

Wenn unabhängige Variablen stark miteinander korrelieren.

80
Q

Warum ist Multikollinearität ein Problem?

A

Sie führt zu instabilen Schätzungen der Regressionskoeffizienten.

81
Q

Wie kann man Multikollinearität erkennen?

A

Durch den Variance Inflation Factor (VIF).

82
Q

Was ist der Variance Inflation Factor (VIF)?

A

Ein Maß dafür, wie stark die Multikollinearität die Varianz der Schätzungen erhöht.

83
Q

Was ist eine signifikante Regressionsbeziehung?

A

Wenn der p-Wert kleiner als 0,05 ist.

84
Q

Was passiert, wenn der p-Wert nicht signifikant ist?

A

Es gibt keinen Hinweis auf eine Beziehung zwischen den Variablen.

85
Q

Was bedeutet eine p-Wert von 0,001?

A

Sehr starker Beweis, dass die Beziehung signifikant ist.

86
Q

Was ist ein Dummy-Prädiktor?

A

Eine kategoriale Variable, die in einer Regression verwendet wird, indem sie in binäre Variablen umgewandelt wird.

87
Q

Was bedeutet Overfitting?

A

Wenn ein Modell zu gut auf die Trainingsdaten passt, aber schlecht auf neue Daten übertragbar ist.

88
Q

Wie kann man Overfitting vermeiden?

A

Durch Regularisierung oder Kreuzvalidierung.

89
Q

Was ist Kreuzvalidierung?

A

Eine Methode, um die Vorhersagekraft eines Modells zu testen, indem es auf verschiedenen Datensätzen trainiert und getestet wird.

90
Q

Was ist Regularisierung?

A

Eine Methode, um zu große Koeffizienten in der Regression zu verhindern.

91
Q

Was ist das Lasso-Verfahren in der Regression?

A

Eine Regularisierungstechnik, die Koeffizienten verkleinert oder auf null setzt.

92
Q

Was ist das Ridge-Verfahren in der Regression?

A

Eine Regularisierungstechnik, die zu große Koeffizienten bestraft, um Overfitting zu verhindern.

93
Q

Was ist eine Normalisierung in der Regression?

A

Eine Transformation der Variablen, um sie auf eine ähnliche Skala zu bringen.

94
Q

Wann verwendet man die Ridge-Regression?

A

Wenn Multikollinearität ein Problem ist.

95
Q

Was ist der Unterschied zwischen Ridge und Lasso?

A

Ridge verringert Koeffizienten, Lasso kann sie ganz auf null setzen.

96
Q

Was ist ein out-of-sample Fehler?

A

Der Vorhersagefehler auf Daten, die nicht im Trainingsdatensatz enthalten sind.

97
Q

Was ist das Akaike Informationskriterium (AIC)?

A

Ein Maß zur Modellbewertung, das sowohl die Anpassungsgüte als auch die Komplexität berücksichtigt.

98
Q

Was ist das Bayesianische Informationskriterium (BIC)?

A

Ähnlich wie AIC, aber strenger in der Bestrafung komplexer Modelle.

99
Q

Was ist der Unterschied zwischen AIC und BIC?

A

BIC bestraft komplexe Modelle stärker als AIC.

100
Q

Wie wählt man das beste Modell in der Regression?

A

Durch Vergleichen von AIC, BIC oder durch Kreuzvalidierung.