Vorlesung 8 Flashcards

1
Q

Was ist das Hauptziel der linearen Regression?

A

Vorhersage einer abhängigen Variable anhand einer oder mehrerer unabhängiger Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was beschreibt die Regressionsgerade?

A

Den besten linearen Zusammenhang zwischen unabhängiger und abhängiger Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie lautet die allgemeine Formel der linearen Regression?

A

y = b_0 + b_1 \cdot x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was bedeutet b_0 in der Regressionsformel?

A

Der Achsenabschnitt (intercept), also der Wert von y, wenn x = 0 ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was bedeutet b_1 in der Regressionsformel?

A

Die Steigung der Regressionsgeraden, also die Änderung von y bei einer Einheit Änderung von x.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was zeigt die Steigung b_1 an?

A

Den Einfluss der unabhängigen Variable auf die abhängige Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie nennt man b_1 auch?

A

Regressionskoeffizient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die abhängige Variable?

A

Die zu erklärende Variable, auch Kriteriumsvariable genannt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist die unabhängige Variable?

A

Die Variable, die zur Vorhersage genutzt wird, auch Prädiktor genannt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist der Fehlerterm in der linearen Regression?

A

Die Differenz zwischen den beobachteten und den vorhergesagten Werten von y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was zeigt die Regressionsanalyse?

A

Ob und wie stark die unabhängige Variable die abhängige Variable vorhersagt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist das Ziel der einfachen linearen Regression?

A

Den Zusammenhang zwischen zwei Variablen zu beschreiben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was versteht man unter “Residuen”?

A

Die Differenzen zwischen den beobachteten und den geschätzten Werten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie wird die Güte einer Regression gemessen?

A

Durch das Bestimmtheitsmaß R^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was gibt R^2 an?

A

Den Anteil der Varianz der abhängigen Variable, der durch die unabhängige Variable erklärt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie wird R^2 interpretiert?

A

Als Prozentsatz der erklärten Varianz.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist der Unterschied zwischen R^2 und r?

A

r ist der Korrelationskoeffizient, R^2 ist der Anteil der erklärten Varianz.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was bedeutet ein R^2-Wert von 0?

A

Die unabhängige Variable erklärt keine Varianz der abhängigen Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was bedeutet ein R^2-Wert von 1?

A

Die unabhängige Variable erklärt die gesamte Varianz der abhängigen Variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was ist die Adjustierung von R^2?

A

Eine Korrektur des R^2-Wertes für die Anzahl der Prädiktoren und die Stichprobengröße.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Warum wird R^2 adjustiert?

A

Um eine Überschätzung bei kleinen Stichproben oder vielen Prädiktoren zu vermeiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was bedeutet eine hohe Korrelation zwischen x und y?

A

Eine starke lineare Beziehung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was sind “Ausreißer” in der Regressionsanalyse?

A

Datenpunkte, die stark von der Regressionslinie abweichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wie beeinflussen Ausreißer die Regression?

A

Sie können die Schätzung der Regressionsgerade stark verzerren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wie kann man Ausreißer in der Regressionsanalyse erkennen?

A

Durch grafische Darstellungen wie Streudiagramme oder Residuenplots.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was bedeutet Homoskedastizität?

A

Die Varianz der Residuen ist für alle Werte von x gleich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Was bedeutet Heteroskedastizität?

A

Die Varianz der Residuen ändert sich mit den Werten von x.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Wie überprüft man Homoskedastizität?

A

Mit einem Plot der Residuen gegen die vorhergesagten Werte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Was ist Multikollinearität?

A

Wenn zwei oder mehr unabhängige Variablen stark miteinander korrelieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Warum ist Multikollinearität problematisch?

A

Sie macht es schwer, die einzelnen Effekte der Prädiktoren zu isolieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Wie kann man Multikollinearität testen?

A

Mit dem Variance Inflation Factor (VIF).

32
Q

Was ist ein hoher VIF-Wert?

A

Ein Hinweis auf mögliche Multikollinearität.

33
Q

Was bedeutet ein VIF-Wert größer als 10?

A

Eine starke Multikollinearität.

34
Q

Was ist das Durbin-Watson-Statistik?

A

Ein Test auf Autokorrelation der Residuen.

35
Q

Was bedeutet Autokorrelation?

A

Wenn die Residuen aufeinanderfolgender Beobachtungen korrelieren.

36
Q

Was ist das Ziel der multiplen linearen Regression?

A

Die Vorhersage einer abhängigen Variable durch mehrere unabhängige Variablen.

37
Q

Wie unterscheidet sich die multiple von der einfachen Regression?

A

Es gibt mehr als eine unabhängige Variable.

38
Q

Wie lautet die Formel der multiplen linearen Regression?

A

(y = b_0 + b_1 \cdot x_1 + b_2 \cdot x_2 + \dots + b_n \cdot x_n)

39
Q

Was zeigt die Standardisierung der Regressionskoeffizienten an?

A

Die relative Bedeutung der Prädiktoren.

40
Q

Was ist der standardisierte Regressionskoeffizient?

A

Der Regressionskoeffizient, wenn alle Variablen z-standardisiert sind.

41
Q

Was bedeutet ein standardisierter Koeffizient von 0?

A

Kein Zusammenhang zwischen Prädiktor und Kriterium.

42
Q

Was zeigt ein standardisierter Koeffizient größer als 0 an?

A

Ein positiver Zusammenhang zwischen Prädiktor und Kriterium.

43
Q

Was zeigt ein standardisierter Koeffizient kleiner als 0 an?

A

Ein negativer Zusammenhang zwischen Prädiktor und Kriterium.

44
Q

Was ist ein t-Test in der Regression?

A

Ein Test zur Überprüfung, ob ein Regressionskoeffizient signifikant ist.

45
Q

Was zeigt ein signifikanter t-Wert an?

A

Der Prädiktor hat einen signifikanten Einfluss auf die abhängige Variable.

46
Q

Was ist das F-Test in der Regression?

A
47
Q

Was zeigt ein signifikanter F-Wert an?

A

Das Modell erklärt signifikant Varianz der abhängigen Variable.

48
Q

Was ist der Standardfehler der Schätzung?

A

Ein Maß für die durchschnittliche Größe der Residuen.

49
Q

Was bedeutet ein kleiner Standardfehler der Schätzung?

A

Das Modell sagt die abhängige Variable gut voraus.

50
Q

Was bedeutet ein hoher Standardfehler der Schätzung?

A

Das Modell hat eine geringere Vorhersagegenauigkeit.

51
Q

Was bedeutet es, wenn der p-Wert kleiner als 0,05 ist?

A

Der Effekt ist statistisch signifikant.

52
Q

Was ist eine Regression mit Dummy-Variablen?

A
53
Q

Was ist ein Interaktionseffekt in der Regression?

A

Wenn der Effekt eines Prädiktors von einem anderen Prädiktor abhängt.

54
Q

Wie überprüft man einen Interaktionseffekt in der Regression?

A

Durch Hinzufügen eines Interaktionsterms im Modell.

55
Q

Was ist eine Hierarchische Regression?

A

Eine Regression, bei der Prädiktoren schrittweise in das Modell eingefügt werden.

56
Q

Wann wird die hierarchische Regression verwendet?

A

Wenn die relative Bedeutung von Prädiktoren in verschiedenen Modellen verglichen werden soll.

57
Q

Was bedeutet der Begriff “Overfitting”?

A

Das Modell passt sich zu stark an die spezifischen Daten an und ist nicht generalisierbar.

58
Q

Wie kann Overfitting vermieden werden?

A

Durch die Verwendung einer Test- und Trainingsdatenaufteilung.

59
Q

Was ist Kreuzvalidierung?

A

Eine Methode, um die Vorhersagegenauigkeit eines Modells zu überprüfen.

60
Q

Was bedeutet ein nicht-signifikanter t-Wert?

A

Der Prädiktor hat keinen signifikanten Einfluss auf die abhängige Variable.

61
Q

Was zeigt ein Residuenplot?

A

Ob die Annahmen der Regression, wie Lineareität und Homoskedastizität, erfüllt sind.

62
Q

Was ist der Vorhersagefehler?

A

Die Differenz zwischen dem beobachteten und dem vorhergesagten Wert.

63
Q

Was ist der Einfluss eines Prädiktors?

A

Die Veränderung in y, die durch eine Einheit Veränderung in x verursacht wird.

64
Q

Was ist eine robuste Regression?

A

Eine Regression, die unempfindlich gegenüber Ausreißern ist.

65
Q

Was ist eine logarithmische Transformation?

A

Eine Transformation, um nicht-lineare Beziehungen zu linearisieren.

66
Q

Wann wird eine logistische Regression verwendet?

A

Wenn die abhängige Variable dichotom ist (z.B. Ja/Nein).

67
Q

Was bedeutet ein negativer Regressionskoeffizient?

A

Ein Anstieg in x führt zu einem Rückgang in y.

68
Q

Was ist die Annahme der Normalverteilung der Residuen?

A

Die Residuen sollten normalverteilt sein, um eine valide Regressionsanalyse zu gewährleisten.

69
Q

Was ist die multivariate Regression?

A

Eine Regression mit mehr als einer abhängigen Variablen.

70
Q

Was bedeutet der Koeffizient b_0?

A

Der geschätzte Wert von y, wenn alle x-Werte 0 sind.

71
Q

Was ist der Zweck einer Dummy-Variable?

A

Um kategoriale Daten in numerische Daten für die Regression umzuwandeln.

72
Q

Was ist der Unterschied zwischen einfacher und multipler Regression?

A

Die einfache Regression hat einen Prädiktor, die multiple Regression mehrere.

73
Q

Was zeigt ein hoher F-Wert in der Regression an?

A

Das Modell ist insgesamt signifikant.

74
Q

Was ist ein Einflusswert in der Regression?

A

Ein Maß für den Einfluss eines Datenpunkts auf die Schätzung der Regressionskoeffizienten.

75
Q

Wann wird ein polynomiales Regressionsmodell verwendet?

A

Wenn der Zusammenhang zwischen den Variablen nicht linear ist.