Multiple Lineare Regression Flashcards

1
Q

Was ist eine multiple lineare Regression?

A

Eine Regression, bei der mehr als ein Prädiktor verwendet wird, um das Kriterium vorherzusagen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was versteht man unter dem Prädiktor in der multiplen Regression?

A

Eine unabhängige Variable, die zur Vorhersage des Kriteriums verwendet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist das Kriterium in der multiplen Regression?

A

Die abhängige Variable, deren Werte vorhergesagt werden sollen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist das Ziel der multiplen linearen Regression?

A

Das Vorhersagen des Werts einer abhängigen Variable basierend auf mehreren unabhängigen Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Voraussetzungen müssen für eine multiple lineare Regression erfüllt sein?

A

Lineare Beziehung, keine Multikollinearität, Normalverteilung der Residuen, Homoskedastizität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist Multikollinearität?

A

Wenn zwei oder mehr Prädiktoren hoch miteinander korrelieren und somit redundant sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist Homoskedastizität?

A

Die Residuen sollten über alle Prädiktoren hinweg gleiche Varianzen haben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Gleichung der multiplen linearen Regression?

A

Y = b_0 + b_1X_1 + b_2X_2 + … + b_nX_n + ε.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was bedeutet R^2 in der multiplen Regression?

A

Der Anteil der Varianz im Kriterium, der durch die Prädiktoren erklärt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist der Adjusted R^2?

A

Ein korrigierter R^2-Wert, der die Anzahl der Prädiktoren berücksichtigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was bedeutet ein signifikanter F-Test in der multiplen Regression?

A

Dass mindestens einer der Prädiktoren signifikant zur Vorhersage des Kriteriums beiträgt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie wird die Signifikanz der Prädiktoren in der multiplen Regression getestet?

A

Mit einem t-Test für jeden Prädiktor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was zeigt ein hoher t-Wert bei einem Prädiktor an?

A

Dass der Prädiktor signifikant zur Vorhersage des Kriteriums beiträgt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist der standardisierte Regressionskoeffizient β?

A

Ein Koeffizient, der die Stärke des Effekts eines Prädiktors in z-standardisierten Einheiten angibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist der unstandardisierte Regressionskoeffizient b?

A

Ein Koeffizient, der angibt, wie stark sich das Kriterium ändert, wenn der Prädiktor um eine Einheit steigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind Residuen?

A

Die Differenz zwischen den beobachteten und den vorhergesagten Werten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist der Durbin-Watson-Test?

A

Ein Test, der prüft, ob die Residuen unabhängig voneinander sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Wie wird Multikollinearität in der multiplen Regression diagnostiziert?

A

Mit dem Variance Inflation Factor (VIF).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was zeigt ein hoher VIF-Wert an?

A

Dass Multikollinearität vorliegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was bedeutet es, wenn der VIF größer als 10 ist?

A

Es liegt eine problematische Multikollinearität vor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wie wird die Vorhersagegenauigkeit der multiplen Regression gemessen?

A

Mit dem R^2-Wert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was passiert, wenn Multikollinearität vorliegt?

A

Die Schätzungen der Regressionskoeffizienten werden ungenau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist die Partielle Korrelation in der multiplen Regression?

A

Die Korrelation zwischen einem Prädiktor und dem Kriterium, nachdem die anderen Prädiktoren kontrolliert wurden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was ist eine Schrittweise Regression?

A

Ein Verfahren, bei dem Prädiktoren schrittweise in das Modell aufgenommen oder entfernt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Was ist eine Vorwärtsselektion in der multiplen Regression?

A

Ein Verfahren, bei dem der Prädiktor mit dem höchsten Beitrag zuerst in das Modell aufgenommen wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was ist eine Rückwärtselimination in der multiplen Regression?

A

Ein Verfahren, bei dem der Prädiktor mit dem geringsten Beitrag zuerst entfernt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Wann wird die standardisierte Version der Koeffizienten verwendet?

A

Wenn man die Stärke der Prädiktoren miteinander vergleichen möchte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Was ist die Dummy-Kodierung?

A

Eine Methode, um nominalskalierte Variablen in eine binäre Form zu überführen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Was ist der Unterschied zwischen einfacher und multipler linearer Regression?

A

Bei der einfachen Regression gibt es nur einen Prädiktor, bei der multiplen mehrere.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was zeigt ein negativer Regressionskoeffizient an?

A

Dass der Prädiktor eine negative Beziehung zum Kriterium hat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Was zeigt ein positiver Regressionskoeffizient an?

A

Dass der Prädiktor eine positive Beziehung zum Kriterium hat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was ist eine Interaktion in der multiplen Regression?

A

Wenn der Effekt eines Prädiktors auf das Kriterium von einem anderen Prädiktor abhängt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Was ist die Methode der kleinsten Quadrate?

A

Ein Verfahren zur Schätzung der Regressionskoeffizienten, das die Summe der quadrierten Residuen minimiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Warum sollte Multikollinearität vermieden werden?

A

Sie erschwert die Interpretation der Prädiktoren und führt zu unzuverlässigen Ergebnissen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was ist eine Moderation in der multiplen Regression?

A

Ein dritter Prädiktor, der den Zusammenhang zwischen zwei Variablen verändert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Wie überprüft man die Normalverteilung der Residuen?

A

Mit einem Q-Q-Plot oder dem Shapiro-Wilk-Test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Was ist Heteroskedastizität?

A

Wenn die Varianz der Residuen nicht konstant ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Wie kann Heteroskedastizität entdeckt werden?

A

Durch einen Residual-Plot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Was ist der Zweck einer Regressionsdiagnose?

A

Sicherzustellen, dass die Annahmen der Regression nicht verletzt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Wie kann eine multiple Regression mit nominalen Prädiktoren durchgeführt werden?

A

Durch die Dummy-Kodierung der Prädiktoren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Was ist ein Residualplot?

A

Ein Diagramm, das die Residuen gegenüber den vorhergesagten Werten darstellt.

42
Q

Was ist der Unterschied zwischen F-Test und t-Test in der Regression?

A

Der F-Test prüft das Gesamtmodell, der t-Test prüft einzelne Prädiktoren.

43
Q

Was ist eine exponentielle Transformation in der Regression?

A

Eine Methode, um nichtlineare Zusammenhänge zu linearisieren.

44
Q

Was bedeutet es, wenn der F-Test nicht signifikant ist?

A

Das Modell erklärt die Variation im Kriterium nicht besser als der Zufall.

45
Q

Wie interpretiert man den p-Wert eines Prädiktors?

A

Ein p-Wert kleiner als 0.05 deutet darauf hin, dass der Prädiktor signifikant ist.

46
Q

Was ist eine Varianzanalyse in der multiplen Regression?

A

Eine Methode, um die erklärte und unerklärte Varianz zu zerlegen.

47
Q

Was ist ein globales Modell?

A

Ein Modell, das alle verfügbaren Prädiktoren verwendet.

48
Q

Was ist ein reduziertes Modell?

A

Ein Modell, das nur einen Teil der Prädiktoren verwendet.

49
Q

Wann wird ein Prädiktor als irrelevant betrachtet?

A

Wenn er keinen signifikanten Einfluss auf das Kriterium hat.

50
Q

Wie wird das Standardfehler des Koeffizienten interpretiert?

A

Es zeigt die Genauigkeit der Schätzung des Regressionskoeffizienten an.

51
Q

Was zeigt ein hoher Standardfehler des Koeffizienten an?

A

Dass der Regressionskoeffizient ungenau geschätzt wird.

52
Q

Was ist eine Kreuzvalidierung in der multiplen Regression?

A

Eine Methode, um die Generalisierbarkeit des Modells zu überprüfen.

53
Q

Was ist Overfitting in der multiplen Regression?

A

Wenn das Modell zu spezifisch auf die Trainingsdaten angepasst ist und auf neuen Daten schlecht funktioniert.

54
Q

Wie wird Overfitting in der Regression vermieden?

A

Durch die Verwendung von Kreuzvalidierung oder Regularisierung.

55
Q

Was ist eine Regularisierung in der Regression?

A

Eine Methode, die Bestrafungen für hohe Koeffizienten einführt, um Overfitting zu vermeiden.

56
Q

Was ist Ridge Regression?

A

Eine Art der Regularisierung, bei der eine Strafe für große Regressionskoeffizienten hinzugefügt wird.

57
Q

Was ist Lasso Regression?

A

Eine Regularisierungsmethode, die einige Regressionskoeffizienten auf Null setzt, um irrelevante Prädiktoren zu eliminieren.

58
Q

Was ist der Unterschied zwischen Ridge und Lasso Regression?

A

Ridge bestraft hohe Koeffizienten, setzt sie aber nicht auf Null; Lasso kann Koeffizienten komplett eliminieren.

59
Q

Wann wird eine logarithmische Transformation in der Regression verwendet?

A

Wenn die Beziehung zwischen Prädiktoren und Kriterium nicht linear ist.

60
Q

Was zeigt ein hoher Durbin-Watson-Wert an?

A

Dass die Residuen wahrscheinlich eine positive Autokorrelation aufweisen.

61
Q

Was ist ein Vorhersageintervall in der Regression?

A

Ein Bereich, der den wahrscheinlichen Wert einer zukünftigen Beobachtung angibt.

62
Q

Wie unterscheidet sich das Konfidenzintervall vom Vorhersageintervall?

A

Das Konfidenzintervall gibt die Unsicherheit der Schätzung des Mittelwerts an, das Vorhersageintervall die Unsicherheit einer einzelnen Vorhersage.

63
Q

Was ist ein Dummy-Variable-Trap?

A

Eine Situation, in der durch Überkodierung von kategorialen Prädiktoren Multikollinearität entsteht.

64
Q

Wie wird der Dummy-Variable-Trap vermieden?

A

Durch das Entfernen einer Kategorie als Referenz.

65
Q

Was ist eine Spline-Regression?

A

Eine Methode, um lineare und nichtlineare Beziehungen zu kombinieren.

66
Q

Was ist die Hauptannahme der Linearität in der multiplen Regression?

A

Dass die Beziehung zwischen den Prädiktoren und dem Kriterium linear ist.

67
Q

Was sind Outlier in der multiplen Regression?

A

Beobachtungen, die extrem weit von den vorhergesagten Werten entfernt sind.

68
Q

Wie werden Ausreißer in der Regression erkannt?

A

Mit Hilfe von Residualplots oder der Cook’s Distanz.

69
Q

Was ist die Cook’s Distanz?

A

Ein Maß, das zeigt, wie stark eine einzelne Beobachtung die Regressionslinie beeinflusst.

70
Q

Wann sollte eine Beobachtung basierend auf der Cook’s Distanz entfernt werden?

A

Wenn der Wert größer als 1 ist, kann dies auf einen starken Einfluss hinweisen.

71
Q

Was ist ein Einflusspunkt in der Regression?

A

Eine Beobachtung, die einen disproportionalen Einfluss auf die Schätzung der Regressionskoeffizienten hat.

72
Q

Was sind Hebelwerte in der Regression?

A

Ein Maß dafür, wie weit eine Beobachtung von den anderen Beobachtungen abweicht.

73
Q

Was ist der Unterschied zwischen Hebelwerten und Residuen?

A

Hebelwerte messen den Einfluss einer Beobachtung auf die unabhängigen Variablen, Residuen messen die Differenz zwischen beobachteten und vorhergesagten Werten.

74
Q

Wann sollte man Residuen transformieren?

A

Wenn die Annahmen der Normalverteilung oder Homoskedastizität verletzt sind.

75
Q

Was zeigt ein signifikanter F-Wert an?

A

Dass das Modell insgesamt signifikant ist.

76
Q

Was ist eine quadratische Regression?

A

Eine Erweiterung der linearen Regression, bei der ein quadratischer Term hinzugefügt wird, um nichtlineare Beziehungen zu modellieren.

77
Q

Wann wird eine Interaktion zwischen Prädiktoren in die Regression aufgenommen?

A

Wenn der Effekt eines Prädiktors von einem anderen abhängt.

78
Q

Wie erkennt man Multikollinearität ohne VIF?

A

Durch hohe Korrelationen zwischen den Prädiktoren.

79
Q

Was zeigt ein kleiner p-Wert für einen Prädiktor an?

A

Dass der Prädiktor signifikant zur Vorhersage des Kriteriums beiträgt.

80
Q

Was ist eine polynomische Regression?

A

Eine Regression, bei der Polynomterme (z. B. X^2, X^3) hinzugefügt werden, um nichtlineare Beziehungen zu modellieren.

81
Q

Wie ist der Ablauf des Wilcoxon-Vorzeichen-Rangtests?

A

Die Differenzen der Werte werden gebildet, rangiert und die positiven und negativen Ränge werden summiert.

82
Q

Welche Datenart wird beim Kruskal-Wallis-Test verwendet?

A

Ordinalskalierte oder nicht normalverteilte intervallskalierte Daten.

83
Q

Was ist der Nullhypothese beim Chi-Quadrat-Test?

A

Dass keine Abhängigkeit zwischen den Variablen besteht.

84
Q

Wie wird die Effektgröße beim Kruskal-Wallis-Test berechnet?

A

Durch den Vergleich der Rangsummen und der Stichprobengrößen.

85
Q

Wie wird beim Mann-Whitney-U-Test mit Bindungen umgegangen?

A

Es werden mittlere Ränge vergeben, um die Gleichheit der Verteilungen zu prüfen.

86
Q

Was ist der kritische Wert im Kruskal-Wallis-Test?

A

Ein Wert aus der χ²-Verteilungstabelle, der mit dem H-Wert verglichen wird.

87
Q

Was zeigt ein hoher H-Wert im Kruskal-Wallis-Test?

A

Dass es Unterschiede zwischen den Gruppen gibt.

88
Q

Welche Skalenniveaus sind für den Friedman-Test geeignet?

A

Ordinalskalierte Daten oder intervallskalierte Daten, die nicht normalverteilt sind.

89
Q

Was ist das Ziel des Chi-Quadrat-Tests?

A

Zu prüfen, ob die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen.

90
Q

Wie unterscheidet sich der Wilcoxon-Test vom Mann-Whitney-U-Test?

A

Der Wilcoxon-Test wird für abhängige, der Mann-Whitney-U-Test für unabhängige Stichproben verwendet.

91
Q

Welche Art von Daten benötigt der Wilcoxon-Vorzeichen-Rangtest?

A

Abhängige Stichproben mit ordinalskalierten Daten.

92
Q

Welche Tests sind Alternativen zur ANOVA bei ordinalsalierten Daten?

A

Kruskal-Wallis-Test und Friedman-Test.

93
Q

Was zeigt ein signifikantes Ergebnis im Friedman-Test an?

A

Dass es signifikante Unterschiede zwischen den Gruppen gibt.

94
Q

Was sind die Voraussetzungen für den Chi-Quadrat-Test?

A

Unabhängige Zufallsstichproben und ausreichend große erwartete Häufigkeiten.

95
Q

Wie wird ein Ergebnis im Mann-Whitney-U-Test als signifikant interpretiert?

A

Wenn der U-Wert kleiner als der kritische Wert ist, ist das Ergebnis signifikant.

96
Q

Was ist ein ungerichteter Test?

A

Ein Test, der in beide Richtungen prüft, ohne eine Richtung vorzuziehen.

97
Q

Was ist ein gerichteter Test?

A

Ein Test, der nur in eine Richtung prüft, also nur positive oder negative Abweichungen.

98
Q

Welche Art von Daten benötigt der Kruskal-Wallis-Test?

A

Ordinalskalierte oder nicht normalverteilte intervallskalierte Daten.

99
Q

Wie wird Kendall’s W verwendet?

A

Es wird verwendet, um die Übereinstimmung zwischen mehreren Beurteilern zu bestimmen.

100
Q

Was sind die Hauptvorteile von non-parametrischen Tests?

A

Sie erfordern weniger strikte Voraussetzungen und können bei kleineren Stichproben verwendet werden.