VL4 Korrelation und lineare Regression Flashcards

1
Q

Was beschreibt die Korrelation?

A

Den linearen Zusammenhang zwischen zwei metrischen Variablen

Korrelation ist symmetrisch.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was beschreibt die lineare Regression?

A

Den linearen Einfluss einer metrischen Variablen auf eine andere

Lineare Regression ist asymmetrisch.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist die Effektstärke?

A

Ein Maß, das die Stärke und Richtung des Zusammenhangs beschreibt

Beispiel: Korrelationskoeffizient.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist ein positiver Zusammenhang?

A

Höhere Ausprägungen eines Merkmals gehen mit höheren Ausprägungen eines anderen Merkmals einher

Beispiel: Je mehr ich esse, desto satter bin ich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist ein negativer Zusammenhang?

A

Höhere Ausprägungen eines Merkmals gehen mit niedrigeren Ausprägungen eines anderen Merkmals einher

Beispiel: Je mehr ich nachts lerne, desto weniger konzentriert bin ich morgens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was bedeutet kein linearer Zusammenhang?

A

Eine lineare Funktion lässt keinen Zusammenhang erkennen

Die Streuung auf der y-Achse scheint ähnlich über alle Bereiche der x-Achse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was beschreibt die Kovarianz?

A

Das mittlere Abweichungsprodukt zwischen zwei Variablen

Interpretation: sXY > 0: positiver Zusammenhang; sXY = 0: kein Zusammenhang; sXY < 0: negativer Zusammenhang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Pearson-Korrelation?

A

Die standardisierte Kovarianz der Variablen X und Y

Berechnet mit: rXY = sXY / (sX * sY).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welche Werte kann die Korrelation annehmen?

A

Werte zwischen -1 und +1

Bei -1 oder +1 besteht ein perfekter Zusammenhang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was passiert, wenn eine der Variablen eine Konstante ist?

A

Die Korrelation ist nicht definiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie reagiert die Korrelation auf Ausreißerwerte?

A

Die Korrelation reagiert sensibel auf Ausreißerwerte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welches Hypothesenpaar wird für den Test auf Unkorreliertheit verwendet?

A

H0: 𝜌XY = 0; H1: 𝜌XY ≠ 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die Prüfgröße für den Test auf Unkorreliertheit?

A

t = r * √(n - 2) / √(1 - r²)

Die Anzahl der Freiheitsgrade beträgt: df = n - 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist der kritische t-Wert für einen zweiseitigen Test?

A

t-krit(0,975; df)

Abhängig von der gewählten Freiheitsgrade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was bedeutet eine Korrelation von -0.79?

A

Es handelt sich um einen sehr großen Effekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie wird die Teststärke bei einer kleinen Stichprobengröße eingeschätzt?

A

Sie kann zu klein sein, um einen Zusammenhang in der Population zu belegen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was sind einseitige Tests?

A

Tests mit Hypothesen in ‘richtiger’ Richtung

Beispiel: H1: 𝜌 < 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist ein einseitiger Test?

A

Ein Test, der eine Hypothese in nur eine Richtung prüft.

Einseitige Tests können auf negative oder positive Zusammenhänge getestet werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was ist die Alternativhypothese (H1) beim einseitigen Test mit negativer Richtung?

A

H1: 𝜌 < 0

Dies bedeutet, dass ein negativer Zusammenhang zwischen den Variablen vermutet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was ist die Nullhypothese (H0) beim einseitigen Test mit negativer Richtung?

A

H0: 𝜌 ≥ 0

Dies bedeutet, dass kein negativer Zusammenhang vermutet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist der Ablehnungsbereich bei einem einseitigen Test mit negativer Richtung?

A

-2.776

Dies ist der kritische Wert, bei dessen Überschreitung die Nullhypothese abgelehnt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was ist die Alternativhypothese (H1) beim einseitigen Test mit positiver Richtung?

A

H1: 𝜌 > 0

Dies bedeutet, dass ein positiver Zusammenhang zwischen den Variablen vermutet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist die Nullhypothese (H0) beim einseitigen Test mit positiver Richtung?

A

H0: 𝜌 ≤ 0

Dies bedeutet, dass kein positiver Zusammenhang vermutet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was ist der Ablehnungsbereich bei einem einseitigen Test mit positiver Richtung?

A

2.132

Dies ist der kritische Wert, bei dessen Überschreitung die Nullhypothese abgelehnt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Was ist Fisher’s Z-Transformation?
Eine Methode zur Umskalierung der Stichprobenkennwerteverteilung, um sie approximativ standard-normalverteilt zu machen. ## Footnote Diese Transformation wird benötigt, um gegen beliebige Korrelationswerte zu testen.
26
Was ist das Ziel der Fisher’s Z-Transformation?
Die Stichprobenkennwerteverteilung der Korrelation zu normalisieren. ## Footnote Dies ist wichtig, da die Korrelationen zwischen -1 und +1 beschränkt sind.
27
Was ist der Zweck eines Ein-Stichprobentests?
Zu testen, ob die Korrelation 𝜌 gleich einem bestimmten Wert 𝜌0 ist. ## Footnote Hierbei wird die Nullhypothese H0: 𝜌 = 𝜌0 getestet.
28
Was sind die Hypothesenpaare für den Test auf Verschiedenheit zweier unabhängiger Stichproben?
H0: 𝜌1 = 𝜌2, H1: 𝜌1 ≠ 𝜌2 ## Footnote Dies wird verwendet, um zu testen, ob sich die Korrelationen zwischen zwei unabhängigen Gruppen signifikant unterscheiden.
29
Was ist die Prüfziffer für die Hypothese H0: 𝜌1 = 𝜌2?
𝑧 = 𝑍1 − 𝑍2 + 1/(1/n1 - 3) + 1/(n2 - 3) ## Footnote Diese Formel wird verwendet, um den z-Wert zu berechnen, der für die Entscheidung über die Nullhypothese benötigt wird.
30
Was bedeutet eine signifikante Korrelation zwischen zwei Merkmalen?
Es gibt einen statistisch signifikanten Zusammenhang zwischen den Merkmalen. ## Footnote Dies bedeutet, dass die Wahrscheinlichkeit, dass dieser Zusammenhang zufällig ist, sehr gering ist.
31
Was sind mögliche Interpretationen einer signifikanten Korrelation?
* Kausalität von Kirche zu Ehrlichkeit * Kausalität von Ehrlichkeit zu Kirche * Einfluss der Sozialisation auf beide Merkmale ## Footnote Korrelationen sollten nie ohne Zusatzinformationen kausal interpretiert werden.
32
Was sind die Ziele der linearen Regression?
* Erklären: Wie stark hängt der Prädiktor mit dem Kriterium zusammen? * Vorhersagen: Wie gut kann das Kriterium in neuen Daten vorhergesagt werden? ## Footnote Die lineare Regression wird verwendet, um Beziehungen zwischen Variablen zu modellieren.
33
Was bedeutet 'linear' in der linearen Regression?
Die Beziehung zwischen Prädiktoren und Kriterium hat eine gerade Form. ## Footnote Dies entspricht einer Geraden im zwei-dimensionalen Raum.
34
Was ist das formale Modell für die Beobachtungen in der linearen Regression?
𝑦𝑖 = 𝑏0 + 𝑒𝑖 ## Footnote Hierbei ist 𝑦𝑖 der Wert auf dem Kriterium, 𝑏0 die Regressionskonstante und 𝑒𝑖 der Vorhersagefehler.
35
Was passiert bei der Vorhersage des Wohlbefindens in der linearen Regression?
Der Mittelwert des Wohlbefindens wird vorhergesagt, ohne andere Prädiktoren zu berücksichtigen. ## Footnote Das Modell wird auf den Mittelwert des Wohlbefindens (WS) von 3.89 gesetzt.
36
Was wird zur Vorhersage des Wohlbefindens hinzugezogen?
Die Fähigkeit zur Aufrechterhaltung positiver Stimmung
37
Liegt in den meisten Fällen ein perfekter linearer Zusammenhang zwischen Kriterium und Prädiktor vor?
Nein
38
Was ist das Ziel der Analyse?
Das beste lineare Modell wählen
39
Schreibe die einfache Regressionsgleichung für einen Prädiktor X und die Kriteriumsvariable Y auf.
𝑦𝑖 = 𝑏0 + 𝑏1 ⋅ 𝑥𝑖 + 𝑒𝑖
40
Was beschreibt 𝑦𝑖 in der Regressionsgleichung?
Wert von Person 𝑖 auf dem Kriterium
41
Was beschreibt 𝑥𝑖 in der Regressionsgleichung?
Wert von Person 𝑖 auf dem Prädiktor
42
Was stellt 𝑒𝑖 in der Regressionsgleichung dar?
Vorhersagefehler für Person 𝑖 (Residuum)
43
Was ist die Regressionskonstante 𝑏0?
Wert der Kriteriumsvariable, wenn der Prädiktor den Wert 0 annimmt
44
Was ist der Regressionskoeffizient 𝑏1?
Erwartete Veränderung der Kriteriumsvariable, wenn man den Prädiktor um eine Einheit erhöht
45
Wie wird das beste Regressionsmodell bestimmt?
Durch Minimierung der Streuung der Fehler um die Regressionslinie
46
Was bezeichnet die Summe der Abweichungsquadrate (SAQ)?
Residuenquadratsumme
47
Was ist das Ziel bei der Wahl der Koeffizienten?
Die Summe der quadrierten Fehlerterme minimieren
48
Was ist die Methode der kleinsten Quadrate?
Eine Methode zur Optimierung der Regressionsanalyse
49
Wie wird der Regressionskoeffizient 𝑏1 ermittelt?
𝑏1 = 𝑟𝑋𝑌 ⋅ (𝑠𝑌 / 𝑠𝑋)
50
Was beschreibt der Standardschätzfehler?
Die Standardabweichung der Fehler um die Regressionsgerade
51
Was ist die Residualvarianz?
Die erwartete quadrierte Abweichung unabhängig von der Stichprobengröße
52
Was ist der Determinationskoeffizient R²?
Im Kriterium erklärte Varianz durch X / Gesamte Varianz im Kriterium
53
Wie ist der Wertebereich des Determinationskoeffizienten?
Zwischen 0 und 1
54
Wann erwarten wir keine hohen Werte des Determinationskoeffizienten?
Bei menschlichem Verhalten, da es schwer vorherzusagen ist
55
Wie berechnet man den Determinationskoeffizienten?
R² = 1 - (𝑠𝐸² / 𝑠𝑌²)
56
Was sagt die bivariate quadrierte Korrelation aus?
Sie ist gleich dem Determinationskoeffizienten in der einfachen linearen Regression
57
Was ist die Interpretation des Regressionskoeffizienten 𝑏1 = 0.50?
Für jede Steigerung der Fähigkeit zur Aufrechterhaltung positiver Stimmung, steigt das Wohlbefinden um 0.5 Einheiten
58
Fill in the blank: Die Methode der kleinsten _______ wird zur Optimierung der Regressionsanalyse verwendet.
Quadrate
59
True or False: Ein höherer Determinationskoeffizient deutet auf eine bessere Modellanpassung hin.
True
60
Was wird in dem Vorhersagemodell erstellt?
Ein Vorhersagemodell, das die Schwere der Depressivität anhand der therapeutischen Beziehung vorhersagt.
61
Was sind die Regressionskoeffizienten im Beispiel?
𝑏 = −1,66 und 𝑏0 = 26,55.
62
Wie lautet die Regressionsgleichung?
𝑦̂𝑖 = 26,55 − 1,66 ⋅ 𝑥𝑖.
63
Was ist der Determinationskoeffizient?
𝑅² = 0,50.
64
Was beschreibt der Determinationskoeffizient?
Der Anteil der Varianz in der abhängigen Variablen, der durch die unabhängige Variable erklärt wird.
65
Wie verändert sich die mittlere Depressivität bei einer Verbesserung der Beziehung um 1 Punkt?
Die mittlere Depressivität sinkt um 3,8 Punkte.
66
Was sind die Hypothesen für das Regressionsgewicht?
𝐻₀: 𝛽 = 0 und 𝐻₁: 𝛽 ≠ 0.
67
Was ist die Prüfgröße t in der Regressionsanalyse?
t = 𝑏₁ / 𝜎̂₁₁.
68
Was ist die Nullhypothese für die Regressionskonstante?
𝐻₀: 𝛽₀ = 0.
69
Welche Voraussetzungen müssen für die Regressionsanalyse erfüllt sein?
Homoskedastizität, bedingte Normalverteilung, Unabhängigkeit der Fehler.
70
Was bedeutet Homoskedastizität?
Die Varianz der y-Werte muss für jeden Wert von x gleich sein.
71
Was ist die Bedingte Normalverteilung?
Die Werte von y müssen für jeden Wert von x normalverteilt sein.
72
Was ist ein deterministischer Regressor?
Ein Prädiktor, der messfehlerfrei gemessen wird.
73
Was ist ein stochastischer Regressor?
Eine unabhängige Variable, die als Zufallsvariable angesehen wird.
74
Was ist die Residualvarianz?
Die Varianz der Abweichungen der beobachteten Werte von den vorhergesagten Werten.
75
Was ist der Standardfehler der Steigung?
𝐵₁ / 𝜎̂₁₁ = 𝜖̂ / √(𝑛−1) ⋅ 𝜎̂².
76
Wie wird die Nullhypothese verworfen?
Wenn t > t_krit(0,975;8).
77
Was beschreibt die Varianz der Fehler?
Die Streuung der Abweichungen der einzelnen Personen vom vorhergesagten Wert.
78
Fülle den Lückentext aus: Die Werte von y müssen für jeden Wert von x ________ sein.
normalverteilt.
79
Welche Verteilungsannahmen sind für ein Modell mit stochastischem Regressor notwendig?
Bivariate Normalverteilung und Homoskedastizität.
80
Wie wird die Pearson-Korrelation berechnet?
81
Wie wird die Kovarianz berechnet?
82
Worin unterscheidet sich Korrelation von Regression?
Korrelation: Symmetrisches Maß, keine Ursache-Wirkung-Beziehung. Regression: Modelliert eine abhängige Variable als Funktion einer unabhängigen Variable.
83
Wie lautet die allgemeine Formel der linearen Regression?
84
Was beschreibt der Regressionskoeffizient b1?
Er gibt an, wie stark sich y verändert, wenn x um eine Einheit steigt.
85
Was beschreibt die Regressionskonstante b0?
Der Wert der abhängigen Variable, wenn die unabhängige Variable x den Wert 0 hat.
86
Wie berechnet man b1?
87
Wie berechnet man b0?
88
Was misst der Determinationskoeffizient R2?
Den Anteil der erklärten Varianz durch das Regressionsmodell.
89
Welche Voraussetzungen müssen für eine lineare Regression erfüllt sein?
Linearität: Zusammenhang muss linear sein. Homoskedastizität: Fehlerterm muss konstante Varianz haben. Unabhängigkeit der Fehler: Keine Autokorrelation. Normalverteilung der Fehler: Fehler sollten normalverteilt sein
90
Test auf Unkorreliertheit
91
Kovarianz
92
Korrelation
Sxy=Kovarianz (geteilt durch Standardabweichung X mal Standardabweichung Y) Ist eine der Variablen eine Konstante, ist die Korrelation nicht definiert Symmetrie: Die Korrelation Rxy ist gleich der Korrelation Ryx Die Korrelation reagiert sensibel auf Ausreißerwerte
93
Beispiele Punktewolke
94
Effektstärke Interpretation
95
Test auf Unkorreliertheit
Dieser Test nur geeignet um eine Korrelation gegen 0 zu testen!
96
Test auf Unkorreliertheit Beispiel
97
Fisher's Z-Transformation
98
Weitere Hypothesen Tests mithilfe der Z-Transformation
99
Ein-Stichproben Test (allgemein)
100
Zwei unabhängige Stichproben
101
Beispiel: Unterschiede in Zusammenhängen testen
102
Kriterium Prädiktor
103
Interpretation der Koeffizienten
b0= Regressionskonstante b1= Regressionskoeffizient
104
Summe der Abweichungsquadrate
105
Kleinste Quadrate in der einfachen Regression
106
Wie gut klappt das? Modellgüte!
Erwartete Breite von Fehlerschwankungen von diesem Modell
107
Residualvarianz und Standardschätzfehler: Populationsschätzer der Modellgüte
Im Zweifelsfall immer Populationsschätzer benutzen, die anderen sind verzerrt
108
Modellgüte
109
Determinationskoeffizient
110
Berechnung Determinationskoeffizient
111
Inferenzstatistik der einfachen Regression
112
Einfache Regression – Herleitung der Prüfgröße
113
Überprüfung des Regressionsgewichts
114
Überprüfung der Regressionskonstante
115
Voraussetzungen der Regressionsanalyse: Welches Modell?
Zshang muss linear sein, muss min. intervallskaliert sein Es gibt Modelle mit deterministischen und solche mit stochastischen Regressoren mit deterministischem Regressor: wird der Prädiktor messfehlerfrei gemessen, z.B. weil er in einem Experiment kontrolliert wird --> klassisches Modell mit stochastischem Regressor: wird die unabhängige Variable als Zufallsvariable angesehen, konnten also nicht durch versuchsplan kontrolliert werden --> x- und y-Werte sind Ergebnisse eines Zufallsprozesses. Dadurch könnte auch die Regression in die andere Richtung berechnet werden. Diese Art von Modellen sind häufiger
116
Voraussetzungen der Regressionsanalyse: Für ein Modell mit deterministischem Regressor
117
Voraussetzungen der Regressionsanalyse: Für ein Modell mit stochastischem Regressor