Einfache Lineare Regression Flashcards

mit k=1 Prädiktoren

1
Q

Was modelliert eine einfache lineare Regression? Was ist ihre Modellgleichung?

A

Anhand einer Datenwolke wird eine Funktion modelliert für den Zusammenhang zwischen einer Prädikatorvariable (X) und einem Outcome (Y)

yᵢ=b₀+b₁Xᵢ+ɛᵢ

Outcome = Interzept + Slope x Input + Fehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Bedeutung des Interzepts in der einfachen linearen Regression?

A

Es ist der Achsenabschnitt b₀

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist die Bedeutung des Slope Parameters?

A

Steigung der Regressionsgeraden
Änderung im Outcome wenn sich Prädiktor um eine Einheit verändert
unstandardisiert/standardisiert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist die Beziehung zwischen ALM und Regressionsanalyse?

A

Regression ist Spezialfall und Grundlage für viele Erweiterungen
vereint Zusammenhangsanalyse und Mittelwertsvgl (wie auch t-Test und ANOVA)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die Bedingung der Parameterschätzung in der einfachen linearen Regression?

A

Kleinste quadrate Schätzung:
Slope und Interzept werden so geschätzt, dass die Summe der Abweichungsquadrate minimal ist

Σᵢɛᵢ²=min

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welche Besonderheiten gibt es bei k=1 in der einfachen linearen Regressionsanalyse?

A

unstandartisierter Slope Parameter steht in unmittelbarem Zusammenhang mit Produkt-Moment-Korrelation von Prädiktor X mit Outcome Y
r(x,y) = b1 * ( s(x)/s(y) ) = Beta

r(x,y)²=R²

t² = F

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wann ist ein Regressionsmodell besser?

A

Desto mehr Varianz vom Outcome es vorhersagen kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist R²? Wie wird es berechnet? Welchen Wertebereich kann R² annehmen?

A

Anteil erklärte Varianz
R²= s(ŷ²) / s(y²)
- Quotient der Varianz der vorhergesagten und beobachteten Werte

  • kann nur positiv sein
  • kann nur 1 sein wenn ŷᵢ=yᵢ
  • im Normalfall: s ŷ²<y² und daher R²<1

bei k=1
R²=r²( ŷᵢ , yᵢ)
R²= [b₁ * s(x) / s(y)]²

Berechnung:
1) Anteil der Modellvarianz an der Gesamtvarianz
2) bei k=1 über Slope oder Regressionsparameter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist R?

A
  • multiple Korrelation
  • nur positiv (?)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie wird in der einfachen linearen Regression auf Signifikanz getestet?

A
  • mittels F-Test
  • einseitig aber ungerichtete H1
  • testet bei K=1 die H0: b1 = 0 ; H1: b1 ≠ 0
    -> ist slope 0? Gibt es einen Zusammenhang?

F= mittlere QS Residuum / mittlere QS gesamt

F= R²(N-k-1) / k (1-R²). (??)

F-Wert wird mit df1 und df2 bei gewähltem Alpha verglichen

Deckt Modell einen signifikanten Anteil an Varianz auf?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche Modellannahmen hat das Modell der einfachen linearen Regression? Welche sind prüfbar?

A

1) UV ist metrisch oder dichotom. AV ist metrisch
2) linearer Zusammenhang
3) Homoskedastizität
4) Normalverteilung der Residuen
5) Unabhängigkeit der Beobachtungen

*) Prädiktor muss Varianz > 0 haben

2-4 sind statistisch oder graphisch prüfbar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was bedeutet Homoskedastizität?

A

Streuung der AV ist über Gruppen bzw. Prädiktoren halbwegs gleichmäßig verteilt
-> kontinuierliche Prädiktoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Varianzschätzer in der Regressionsanalyse? Wie sind sie verteilt?

A

mittlere Quadratsummen
siehe Zsmfsg Statistik

Varianzschätzer sind Chi² verteilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was testet der F-Test?

A

Vgl Varianzschätzer

F = mittlere QS(Modell) / mittlere QS(Residuum)

große F Werte sprechen für H1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie kann die Signifikanz der einzelnen Koeffizienten in der einfachen linearen Regression berechnet werden?

A

Teststatistik:
t = b / SE(b). mit df=N-k-1

-> Parameter / Ungenauigkeit des Parameters

bei k=1 ist F = t²

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind standardisierte / unstandardisierte Regressionskoeffizienten?

A

b:
- slope von unstand. Variablen
- auf der Ursprungsskala
- nicht über Skalen hinweg vergleichbar aber natürliche Skalen können interessant sein, zB Zigarette/Tag

Beta:
- transformiert in normalverteilung
- Slope von standardisierten Variablen
- über verschiedene Skalen hinweg vergleichbar