Erweiterte Regressionsmodelle Flashcards

1
Q

was ist eine Kovariate

A

Eine Kovariate ist eine unabhängige Variable, die nicht von direktem Interesse ist,
aber die Wirkung anderer unabhängiger Variablen beeinflusst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dummy-Variable. Beschreibung

A

Eine Dummy-Variable ist eine unabhängige Variable mit den binären Ergebnissen
x∈ {0, 1}.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Analyse der Kovarianz (Ancova Design) Ziel?

A

Ziel eines Ancova-Designs ist es, den Unterschied zwischen den Gruppen in Bezug auf
eine kontinuierliche abhängige Variable nach (linearer) Bereinigung um
Gruppenunterschiede in Bezug auf eine kontinuierliche Kovariate zu bewerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

impliziert Korrelation Kausalität?

A

Nein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

was bedeutet Korrelation impliziert nicht Kausalität?

A

Die Aussage „Korrelation impliziert keine Kausalität“ bedeutet, dass nur weil zwei Variablen miteinander korrelieren (also ein statistischer Zusammenhang zwischen ihnen besteht), dies nicht zwangsläufig bedeutet, dass die eine Variable die andere verursacht. Mit anderen Worten, eine beobachtete Beziehung zwischen zwei Variablen beweist nicht, dass die eine die Ursache der anderen ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

wie bestimmt man den marginalen Effekt von X auf Y

A

MarginalerEffektvonXaufY= ∂X/∂Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

was macht ANCOVA (Analyse von Kovarianzen)

A

ANCOVA hilft uns, Gruppen fair zu vergleichen, indem der Einfluss einer Störvariablen (Kovariate) entfernt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Annahmen der ANCOVA

A

-Linearität (Kovariate Z muss linear mit der abhängigen variable Y zusammenhängen)
-Die Varianz der Fehlerterme muss für alle Gruppen gleich sein
-Unabhängigkeit der beobachtungen (Datenpunkte müssen statistisch unabhängig sein)
-Parallelitätsannahme( Regressionslinien müssen für jede gruppe die gleiche Steigung haben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Interaktionseffekt bedeutung

A

Ein Interaktionseffekt ist der Koeffizient, der in einem linearen Regressionsmodell
mit dem Produkt aus zwei (oder mehr) unabhängigen Variablen verbunden ist. beta_3 * (x_i * z_i). Hier wäre beta_3 der Koeffizient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

wann liegt eine nichtlineare transformation vor?

A

Eine lineare Regression setzt voraus, dass die abhängige Variable 𝑌 linear von den unabhängigen Variablen X abhängt.
Wenn dies nicht der Fall ist, können nichtlineare Transformationen helfen, die Beziehung zu linearisieren.(Bsp. log)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

höherwertige Interaktionseffekte Vorteile/Nachteile

A

Vorteil: bessere Beschreibung der Daten
Nachteil: - es wird schwierig diese Effekte zu interpretieren
- bei mehr unabhängigen Variablen wird die Zahl der Interaktionseffekte sehr groß

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Annahme des Paralellismus

A

Die Annahme des Parallelismus besagt, dass sich die Wirkung einer unabhängigen Variablen auf eine abhängige Variable nicht zwischen Gruppen unterscheidet – die Steigungen der Regressionslinien sind gleich. Wird diese Annahme verletzt, muss ein Interaktionseffekt berücksichtigt werden, sonst wird der Koeffizient des Interaktionseffektes = 0 gesetzt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

was bedeutet (BLUE)

A

beste lineare unverzerrte Schätzer

BLUE bedeutet nicht nur, dass sie unverzerrt sind, sondern auch, dass die
Standardfehler der Schätzer so klein sind, wie sie für jeden unverzerrten linearen
Schätzer der Koeffizienten erwartet werden können, wodurch die statistische
Aussagekraft [Teststärke] des Hypothesentests maximiert wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Worauf beziehen sich Homoskedastizität und Heteroskedastizität?

A

auf die Streuung der Residuen (Fehlervariablen) in einer Regression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Formel und Bedeutung Fehlervarianz

A

σ^2=E[(ε_i−E[ε_i])^2 ]=E[ε_i^2]

Die Fehlervarianz beschreibt, wie stark die Fehlerterme (Residuen) einer Regression um ihren Mittelwert streuen. Sie gibt an, wie stark die beobachteten Werte um die vorhergesagten Werte variieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Homoskedastizität bedeutung

A

Fehlervarianz konstant bleibt, unabhängig vom Wert der unabhängigen Variablen

Var(ε_i)=σ^2 für alle i
Das bedeutet, dass die Fehler unabhängig von den erklärenden Variablen sind und ihre Streuung konstant bleibt.

Implikation:Die OLS-Schätzungen bleiben effizient (bestmögliche Schätzer mit minimaler Varianz).
Die Varianzen der Regressionskoeffizienten sind korrekt berechnet, sodass Hypothesentests und Konfidenzintervalle zuverlässig sind.

16
Q

Heteroskedastizität (Nicht-konstante Fehlervarianz) Bedeutung und formel

A

Die Fehlervarianz ändert sich in Abhängigkeit von den unabhängigen Variablen.
Mathematisch:
𝑉𝑎𝑟(𝜀_𝑖)≠𝜎^2
Die Fehlerterme haben keine konstante Varianz, sondern nehmen z. B. bei größeren
X-Werten zu oder ab.

Implikation: Die OLS-Schätzer bleiben unverzerrt, sind aber nicht effizient (es gibt bessere Schätzer mit geringerer Varianz).
Die Standardfehler der Regressionskoeffizienten sind falsch berechnet, wodurch Hypothesentests und Konfidenzintervalle nicht mehr zuverlässig sind.

17
Q

Robuste Standardfehler Erklärung

A

Im Falle von Heteroskedastizität liefern die robusten Standardfehler Schätzungen
der Standardfehler der Koeffizienten βˆ, die konsistent sind ,d.h. die Verzerrung nimmt mit n →∞ ab

18
Q

wann ist eine variable signifikant

A

Eine Variable in einem statistischen Modell (z. B. in einer Regression) ist signifikant, wenn die Nullhypothese, die besagt, dass der Effekt der Variablen auf die abhängige Variable null ist (also keine Wirkung existiert), mit einer ausreichend hohen Wahrscheinlichkeit abgelehnt werden kann.

Die Signifikanz wird häufig durch den p-Wert gemessen, der im Rahmen von Hypothesentests ermittelt wird

p-Wert < Alpha -> Variable ist signifikant

19
Q

Exogenitätsannahme

A

Die Exogenitätsannahme besagt, dass E(U| x)= 0; die bedingte Expektum g der Residuen (bei x) gleich Null ist. Damit ist sichergestellt, dass die OLS
Die Schätzungen βˆ sind unverzerrt.

20
Q

Endogenität

A

Endogenität ist ein Verstoß gegen die Exogenitätsannahme, der dazu führt, dass die
Schätzungen βˆ verzerrt (und nicht konsistent) sind.

21
Q

endogene Variable

A

Eine unabhängige Variable, die mit dem Restterm der Regressionsgleichung
korreliert ist, wird als endogene Variable bezeichnet

22
Q

was beschreibt Korrelation

A

Korrelation beschreibt den Zusammenhang oder die Beziehung zwischen zwei Variablen. Sie gibt an, wie stark und in welcher Richtung zwei Variablen miteinander verknüpft sind.

23
Q

Exogene Variable

A

Eine unabhängige Variable, die nicht mit dem Residualterm der
Regressionsgleichung korreliert ist, wird als exogene Variable bezeichnet.

24
Q

was ist eine instrumentalvariable

A

ist eine unabhängige variable, die mit einer endogenen Variable korreliert ist und nicht mit dem restterm korreliert ist, mit dem die endogene Variable korreliert ist