VL 4 - Multiple Regression II Flashcards
Ist der Determinationskoeffizient (R²) in der Stichprobe ein erwartungstreuer Schätzer des der Population?
Nein
–> R² überschätzt P² (rho)
Was prüft der F-Test zur Signifikanzprüfung von R² in der MR?
Liefern die Prädiktoren (zusammen) einen signifikanten Beitrag zur Vorhersage des Kriteriums?
Was ist die H0 vom F-Test zur Signifikanzprüfung von R² in der MR?
- Determinationskoeffizient d. Population (P²) = 0
ODER
- Alle Regressionsgewichte = 0
Ist das Regressionsgewicht in der Stichprobe ein erwartungstreuer
Schätzer des Regressionsgewichtes in der Population? (MR)
Ja
Was wird beim Signifikanztest für die einzelnen Regressionskoeffizienten bj geprüft? (MR)
ob / welches der Regressionsgewichte sich von Null unterscheiden
Der F-Test zur inkrementellen Validität eines Prädiktors ist mathematisch äquivalent zum …
t-Test auf Signifikanz des Regressionskoeffizienten dieses
Prädiktors (MR)
Was ist das Inkrement/Nützlichkeit eines Prädiktors?
“Wieviel Varianz erklärt ein Prädiktor zusätzlich zu allen anderen Prädiktoren?“
Wie verhält sich das Konfidenzintervall (CI) der Regressionsgeraden?
ist schmaler in der Mitte und breiter an den Rändern
Warum kann R² als eine Effektgröße verwendet werden?
weil es ein standardisiertes Maß ist
Was ist die Teststärke/Power?
- Wahrscheinlichkeit, einen Effekt aufzudecken, den es tatsächlich gibt
- Wahrscheinlichkeit für ein signifikantes Ergebnis, wenn die H0 tatsächlich nicht gilt
Was beeinflusst die Teststärke/Power? (3)
- Effektgröße (vorgegeben)
- Signifikanzniveau (meist 5 %)
- Stichprobengröße (kann von uns beeinflusst werden)
Was muss ich alles festlegen um in einer a-priori Poweranalyse mir die optimalen Stichprobegröße berechnen zu lassen (benötigte Parameter)? (4)
- Signifikanzniveau (alpha)
- Power (1 - b)
- Erwarteter Determinationskoeffizient (R² bzw. f², Effektgröße)
- Anzahl der Prädiktoren
Was ist die theoriegeleitete Auswahl an Prädiktoren?
Alle Variablen werden in die Regressionsgleichung aufgenommen, von denen man aus theoretischen Überlegungen einen Beitrag erwartet
–> Reihenfolge hängt von Fragestellung ab
–> oft blockweise aufgenommen (hierarchische Regression)
Was sind die Ziele der datengesteuerten Variablenauswahl (2)?
- Maximierung d. Varianzaufklärung
- Sparsamkeit
Was sind die 3 Strategien d. datengesteuerten Auswahl?
- Vorwärtsselektion
- Rückwärtselimination
- schrittweise Regression (= Kombination von Vorwärtsselektion und Rückwärtselimination)
Gelangen die 3 Strategien d. datengesteuerten Auswahl zur selben Variablenauswahl?
optimalerweise ja, aber in kleinen Stichproben können sich die Ergebnisse unterscheiden
Was passiert bei der Vorwärtsselektion?
- alle potentiellen Prädiktoren werden spezifiziert
- dann wird schrittweise immer diejenige Variable in das Modell aufgenommen, die das größte Inkrement zeigt.
- solange, bis weitere Prädiktoren nicht mehr signifikant sind
Was passiert bei der Rückwärtselimination?
- alle Prädiktoren werden in das Modell aufgenommen
- dann wird schrittweise immer diejenige Variable aus dem Modell entfernt, die das geringste und nicht-signifikante Dekrement zeigt.
- solange, bis nur noch signifikante Prädiktoren verbleiben
Was passiert bei der schrittweisen Regression?
- Während einer Vorwärtsselektion wird nach jedem Schritt überprüft, ob ein Prädiktor nicht-signifikant geworden ist
- Dieser wird dann entfernt.
- Solange, bis kein Prädiktor mehr aufgenommen werden kann, der noch einen zusätzlichen Beitrag leistet und kein nicht-signifikanter Prädiktor im Modell ist
Was ist das Ziel der theoriegeleiteten Auswahl?
Test von theoretischen Modellen
Welches Risiko besteht bei der theoriegeleiteten Auswahl?
Overfitting (Aufnahme statistisch irrelevanter Prädiktoren)
Wie ist die Effizienz d. theoriegeleiteten Auswahl?
Weniger effiziente Vorhersage von
Merkmalen