Vorlesung 4 Regresssion II Flashcards
Ist der Determinationskoeffizient (R^2) in der Stichprobe ein erwartungstreuer Schätzer des der Population ?
Nein
R^2 überschätzt P^2
Was prüft der F-Test zur Signifiknazprüfung von R^2 in der multiplen Regression?
Liefern die Prädiktoren (zusammen) einen signifikanten Beirat zur Vorhersage des Kriteriums
Was ist die H0 vom F-Test zur signifikanzprüfung von R^2 in MR?
- Determinationskoeffizient der Population (P^2=0)
Oder - Alle Regressiongewichte = 0
Ist das Regressionsgewicht in der Stichprobe ein erwartungstreuer Schätzer des Regressionsgewichtes in der Population? MR
Ja
Was wird beim signifkanztest für die einzelnen Regressionskoeffizienten bj geprüft
Ob / welches der Regressiongewichte sich von Null unterscheiden
Der F- Test zur Inkrementellen Validität eines Prädiktors ist mathematisch äquivalent zum ….
…t- Test auf Signifikanz des Regressionskoeffizienten dieses Prädiktors (MR)
Was ist das Inkrement/ Nützlichkeit des Prädiktors?
„Wie viel Varianz erklärt ein Prädiktor zusätzlich zu alle anderen Prädiktoren“
Wie verhält sich das Konfidenzintervall (CI) der Regressionsgerade
Ist schmaler in der Mitte und breiter an den Rändern
Warum kann R^2 als eine Effektgröße verwendet werden ?
Weil es ein standardisiertes Maß ist
Was ist die Teststärke/ Power?
- Wahrscheinlichkeit, einen Effekt aufzudecken, den es tatsächlich gibt
- Wahrscheinlichkeit für ein signifikantes Ergebnis wenn die H0 tatsächlich nicht gilt
Was beeinflusst die Teststärke / Power ?
- Effektgröße (vorgegeben)
- Signifkanzniveau (meist 5%)
- Stichprobengröße (kann von uns beeinflusst werden)
Was muss ich alles festlegen um in einer a priori Poweranalyse die optimale Stichprobengröße berechnen zu lassen
- Signifikanzniveau (alpha)
- Power/ Teststärke (1-ß)
- Erwarteter Determinationskoeffizient (R^2 bzw f^2, Effektgröße)
- Anzahl der Prädiktoren
Was ist die theoretische Auswahl an Prädiktoren ?
Alle Variablen werden in die Regressionsgleichung aufgenommen, von denen man aus theoretischen Überlegungen einen Beitrag erwartet
–>Reihenfolge hängt von Fragestellungen an
–> oft blockfreies aufgenommen (hierarchische Regression)
Was sind Ziele der datengesteuerten Variablenauswahl ?
- Maximierung der Varianzaufklärung
- Sparsamkeit
Was sind die drei Strategien der datengesteuerten Auswahl?
- Vorwärtsselektion
- Rückwertsselektion
- Schrittweise Regression ( Kombi Vorwärts und Rückwärts)
Gelangen die 3 Strategien der datengesteuerten Auswahl zur selben Variablenauswahl ?
Optimalerweise ja, aber in kleinen Stichproben können sich Ergebnisse unterscheiden
Was passiert bei Vorwärtsselektion
- alle potentielle Prädiktoren werden spezifiziert
- dann wird schrittweise immer diejenige Variable ins Modell aufgenommen , die größte Inkrement zeigt
- solange bis weiter Prädiktoren nicht mehr signifikant
Was passiert bei Rückwärtsselektion?
- alle Prädiktoren werden in Modell aufgenommen
- dann wird schrittweise immer diejenige Variable aus dem Modell entfernt die das geringste Dekrement zeigt.
- solange bis nur noch signifikante Prädiktoren verbleiben
Was passiert bei der schrittweisen Regresssion ?
- Während einer Vorwärtsselektion wird nach jedem Schritt überprüft ob ein Prädiktor nicht mehr signifikant ist
- Dieser wird dann entfernt
- Solange bis kein Prädiktor mehr aufgenommen werden kann, der noch einen zusätzlichen Beitrag leistet und kein nicht signifikanter Prädiktor im Modell ist
Was ist das Ziel der theoriegeleiteten Auswahl ?
Test von theoretischen Modellen
Welches Risiko besteht bei der theoriegeleiteten Auswahl
Overfitting (Aufnahme statistisch irrelevanter Prädiktoren)
Wie ist die Effizienz der theoriegeleiteten Auswahl?
Weniger effiziente Vorhersagen von Merkmalen