Regression/ lineare Modelle Flashcards
Chi2-Test (Definition) (3)
Test auf Unabhängigkeit zweier nominal skalierter Merkmale
Sehr häufig bei der Auswertung von Befragungen
Berechnung von Erwartungswerten zur Darstellung der Nullhypothese
Anwendung auf Kreuztabelle
Interpretation Ergebnis Chi2
Hohe x² Werte = hohe Wahrscheinlichkeit der Ablehnung von H 0
Mehrfaktorielle Anova
mehrere Prädiktorvariablen
Regression
gerichteter Zusammenhang, Abhängigkeit zw. den beiden Variablen (Faktor X-Achse abhängig von Faktor Y-Achse)
Unterschied Korrelation (nur Überprüfung auf Zusammenhang)
Grafische Darstellung der Interaktion zweier Faktoren
wenn Graphen wenig parallel oder stark auseinander laufen, ist das immer ein Hinweis auf Interaktion/ Abhängigkeit der beiden Faktoren
Aufbau Regressionsgleichung
lineares Regressionsmodell ergibt sich aus:
y-Achsenabschnitt (Achsenschnittpunkt)
+
X * Steigung, Regressionskoeffizient
+
Fehler, zuf. Abweichung vom Modell
Methode der kleinsten Fehlerquadrate
(ordinary least squares)
Abweichung der einzelnen Werte von der Regressionsgerade wird minimiert
Residuen
Abweichung von den durch das Modell vorhergesagten Werten von der Regressionsgeraden (nicht erklärte Abweichung)
Vertrauensintervall
Bereich, in dem mit einer
bestimmten Wahrscheinlichkeit
ein bestimmter Prozentsatz
(meist 95%) der Werte liegen
würde, wenn aus der gleichen
Grundgesamtheit neue
Stichproben gezogen würden
Regressionsmodell als Anova (3)
erklärter Anteil:
Abweichung des Punktes vom Mittelwert (Mittelwertsgeraden)
-> Modell
nicht erklärter Anteil:
Abweichung des Punkts von der Regressionsgeraden/ Modell
-> Residuum
Gesamtabweichung/-varianz:
Residuum + Modell
Unterschied Regression - Anova
(erklärte Varianz)
Anova:
Abstand zwischen Gruppenmittelwert und Gesamtmittelwert
Regression:
Abstand zwischen Gerade und Gesamtmittelwert
Unterschied Regression - Anova
(nicht erklärte Varianz)
Abweichung vom Modell: Resiuduen
Anova:
Streuung um die Gruppenmittelwerte
Regression:
Streuung um die Regressionsgerade
Gesamtstreuung (Regression/Anova)
Modell + Error/Residuen
=Streuung um den Gesamtmittelwert
schlechtes Modell (Regression/Anova)
wenn Gesamtmittelwert das Modell genau so gut erklärt wie die Gruppenmittelwerte oder die Regressionsgerade, dann ist das Modell nicht besonders gut
Multiple lineare Regression
mehrere Variablen erklären eine metrische Response-Variable