Regression/ lineare Modelle Flashcards
Chi2-Test (Definition) (3)
Test auf Unabhängigkeit zweier nominal skalierter Merkmale
Sehr häufig bei der Auswertung von Befragungen
Berechnung von Erwartungswerten zur Darstellung der Nullhypothese
Anwendung auf Kreuztabelle
Interpretation Ergebnis Chi2
Hohe x² Werte = hohe Wahrscheinlichkeit der Ablehnung von H 0
Mehrfaktorielle Anova
mehrere Prädiktorvariablen
Regression
gerichteter Zusammenhang, Abhängigkeit zw. den beiden Variablen (Faktor X-Achse abhängig von Faktor Y-Achse)
Unterschied Korrelation (nur Überprüfung auf Zusammenhang)
Grafische Darstellung der Interaktion zweier Faktoren
wenn Graphen wenig parallel oder stark auseinander laufen, ist das immer ein Hinweis auf Interaktion/ Abhängigkeit der beiden Faktoren
Aufbau Regressionsgleichung
lineares Regressionsmodell ergibt sich aus:
y-Achsenabschnitt (Achsenschnittpunkt)
+
X * Steigung, Regressionskoeffizient
+
Fehler, zuf. Abweichung vom Modell
Methode der kleinsten Fehlerquadrate
(ordinary least squares)
Abweichung der einzelnen Werte von der Regressionsgerade wird minimiert
Residuen
Abweichung von den durch das Modell vorhergesagten Werten von der Regressionsgeraden (nicht erklärte Abweichung)
Vertrauensintervall
Bereich, in dem mit einer
bestimmten Wahrscheinlichkeit
ein bestimmter Prozentsatz
(meist 95%) der Werte liegen
würde, wenn aus der gleichen
Grundgesamtheit neue
Stichproben gezogen würden
Regressionsmodell als Anova (3)
erklärter Anteil:
Abweichung des Punktes vom Mittelwert (Mittelwertsgeraden)
-> Modell
nicht erklärter Anteil:
Abweichung des Punkts von der Regressionsgeraden/ Modell
-> Residuum
Gesamtabweichung/-varianz:
Residuum + Modell
Unterschied Regression - Anova
(erklärte Varianz)
Anova:
Abstand zwischen Gruppenmittelwert und Gesamtmittelwert
Regression:
Abstand zwischen Gerade und Gesamtmittelwert
Unterschied Regression - Anova
(nicht erklärte Varianz)
Abweichung vom Modell: Resiuduen
Anova:
Streuung um die Gruppenmittelwerte
Regression:
Streuung um die Regressionsgerade
Gesamtstreuung (Regression/Anova)
Modell + Error/Residuen
=Streuung um den Gesamtmittelwert
schlechtes Modell (Regression/Anova)
wenn Gesamtmittelwert das Modell genau so gut erklärt wie die Gruppenmittelwerte oder die Regressionsgerade, dann ist das Modell nicht besonders gut
Multiple lineare Regression
mehrere Variablen erklären eine metrische Response-Variable
Merkmale allgem. lineare Modell
kann mit mehreren Prädiktorvariablen unterschiedlicher Skalierung rechnen:
mehrere kontinuierlich
-> multiple Regression
mehrere Faktoren
-> multifaktorielle Anova
kontinuierliche und Faktoren
->Ancova
lineare Modelle in R
multiple Regression:
lm(response~Var1+Var2)
multifaktorielle Anova:
lm(response~Fakt1+Fakt2)
Ancona
lm(response~Var1+Fakt1)
Gesamtmittelwert der Regression (2)
die Güte mit der der Gesamtmittelwert mit der Regressionsgeraden verglichen wird
Wenn die Gerade des Mittelwerts (waagerecht, ohne Steigung) einen ähnlichen Erklärungswert für die Varianz hat wie der, der steigenden Regressionslinie, dann ist es relativ klar, dass mit dem Regressionsmodell wenig erklärt werden kann
Varianzanteil, der erklärt werden kann ist relativ gering