Lineare Zusammenhänge zwischen Variablen Flashcards
Definition lineare Zusammenhänge
Eine Beziehung der Form “je…,desto…”
Graphische Darstellung von Zusammenhängen
Die graphische Darstellung des Zusammenhangs zweier Variablen geschieht meist mithilfe eines Streudiagramms.
Ein Streudiagramm stellt die Wertepaare (xi,yi) für i=1,…n dar, wobei x und y zwei Variablen sind.
Wichtiger Aspekt eines Zusammenhangs 1: Richtung
Unterscheidung: gleichgerichtete- entgegengerichtete Zusammenhänge. (Natürlich kann es auch sein, dass zwischen zwei Variablen überhaupt kein Zusammenhang besteht.)
- Gleichgerichteter Zusammenhang –> steigende Gerade/ positive Steigung
- Entgegengerichteter Zusammenhang –> fallende Gerade/negative Steigung
- Kein Zusammenhang -> flache Gerade/Steigung nahe Null
Wichtiger Aspekt linearer Zusammenhänge 2: Stärke
- Durch die Punktewolke jedes Streudiagramms lässt sich eine Gerade mit Steigung bziehen, die die „Ausrichtung“ der Punktewolke bestmöglich beschreibt.
- Zwei Aspekte der Stärke des Zusammenhangs:
- Steigung der durch das Streudiagramm gezogenen Geraden.
- Begründung: Eine Veränderung in der Variable x um 1 geht mit einer vergleichsweise großeren Veränderung in y einher.
- Interessanter Extremfall: Steigung gleich Null -> kein Zusammenhang
1. Streuung der Messwerte um diese Gerade. Begründung: Bessere Vorhersage der Variablenwerte einzelner Merkmalsträger auf einer Variable bei Kenntnis ihrer Ausprägung auf der anderen Variable möglich. - Interessanter Extremfall: Alle Punkte liegen auf der Gerade -> Perfekte Vorhersage für jede Person möglich.
Wichtiger Aspekt linearer Zusammenhänge 2: Einheitsunabhängigkeit
Wenn wir vom Zusammenhang zweier Variablen sprechen, gehen wir sinnvollerweise davon aus, dass die Richtung und die Stärke dieses Zusammenhangs nicht von der Einheit der Messinstrumente abhängt, mit der die beiden Variablen erfasst werden
Anfordeungen an Maßzahlen zur Beschreibung linearer Zusammenhänge
Sinvolle Maszahlen, die den (linearen) Zusammenhang zwischen zwei Variablen bezeichnet, sollten die folgenden Anforderungen erfüllen:
- Richtung d. Zusammenhangs abbilden
- Stärke d. Zusammenhangs abbilden
- Unabhängig von der Einheit der Variablen sein
Motivation Kovarianz
- Wie können wir die Richtung eines Zusammenhangs (gleichgerichtet vs. entgegengerichtet) durch das Vorzeichen einer Maßzahl (+ vs. -) ausdrücken?
- Zunächst betrachten wir das Wertepaar (xi, yi) eines einzelnen Merkmalträgers:
- Wir suchen eine Größe, die positiv ist, falls die beiden Messwerte xi und yi in die gleiche Richtung von ihrem jeweiligen Mittelwert abweichen und negativ, falls sie in dieentgegengesetzte Richtung von ihrem jeweiligen Mittelwert abweichen.
Mögliche Lösung: Li=(xi-x̄)(yi-ȳ)
- (Falls xi und yi beide jeweils größer oder beide jeweils kleiner als ihre Mittelwerte sind, ist Li>0.
Falls xi kleiner und yi größer als der jeweilige Mittelwert ist oder xi größer und yi kleiner als ihre jeweiligen Mittelwerte sind, ist Li<0.)
Konstruktion der (empirischen) Kovarianz
3 Bemerkungen Kovarianz
Kovarianz- Richtung des Zusammenhangs
Die Kovarianz drückt die Richtung des Zusammenhangs durch ihr Vorzeichen aus.
Kovarianz- Stärke des Zusammenhangs
Kovarianz- Einheitsunabhängigkeit
Die Höhe der Kovarianz hängt von den Einheiten der Variablen ab.
Fazit Kovarianz
Sinnvolle Maßzahlen, die den (linearen) Zusammenhang zwischen zwei Variablen beschreiben, sollten die folgenden Anforderungen erfüllen:
- Sie sollten die Richtung des Zusammenhangs abbilden. ►Ist durch die Kovarianz erfüllt.
- Sie sollten die Stärke des Zusammenhangs abbilden. ►Ist durch die Kovarianz nicht (bzw. nur teilweise) erfüllt.
- Sie sollten unabhängig von der Einheit der Variablen sein. ►Ist durch die Kovarianz nicht erfüllt.
Motivation Korrelation
- Um das Problem der Einheitsabhängigkeit der Kovarianz zu lösen, werden wir die beiden Variablen standardisieren.
- Es wird sich zeigen, dass dadurch auch das Problem der fehlenden Abbildbarkeit der Stärke des Zusammenhangs gelöst wird.
Definition Standardisierung von Variablen
Standardisierung bedeutet, dass die einzelnen Messwerte derart transformiert werden, dass die resultierenden transformierten Messwerte einen vorgegebenen Mittelwert und eine vorgegebene Varianz aufweisen.
- Es gibt zahlreiche Möglichkeiten, Variablen zu standardisieren. Wir wählen die sogenannte z-Standardisierung.