Lineare Zusammenhänge zwischen Variablen Flashcards

1
Q

Definition lineare Zusammenhänge

A

Eine Beziehung der Form “je…,desto…”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Graphische Darstellung von Zusammenhängen

A

Die graphische Darstellung des Zusammenhangs zweier Variablen geschieht meist mithilfe eines Streudiagramms.

Ein Streudiagramm stellt die Wertepaare (xi,yi) für i=1,…n dar, wobei x und y zwei Variablen sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wichtiger Aspekt eines Zusammenhangs 1: Richtung

A

Unterscheidung: gleichgerichtete- entgegengerichtete Zusammenhänge. (Natürlich kann es auch sein, dass zwischen zwei Variablen überhaupt kein Zusammenhang besteht.)

  • Gleichgerichteter Zusammenhang –> steigende Gerade/ positive Steigung
  • Entgegengerichteter Zusammenhang –> fallende Gerade/negative Steigung
  • Kein Zusammenhang -> flache Gerade/Steigung nahe Null
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wichtiger Aspekt linearer Zusammenhänge 2: Stärke

A
  • Durch die Punktewolke jedes Streudiagramms lässt sich eine Gerade mit Steigung bziehen, die die „Ausrichtung“ der Punktewolke bestmöglich beschreibt.
  • Zwei Aspekte der Stärke des Zusammenhangs:
  • Steigung der durch das Streudiagramm gezogenen Geraden.
  • Begründung: Eine Veränderung in der Variable x um 1 geht mit einer vergleichsweise großeren Veränderung in y einher.
  • Interessanter Extremfall: Steigung gleich Null -> kein Zusammenhang
    1. Streuung der Messwerte um diese Gerade. Begründung: Bessere Vorhersage der Variablenwerte einzelner Merkmalsträger auf einer Variable bei Kenntnis ihrer Ausprägung auf der anderen Variable möglich.
  • Interessanter Extremfall: Alle Punkte liegen auf der Gerade -> Perfekte Vorhersage für jede Person möglich.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wichtiger Aspekt linearer Zusammenhänge 2: Einheitsunabhängigkeit

A

Wenn wir vom Zusammenhang zweier Variablen sprechen, gehen wir sinnvollerweise davon aus, dass die Richtung und die Stärke dieses Zusammenhangs nicht von der Einheit der Messinstrumente abhängt, mit der die beiden Variablen erfasst werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Anfordeungen an Maßzahlen zur Beschreibung linearer Zusammenhänge

A

Sinvolle Maszahlen, die den (linearen) Zusammenhang zwischen zwei Variablen bezeichnet, sollten die folgenden Anforderungen erfüllen:

  1. Richtung d. Zusammenhangs abbilden
  2. Stärke d. Zusammenhangs abbilden
  3. Unabhängig von der Einheit der Variablen sein
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Motivation Kovarianz

A
  • Wie können wir die Richtung eines Zusammenhangs (gleichgerichtet vs. entgegengerichtet) durch das Vorzeichen einer Maßzahl (+ vs. -) ausdrücken?
  • Zunächst betrachten wir das Wertepaar (xi, yi) eines einzelnen Merkmalträgers:
  • Wir suchen eine Größe, die positiv ist, falls die beiden Messwerte xi und yi in die gleiche Richtung von ihrem jeweiligen Mittelwert abweichen und negativ, falls sie in dieentgegengesetzte Richtung von ihrem jeweiligen Mittelwert abweichen.

Mögliche Lösung: Li=(xi-x̄)(yi-ȳ)

  • (Falls xi und yi beide jeweils größer oder beide jeweils kleiner als ihre Mittelwerte sind, ist Li>0.

Falls xi kleiner und yi größer als der jeweilige Mittelwert ist oder xi größer und yi kleiner als ihre jeweiligen Mittelwerte sind, ist Li<0.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Konstruktion der (empirischen) Kovarianz

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

3 Bemerkungen Kovarianz

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Kovarianz- Richtung des Zusammenhangs

A

Die Kovarianz drückt die Richtung des Zusammenhangs durch ihr Vorzeichen aus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Kovarianz- Stärke des Zusammenhangs

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Kovarianz- Einheitsunabhängigkeit

A

Die Höhe der Kovarianz hängt von den Einheiten der Variablen ab.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Fazit Kovarianz

A

Sinnvolle Maßzahlen, die den (linearen) Zusammenhang zwischen zwei Variablen beschreiben, sollten die folgenden Anforderungen erfüllen:

  1. Sie sollten die Richtung des Zusammenhangs abbilden. ►Ist durch die Kovarianz erfüllt.
  2. Sie sollten die Stärke des Zusammenhangs abbilden. ►Ist durch die Kovarianz nicht (bzw. nur teilweise) erfüllt.
  3. Sie sollten unabhängig von der Einheit der Variablen sein. ►Ist durch die Kovarianz nicht erfüllt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Motivation Korrelation

A
  • Um das Problem der Einheitsabhängigkeit der Kovarianz zu lösen, werden wir die beiden Variablen standardisieren.
  • Es wird sich zeigen, dass dadurch auch das Problem der fehlenden Abbildbarkeit der Stärke des Zusammenhangs gelöst wird.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Definition Standardisierung von Variablen

A

Standardisierung bedeutet, dass die einzelnen Messwerte derart transformiert werden, dass die resultierenden transformierten Messwerte einen vorgegebenen Mittelwert und eine vorgegebene Varianz aufweisen.

  • Es gibt zahlreiche Möglichkeiten, Variablen zu standardisieren. Wir wählen die sogenannte z-Standardisierung.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Definition z-Standardisierung

A
17
Q

Definiton Pearson-Korrelation

A
18
Q

3 Bemerkungen Korrelation

A
19
Q

Korrelation-Richtung des Zusammenhangs

A

Die Korrelation drückt die Richtung des Zusammenhangs durch ihr Vorzeichen aus.

20
Q

Korrelation- Stärke des Zusammenhangs

A

Die Korrelation drückt die Stärke des Zusammenhangs durch ihre Höhe im Betrag aus: Je näher die Korrelation an 1 oder -1 liegt, desto stärker ist der Zusammenhang der beiden Variablen.

  • Man kann mathematisch zeigen, dass die Korrelation vom Verhältnis der Steigung der Gerade zur Streuung der Messwerte um die Gerade im Streudiagramm abhängt.
  • Je größer dieses Verhältnis, desto höher fällt die Korrelation im Betrag aus.
  • Das heißt, sowohl die Steigung der Gerade als auch die Streuung der Messwerte um die Gerade wird durch die Korrelation berücksichtigt.
  • Extremfall: Liegen alle Punkte auf der Gerade, nimmt die Korrelation einen Wert von 1 bei positiver und einen Wert von -1 bei negativer Steigung an.
21
Q

Korrelation- Einheitsunabhängigkeit

A

Die Höhe der Korrelation hängt nicht von der Einheit der Variablen ab.

22
Q

Fazit Korrelation

A

Sinnvolle Maßzahlen, die den (linearen) Zusammenhang zwischen zwei Variablen beschreiben, sollten die folgenden Anforderungen erfüllen:

  1. Sie sollten die Richtung des Zusammenhangs abbilden. ►Ist durch die Korrelation erfüllt.
  2. Sie sollten die Stärke des Zusammenhangs abbilden. ►Ist durch die Korrelation erfüllt.
  3. Sie sollten unabhängig von der Einheit der Variablen sein. ►Ist durch die Korrelation erfüllt.
23
Q

Weitere Korrelationsmaße (Außwahl)

A

Neben der hier besprochenen Pearson-Korrelation, die den Zusammenhang zweier metrischer Variablen beschreibt, gibt es zahlreiche weitere Maßzahlen, die den Zusammenhang zwischen nicht-metrischen Variablen beschreiben, z.B:

  • Phi-Koeffizient: Zwei nominale Variablen
  • Spearman-Rangkorrelation: Zwei ordinale Variablen
  • Punktbiseriale Korrelation: Eine nominale und eine metrische Variable

(Verwendung dieser Korrelationsmaße im Vergleich zur Pearson-Korrelation eher selten)

24
Q

Häufige Fehler bei der Interpretation der Korelation

A
  • Die Ausreißersensitivität der Korrelation wird nicht beachtet.
  • Die Korrelation wird für die Beschreibung eines nonlinearen Zusammenhangs verwendet.
  • Aus der Korrelation werden Aussagen über einzelne Personen abgeleitet.
  • Aus der Korrelation werden kausale Aussagen abgeleitet.
25
Q

Häufiger Fehler bei der Interpretation der Korelation I:

Ausreißersensitivität

A

Die Ausreißersensitivität der Korrelation wird nicht beachtet.

  • Ausreißer können die Korrelation (vor allem bei einer geringen Anzahl an Merkmalträgern) stark verzerren
  • Wichtig: Ausreißer sollten nur aus den Daten entfernt werden, falls sich herausstellt, dass sie durch einen Dateneingabefehler entstanden sind (z.B. in Excel vertippt).
  • Häufig ist es interessant, sich die Ausreißer genauer anzuschauen
26
Q

Häufiger Fehler bei der Interpretation der Korrelation II:

Nonlineare Zusammenhäge

A

Die Korrelation wird für die Beschreibung eines nonlinearen Zusammenhangs verwendet.

  • Die Korrelation ist eine Maßzahl für den linearen Zusammenhang zweier Variablen (also für die „je …, desto …“ - Beziehung).
  • Nicht alle Arten von Zusammenhängen haben diese Form. Es können auch nonlineareZusammenhänge zwischen Variablen bestehen. Häufig ist dies leicht im Streudiagramm zu sehen.
  • Liegt zwischen zwei Variablen ein nonlinearer Zusammenhang vor, ist die Korrelation nicht die geeignete Maßzahl. Beispielsweise ist die Korrelation bei einem perfekten quadratischen Zusammenhang gleich 0
27
Q

Häufiger Fehler bei der Interpretation der Korrelation III: Aussagen über einzelne Personen

A

Aus der Korrelation werden Aussagen über einzelne Personen abgeleitet.

  • Die Korrelation ist ein Maß, dass sich auf eine Reihe von Messwerten bezieht.
  • Sie gibt hierbei lediglich die durchschnittlichen gleich- bzw. entgegengerichteten Abweichungen der Messwerte vom Mittelwert an.
  • Es können daher auf der Basis der Korrelation keine Aussagen über die Abweichungen einzelner Personen getroffen werden
  • (Unrealistische Ausnahme: Alle Punkte liegen auf der Geraden.)
28
Q

Häufige Fehler bei der Interpretation der Korrelation IV:

Korrelation und Korrelation

A
  • Auf Basis einer Korrelation kann keine Aussage über einen Ursache-Wirkung- Zusammenhang getroffen werden.
  • Es existieren stets mehrere Erklärungen für den beobachteten Zusammenhang, die von unterschiedlichen kausalen Zusammenhängen ausgehen.
  • Ausnahme: Experimenteller Versuchsaufbau.