Deskriptive Statistik – bivariate Verteilungen Flashcards

1
Q

univariate vs. bivariate Verteilung

A

univariate Verteilung:

  • Die Verteilung eines Merkmals für sich betrachtet

bivariate Verteilung:

  • Wie die Ausprägung eines Merkmals mit dem anderen Merkmal korreliert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beispiel für die Datenstruktur einer empirischen Untersuchung (Schaubild)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Um sich einen Überblick über den Zusammenhang zwischen zwei Merkmalen zu verschaffen, …

A

… betrachtet man deren gemeinsame Variation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Eigenschaften eines Sreudiagramms

A
  • auch Achsendiagramm genannt
  • Zusammenhänge von zwei Merkmalen werden sichtbar
  • x-Achse: unabhängige Variable
  • y-Achse: abhängige/beeinflusste Variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Streudiagramm (Beispiel, Schaubild)

A
  • Jeder Punkt steht für ein Wertepaar (Größe der Füße “X”, Körpergröße “Y”)
  • Je weiter ein Punkt rechts im Streudiagramm liegt, desto größer war die Person

> Je weiter rechts ein Punkt liegt, desto höher liegt er auch im Diagramm

> Positiver Zusammenhang

> Sozialwissenschaftlich gibt es nie perfekte Zusammenänge (anders als z.B. in der Physik)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Streudiagramme bei positivem Zusammenhang

A
  • Die Merkmale ändern sich gemeinsam in dieselbe Richtung
  • Je größer das eine Merkmal ist, desto größer wird das andere
  • Je kleiner, desto kleiner
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Streudiagramme bei negativem Zusammenhang

A
  • Je größer das eine Merkmal, desto kleiner wird das andere

oder

  • Je kleiner das eine, desto größer das andere

Beispiel:

  • Alter und Reaktionsvermögen stehen in einem negativen Zusammenhang
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein häufiges Missverständnis in der Statistik?

A
  • Ein negativer Zusammenhang wird als ein nicht bestehender Zusammenhang gesehen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Beispiele für Streudiagramme mit zunehmender Stärke von links nach rechts (Schaubild)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie zeigt sich die Stärke eines Zusammenhangs?

A
  • Zeigt sich darin, wie eng sich die Punkte um eine imaginäre Linie herum sammeln
  • Es kann starke positive und starke negative Zusammenhänge geben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Das Streudiagramm ist ein wichtiges Instrument zur …

A

… Überprüfung von bivariaten Verteilungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche verschiedene Zusammenhänge gibt es?

A

lineare Zusammenhänge (häufig)

kurvilineare Zusammenhänge (mathematisch nicht berechenbar)

nicht-lineare Zusammenhänge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beispiele für Streudiagramme mit kurvilinearen Zusammenhänge (Schaubild)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Korrelieren zwei Merkmale, heißt dies nicht automatisch, dass …

A

… ein kausaler Zusammenhang besteht

> Um auf Kausalität schließen zu können, bedarf es meist zusätzlichen Wissens oder andere Faktoren müssen ausgeschlossen werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Kausalität?

A

Die Annahme eines Ursache-Wirkungs-Zusammenhängs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Um zu prüfen, ob Merkmal X die Ursache für Merkmal Y ist, muss …

A
  1. … Merkmal X zeitlich vor Merkmal Y auftreten
  2. eine Korrelation zwischen den Merkmalen bestehen
  3. ausgeschlossen werden, dass der Zusammenhang durch ein drittes Merkmal Z erklärt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Bei experimentellen Studien wird …

A

… eine Intervention eingesetzt, um einen Effekt hervorzurufen

  • Externe Faktoren werden kontrolliert und deren Einfluss somit ausgeschlossen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Unterschied Zusammenhang vs. Kausalität

A

Zusammenhang:

  • je größer, desto größer

Kausalität:

  • mehr X führt zu mehr Y
  • > Wird keine explizite Begründung für die Kausalität aufgeführt, sollte man im Zweifel davon ausgehen, dass kein kausaler Zusammenhang besteht*
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was sind Zusammenhangsmaße?

A
  • auch Assoziationsmaße oder Kontingenzmaße genannt
  • Geben mittels einer Kennzahl die Stärke des Zusammenhangs an
  • Hängt von der Datenstruktur ab
  • Es werden bivariate Verteilungen betrachtet

> Skalenniveau beider Merkmale muss berücksichtigt werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Auswahl gängiger Zusammenhangsmaße in Abhängigkeit vom Skalenniveau der Merkmale (Schaubild)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist eine Kreuztabelle?

A
  • wird auch Kontingenztafel genannt
  • Beide Merkmale liegen nominalskaliert vor
  • Verteilung lässt sich in Form einer sogenannten Kreuztabelle darstellen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Beispiel einer Vierfeldertafel Geschlecht x Raucherstatus (Schaubild)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist das Großbuchstabe Sigma?

A

Ein Summenzeichen (Σ)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was wird in einer Kreuztabelle noch angegeben?

A
  • Randsummen bzw. Randhäufigkeiten

> Daraus lässt sich die Häufigkeit einer Merkmalsausprägung ablesen

25
Q

Was muss bei Zusammenhängen in Vierfeldertafeln beachtet werden?

A
  • Je Stärker die Häufungen in einzelnen Zellen, desto stärker ist der Zusammenhang
  • Ein Zusammenhang bedeutet, dass eine Ausprägung des einen Merkmals besonders oft mit (nur) einer Ausprägung des anderen Merkmals auftritt
26
Q

Wozu wird eine Vierfeldertafel benötigt?

A
  • Es lässt sich grob abschätzen, wie die beiden Merkmale miteinander variieren
27
Q

Was wäre ein perfekter Zusammenhang auf der Vierfeldertafel?

A
  • Häufigkeiten größer 0 sind nur auf einer Diagonalen zu finden (siehe Schaubild)
28
Q

Beispiele für abschätzbare Zusammenhänge in Vierfeldertafeln (Schaubild)

A
29
Q

Was muss bei Kreuztabellen beachtet werden?

A
  • Könnten beliebig viele Zeilen und Spalten aufweisen
  • die sinnhafte Interpretation ist bei sehr großen Tabellen aber schwierig

> Deshab sollte die Anzahl an Ausprägungen reduziert werden

> Oder mehrere Kategorien thematisch zusammenfassen

30
Q

Zur Berechnung des Zusammenhangs wird oft der sogenannte …

A

… Phi-Koeffizient (Φ) berechnet

> Phi ist umso größer, je mehr Werte sich nur auf einer Diagonalen befinden

> Bei Zusammenhang zweier dichotomer, nominalskalierter Merkmale

31
Q

Beispielrechnung des Phi-Koeffizienten (Schaubild)

A
32
Q

Der Phi-Koeffizient ist nur ein Spezialfall des …

A

… sogenannten Cramer’s V

33
Q

Wann werden Korrelationskoeffizienten zur Beschreibung der Zusammenhänge berechnet?

A

Wenn die Daten mindestens auf Ordinalskalenniveau vorliegen

34
Q

Für die Berechnung der Rangkorrelation müssen die Merkmale mindestens …

A

… ordinalskaliert sein (nach Spearman)

35
Q

Für die Berechnung der Produkt-Moment-Korrelation müssen die Daten …

A

… intervallskaliert sein (nach Pearson)

36
Q

Merkmale der Spearman-Korrelation

A
  • Liegen die Daten nur ordinal vor, können die Abstände zwischen den Werten nicht berechnet werden
  • Für jedes Merkmal wird stattdessen separat die Reihenfolge jedes Wertes bestimmt

> Je mehr die Ränge der beiden Merkmale pro Versuchsteilnehmer übereinstimmen, desto stärker ist die Korrelation

> Je größer jedoch die Summe der Rangabweichungen im Verhältnis zur Stichprobengröße ausfällt, desto kleiner ist der Zusammenhang zwischen den Merkmalen

37
Q

Warum ist das Ergebnis der Spearman-Korrelation robust/invariant?

A
  • Weil nur die Ränge für die Berechnung der Korrelation herangezogen werden
38
Q

Berechnungsbeispiel Spearman-Korrelation (Schaubild)

A
39
Q

Merkmale der Pearson-Korrelation

A
  • Beide Merkmale sind intervallskaliert
  • Die Abstände lassen sich berechnen
  • Es können mehrere Informationen für die Berechnung des Zusammenhangs verwendet werden
40
Q

Was heißt Kovarianz?

A
  • Durchschnittliche Abweichung eines Wertpaares von den Mittelwerten der beiden Merkmale
41
Q

Berechnungsidee der Kovarianz (Schaubild)

A
  • Je mehr Fläche es von nur einer Farbe gibt, desto größer wird der Betrag der Kovarianz
  • Kovarianz ist nicht auf den Wertebereich -1 +1 beschränkt
42
Q

Was ist ein Betrag?

A
  • Auch absoluter Wert genannt
  • Das Vorzeichen des Wertes wird ignoriert
43
Q

Warum ist die Kovarianz nicht standardisiert?

A
  • Weil nur die Lagemaße der Merkmale berücksichtigt werden
  • Nicht die Streuungsmaße
44
Q

Wird die Kovarianz durch die Streuungen der Merkmale geteilt, erhält man …

A

… den Pearson-Korrelationskoeeffizienten

45
Q

Berechnungbeispiel für eine Pearson Korrelation

A
46
Q

Berechnung Kovarianz und Pearson-Korrelation

A
47
Q

Liegen die Daten bei der Pearson-Korrelation schon z-Standardisiert vor, vereinfacht sich die Formel wie folgt:

A
  • Die alternative Bestimmung aus den z-Werten führt zum selben Ergebnis
48
Q

Wann ist Cohens Konvention anzuwenden?

A
  • Bei unbekannten Forschungsgebieten, wo noch keine empirische Datenlage besteht

> Hiermit wird die Stärke eines Effektes auf die praktische Bedeutsamkeit zu schließen

> Effekte werden in klein (r = 0,10), mittel (r = 0,30) und groß (r = 0,50) unterteilt

49
Q

Streudiagramme bivariater Verteilungen mit den Korrelationskoeffizienten gemäß der Konvention von Cohen

A
50
Q

Was ist der Determinationskoeffizient?

A
  • Weitere Möglichkeit zur Beurteilung der Güte eines Zusammenhangs
  • Erhält man durch das Quadrieren des Korrelationskoeffizienten
  • Der Wert als prozentuale Variationsaufklärung ( 0-100%)
51
Q

Was ist die Lineare Regression?

A
  • Anhand einer vorliegenden Stichprobe wird eine Gerade/Geradengleichung berechnet
  • Eine unbekannte Ausprägung eines Merkmals mithilfe eines bekannten anderen Merkmals vorhersagen
  • Oft bei Einstellungstests, Versicherungen
  • Allgemeine Aussagen treffen, die die absolute Veränderung des einen Merkmals auf die zu erwartende Veränderung des anderen Merkmals abbildet
  • Unabhängige Variable = Prädikator
  • Abhängige Variable = Kriterium
  • z.B. ein IQ-Punkt mehr führt zu 500€ mehr Jahreseinkommen
52
Q

Bei einer perfekten Korrelation würden alle …

A

… Punkte auf einer Geraden liegen

  • Abweichung jedes y-Wertes vom Mittelwert würde als sogenannte Regressionsgerade erklärt werden
  • Bei einer “nicht perfekten” Korrelation weichen die Punkte von der Regressionsgeraden ab
53
Q

Beispiele einer Vorhersage mittels Regressionsgleichung (Schaubild)

A
54
Q

Regressionsbeispiel anhand der fiktiven Korrelation zwischen Alter und Reaktionszeit (Schaubild)

A
55
Q

Phi-Koeffizient Zusammenhänge

A
  • Bei einem perfekten Zusammenhang liegen die Häufigkeiten in der Tabelle auf den Diagonalen
  • In den anderen Feldern sind sie gleich 0.

> Die Richtung der Diagonale zeigt, ob der Zusammenhang als positiv oder negativ bezeichnet wird.

56
Q

Was ist der Determinationskoeffizient?

A

Das Quadrat der Pearson Korrelation

Wie viel Prozent der Variation von X werden durch die Variation von Y erklärt

57
Q

Wann Spearman Korrelation anwenden?

A

die Spearman-Korrelation zeigt den Grad der Monotonie, d. h. ob z.B. mit wachsendem Einstellungsalter das Anfangsgehalt (nicht unbedingt linear) zunimmt

z.B. gibt er an, ob eine höhere Leistung mit einer besseren Bewertung des Dozenten einhergeht oder umgekehrt oder kein monotoner Zusammenhang erkennbar ist

58
Q

Wann die Pearson Korrelation?

A

Die Pearson-Korrelation gibt eine Information über die Stärke des linearen Zusammenhangs an

59
Q

Wann Phi-Koeffizienten nutzen?

A

Dieser gibt an, ob beide Merkmale miteinander zusammenhängen (d. h. eher die Frauen rauchen oder eher die Männer rauchen) oder kein Zusammenhang zwischen Geschlecht und Rauchverhalten erkennbar ist.