Bivariate Deskriptive Statistik Flashcards
Korrelation bedeutet einfach:
ein Zusammenhang zwischen zwei Variablen
Welche Muster können sich bei Korrelations-Daten ergeben?
- lineare Zusammenhänge 2. kurvilineare Zusammenhänge
Wenn ein Dotplot eine Art Wolke von Testwerten auswirft, bedeutet das…
kein Zusammenhang / keine Korrelation
Es gibt zwei Arten der Korrelation
- positive Korrelation 2. negative Korrelation
Wann kann man einen Messwert “hoch” nennen?
Wenn er größer ist als der Mittelwert der Variable
Welche sind die drei ersten Schritte bei der Berechnung des Produkt-Moment-Korrelationskoeffizienten?
- Abweichung vom Mittelwert bei jedem einzelnen Wert (xi – x<span>mittel</span> ) und (yi – ymittel )
- Bildung des Kreuzprodukts aus beiden Abweichungen
- Summe aller Kreuzprodukte bilden
Das Kreuzprodukt wird gebildet, indem man die Abweichungen miteinander multipliziert.
Wie wird die Summe aller Kreuzprodukte (Schritt drei) genannt?
Und wer hat es entwickelt?
Produkt-Moment
Entwickelt durch Karl Pearson und Francis Galton
(Daher auch: Pearson-Korrelationskoeffizient)
Angenommen, das Produkt-Moment (Summe aller Kreuzprodukte) ergibt in etwa null, was bedeutet das für die Korrelation?
Kein Zusammenhang
Wenn man das Produkt-Moment durch die Anzahl n aller Merkmalsträger teilt, bekommt man das durchschnittliche Kreuzprodukt.
Wie nennt man dieses noch?
Kovarianz
cov(x,y)
cov( x, y ) = 1/n ⋅ ∑ (xi −xmittel) ⋅ (yi −ymittel)
Warum ist die Kovarianz als Zusammenhangsmaß noch nicht gut geeignet?
Weil sie von den Maßeinheiten abhängig ist
Die lineare Veränderung einer Einheit kann die Kovarianz beeinflussen. Was kann man daher über die Kovarianz aussagen?
Die Kovarianz ist nicht invariant gegenüber linearen Transformationen der Variablen
Wie erreicht man, dass die Kovarianz als geeignetes Maß zur Korrelation verwendet werden kann?
Man teilt sie durch das
Produkt beider Standardabweichungen
Wodurch ist gegeben, dass der Produkt-Moment-Korrelationskoeffizient nicht durch gewählte Einheiten, Größen, etc. beeinflussbar ist?
Die Kovarianz wird durch das Produkt beider Standardabweichungen geteilt.
Dies führt dazu, dass jeweils Zähler und Nenner proportional zueinander sind und alle Veränderungen sich herauskürzen lassen
Der Korrelationskoeffizient hängt somit nur von der Stärke des linearen Zusammenhangs ab
Der Korrelationskoeffizient ist gegenüber linearer Veränderungen stabil. Welches Fachwort gibt es dafür?
gegen linearer Veränderungen invariant
Ab welchem Korrelationswert gilt ein Zusammenhang als stark?
Nach Cohen (1988)
r | ≈ 0,1 : schwacher Zusammenhang
| r | ≈ 0,3 : mittlerer Zusammenhang
| r | ≈ 0,5 : starker Zusammenhang
Welchen Zweck haben z-Werte?
Zwei unterschiedliche Variablen miteinander vergleichbar zu machen
Was bedeutet ein negativer z-Wert?
Der Wert liegt unter dem Mittelwert / Durchschnitt
was bedeutet ein z-Wert von genau 0?
Der Wert entspricht genau dem Mittelwert
Was bedeutet ein z-Wert von +1,5?
Der Wert liegt genau 1,5 Standardabweichungen über dem Mittelwert
Wie lässt sich die Formel umstellen, sodass man ihn mithilfe der z-Werte errechnen kann?
Der z-Wert entspricht schon Teilen der Formel für r :
- z*x = (x - xmittel) ÷ sx
- z<span>y</span>* = (y - ymittel) ÷ s<span>y</span>
Der Korrelationskoeffizient entspricht dem durchschnittlichen Kreuzprodukt (bzw. der Kovarianz) der z-Werte.
Was wird im allgemeinen durch den z-Wert bestimmt?
In welchem Ausmaß Personen auf zwei Variablen die gleiche relative Position einnehmen.
Bei einem perfekten Zusammenhang nimmt Variable X die exakt gleicherelative Position wie Variable Y ein
“Rezept” für einen Produkt-Moment-Korrelationskoeffizienten mit z-Werten
- Mittelwerte von x und y bilden
- Standardabweichung von x und y bilden
- z-Werte jeder Person für beide Variablen
- Kreuzprodukt beider z-Werte für jede Person
- Mittelwert bilden
(Summe aller Kreuzprodukte durch Anzahl aller Personen teilen)
z-Wert bilden: (x-xmittel) ÷ sx
Welches Problem könnte es mit sich bringen, dass viele Studien an Universitäten durchgeführt werden?
Die Testteilnehmer sind häufig beinahe ausschließlich Studierende und die meisten anderen Bevölkerungsgruppen fließen gar nicht erst in die Studie ein
Bedeutet Korrelation auch automatisch Kausalität?
Nein.
Mathematikkenntnisse korrelieren mit der Körpergröße, sind aber nicht in kausalem Zusammenhang
Was gibt die Partialkorrelation an?
wie stark die Korrelation zwischen zwei Variablen ohne den Einfluss einer bestimmten Drittvariable ausgeprägt wäre.
Wie lautet die Formel für die Partialkorrelation?
siehe Bild
Was ist ein Dichotomes Merkmal?
Ein Merkmal, das nur zwei Ausprägungen annehmen kann
In welches Skalenniveau fallen dichotome Variablen?
sie sind ein Spezialfall von nominalskalierten Variablen.
Da es gleiche Abstände zwischen Merkmalsausprägungen und Messwerten gibt, ist aber die Voraussetzung für eine Intervallskalierte Variable gegeben.
Dadurch lässt sich mit dichotomen Variablen ein Produkt-Moment-Korrelationskoeffizient bilden
Wie kann man am einfachsten Korrelation bei einer dichotomen Variable berechnen?
Mit dem Phi-Koeffizienten
Oder (wesentlich komplizierter) durch den Produkt-Moment-Koeffizienten
Welchen ersten Schritt muss man machen, um den Phi-Koeffizienten berechnen zu können?
Vierfeldertafel anlegen
Formel für den Phi-Koeffizienten
(a · d - b · c) ÷ √(Kreuzprodukt)
Bei zwei ordinalskalierten Variablen kann man welchen Weg wählen, um die Korrelation zu bestimmen?
Kendalls Tau
Gleiche Abstände zwischen verschiedenen Rangplätzen bringen nicht unbedingt gleiche Unterschiede.
Um welches Skalenniveau geht es?
Ordinalskalenniveau
Erster, Zweiter, Dritter…
Nachdem man die ordinalskalierten Messwerte nach Rangfolge angeordnet hat, welchen nächsten Schritt braucht es, um Kendalls Tau zu berechnen?
Wir vergleichen die Messwerte und stellen fest, wo sich die Testpersonen einig sind:
Proversionen
und wo sie gegenteiliger Ansicht sind:
Inversionen
Dies wird für alle Testobjekte weitergeführt
Wofür steht in der Formel für Kendalls Tau das S ?
Die Differenz zwischen den Proversionen und Inversionen:
S = P - I
Formel Kendalls Tau
Regressionsrechnung
Auf der Grundlage von Korrelationen die bestmögliche Vorhersage für eine Variable bestimmen
Warum kann man Korrelation und Regression als zwei Seiten der selben Medaille ansehen?
Je stärker der Zusammenhang, umso präziser wird sich eine Variable aus der Kenntnis der anderen Variablen vorhersagen lassen
(und umgekehrt bei kaum Zusammenhang: kaum Vorhersage möglich)
Wozu dienen Prädiktor und Kriterium?
PrädiXtor: Für Vorhersage genutzte Variable
KrYterium: Vorhergesagte Variable
(Durch und X und Y abgekürzt)
Was sagt in der Regressionsrechnung was voraus?
X sagt Y voraus
(Prädiktor, Kriterium)