Sitzung 8: Zweidimensionale Häugkeitsverteilungen und Zusammenhangsmaße I Flashcards
A) Wofür steht die erste Position in einer Kontingenztabelle?
B) Wofür steht die zweite Position in einer Kontingenztabelle?
A) steht für das X (Zeile)
B) steht für das Y (Spalten)
Kontingenztabelle:
A) k
B) m
A) Zeilenanzahl
B) Spaltenanzahl
Was gibt die Prozentsatzdifferenz d% an?
Die Differenz zwischen zwei Prozentsätzen (zwei bedingte relative Häufigkeiten)
Dichotom
Unterteilung in 2 Teile
Achtung! Prozentsatzdifferenz:
Die Spalten und Zeilen können ………… werden. Die Werte und die Interpretationen für die Prozentsatzdierenz ändern sich entsprechend.
Vertauscht
Was ist Yules Q?
Eine Maßzahl, die für dichotom Merkmale (2x2 Tabellen) geeignet ist
Yules Q:
A) Konkordantes Paar
B) diskonkordantes Paar
A) Bei einem konkordanten Paar ist X1 und Y1 oder X2 und Y2 gleichzeitig vorhanden. (→ a und d)
B) Bei einem diskonkordanten Paar liegen die Kombinationen X1 und Y2 oderX2 undY1 vor.(→bundc)
Was ist der Phi-Koeffizient?
Weitere Maßzahl for 2x2 Tabellen
Muss der Phi-Koeffizienten standardisiert Werden?
Ja, weil er nicht auf einen bestimmten Wertebereich festgelegt ist.
Wie standardisiert man den Phi-Koeffizienten?
Über den Maximalen Wert - wie kommt man auf diesen?
1. Die am schwächsten besetzte Zelle auf 0 setzen
2. Die anderen 3 Zellen so abändern, dass die Randhäufigkeiten gleich bleiben (an diesen darf sich nichts ändern!)
3. Den standardisierten Phi über die abgeänderte Tabelle berechnen
Auf welchen Wertebereich ist der korrigierte Phi-Koeffizient standardisiert?
-1 bis +1
Was ist das Chi-Quadrat?
Testet, inwiefern Zellen in Kreuztabellen überzufällig stark besetzt sind.
Sind also mehr Werte in den Zellen vorhanden, als man zufällig erwarten würde?
Aus Chi lassen sich eine Reihe anderer Zusammenhangsmaße berechnen.
Berechnung über Indifferenztabelle
Ist Chi-Quadrat ein Zusammenhangsmaß?
Nein, da es nicht standardisiert ist
Welche anderen Zusammenhangsmaße lassen sich über Chi berechnen?
φ, Cramers V, Tschuprows T, Kontingenzkoezient C
Chi:
A) feij
B) fbij
A) erwartete Zellhäufigkeit
B) beobachtete Zellhäufigkeit
Das Chi-Quadrat ist nicht gut interpretierbar, da keine Information über zum Beispiel das ….. = es muss noch …… werden.
Maximum
Standardisiert
Was sind Cramers V und Tschuprows T und der Kontingenzkoeffizient C?
Standardisierungen für Chi
A) Wann verwendet man Tschuprows T?
B) Wann verwendet man Cramers V?
A) bei asymmetrischer Tabelle
B) bei symmetrischer Tabelle
Was muss man beim Kontingenzkoeffizienten C beachten?
Die Obergrenze dessen ist unterhalb von C, deshalb muss man ihn nochmal standardisieren
PRE
Proportional Reduction of Error
Was geben PRE Maßen an?
geben an um wieviel man den Fehler bei der Schätzung der abhängigen Variable reduzieren kann, wenn man Kenntnis von der unabhängigen Variable hat.
A) Wann berechnet man das Spalten-Lambda?
B) Wann berechnet man das Zeilen-Lambda?
A) wenn die Spaltenvariable die abhängige Variable ist
B) Wenn die Zeilenvariable die abhängige Variable ist
Interpretation d%
Der Prozentsatz von „Spalten“, die zu „Zeile a/b“ führen, ist unter „Spalte a/c“ … Prozentpunkte höher/tiefer als unter „Spalte b/d“.
Wie kann man testen, ob 2 Variablen abhängig oder unabhängig sind?
Sind unabhängig, wenn gilt:
Nij = (ni. * n.j) / n