Chi-Quadrat-Test Flashcards
Wozu wendet man den χ2-Test an?
Zur Analyse nominalskalierter Variablen.
Er ermöglicht es, Hypothesen über die Häufigkeit oder Merkmalskombinationen in der Population zu prüfen.
Welche ist die grundlegende Idee des χ2-Tests?
Die in der Stichprobe beobachteten Häufigkeiten mit den erwarteten Häufigkeiten zu vergleichen
Welche Diskrepanz wird durch den χ2-Wert ausgedrückt?
Die Diskrepanz zwischen beobachteten und erwarteten Häufigkeiten wird durch den χ2-Wert ausgedrückt
Wie wird der χ2- Wert berechnet?
Indem zunächst die Differenzen zwischen beobachteten und erwarteten Häufigkeiten quadriert und durch die erwarteten Häufigkeiten dividiert werden.
Die Ergebnisse dieser Berechnungen werden dann über alle Merkmalsausprägungen oder Merkmalskombinationen aufaddiert.
Was bestimmt die Form einer χ2-Verteilung?

Die Anzahl der Freiheitsgrade
Welche Schritte bilden den χ2-Test?
(7 Schritte)
Tipp: † Hyperloop Expectation >5 Formula π approve/deny
- Daten in einer Kreuztabelle anordnen
- Hypothesen formulieren: H0 und H1
Nullhypothese geht für gewöhnlich von Unabhängigkeit aus - Erwartungswert berechnen (“Angenommen, H0 stimmt…”
- Jeder Erwartungswert muss ≥5 sein
- χ2-Statistik erstellen: Für jede Zelle:
(WertBeob.– WertErwar.)2 ÷ WertErwar. = ? - In Tabelle nachschauen und p-Wert bestimmen
- Wenn p kleiner als alpha (0.05) ist:
H0 wird abgelehnt ⇒ Abhängigkeit der Variablen
Welcher R-Befehl ist praktisch, um einen χ2-Test direkt in einer Kreuztabelle auszugeben?
Paket: gmodels
CrossTable(variable1, variable2, chisq=T)
Welches Maß misst in standardisierter Form die Unterschiede zwischen beobachteten und vermuteten Häufigkeiten?
Das Maß w
Was ist ein Vorteil der Effektgröße w im Vergleich zu χ2?
Durch w können auch verschieden große Stichproben miteinander verglichen werden, weil w unabhängig von der Stichprobengröße ist.
Wie lässt sich w durch Cohens Konventionen (1988) interpretieren?

Wie unterscheidet sich die Formel von w von der des χ2-Tests?
Geringfügig.
Statt der absoluten beobachteten und erwarteten Häufigkeiten werden relative Häufigkeiten (Anteile) verwendet.

Wenn χ2 bereits vorliegt, wie lautet dann die Formel für w ?

Wovon hängt beim χ2-Test die Power ab?
- Signifikanzkriterium α
- Stichprobengröße
- Effektgröße in Population
- (Freiheitsgrade: Anzahl Merkmalsausprägungen – 1 )
Wie würde man bei einer a-priori-Poweranalyse die Frage formulieren?
Wie viele Teilnehmende werden gebraucht um eine bestimmte Power von mindestens x % zu erreichen?
Wie würde man die Fragestellung für eine Post-hoc-Poweranalyse beim χ2-Test formulieren?
Wie groß war die Wahrscheinlichkeit ein signifikantes Ergebnis zu erhalten?
Welche Häufigkeiten vergleicht man beim χ2-Test?
Die jeweils beobachteten Häufigkeiten mit den jeweils erwarteten Häufigkeiten
Wofür nutzt man den χ2-Test für zwei Variablen fast immer?
Um zu bestimmen, ob ein Zusammenhang zwischen zwei untersuchten Merkmalen besteht
Welche beiden Formen des χ2-Tests kennen wir?
- χ2-Test für eine Variable (Anpassungstest)
- χ2-Test für zwei Variablen (Test auf Unabhängigkeit)
Wie nennt man den χ2-Test für eine Variable noch und was wird darin untersucht?
Anpassungstest
Weicht die in der Stichprobe beobachtete Häufigkeitsverteilung von der in der Population vermuteten Häufigkeitsverteilung signifikant ab?
Häufige Annahme: Populationshäufigkeiten gleichverteilt
Wann wendet man den χ2-Test für zwei Variablen an?
Wenn in einer Stichprobe von Teilnehmern zwei nominalskalierte Merkmale erhoben werden.
Welche Frage stellt man sich bei der Anwendung des χ2-Tests für zwei Variablen?
Unterscheiden sich die beobachteten Häufigkeiten der Kombinationen signifikant von den erwarteten kombinierten Häufigkeiten?
Wie berechnet sich in m χ2-Test für zwei Variablen die erwartete Häufigkeit?

Wie berechnet sich im χ2-Test für zwei Variablen der χ2-Wert?
Abweichungen zwischen b und e in jeder Zelle werden quadriert und durch e geteilt.
→ 2 Summenzeichen, weil Zellen aller Spalten UND Zeilen der Kreuztabelle eine Rolle spielen!

Wie errechnen sich im χ2-Test für zwei Variablen die Freiheitsgrade?
(k und m = Anzahl Ausprägungen der beiden Merkmale (Variablen))

Welche Effektgrößen gibt es für den χ2-Test für zwei Variablen?
- Phi-Koeffizient
- Cramer’s Phi
- w
Wie kann man den Phi-Koeffizienten beim χ2-Test für zwei Variablen berechnen?
Wann kommt dieser zum Einsatz?
Bei der Untersuchung zweier dichotomer Variablen

Was unterscheidet Cramers Phi vom regulären Phi-Koeffizienten beim χ2-Test für zwei Variablen?
Die Formel ist vielseitiger anwendbar und am gebräuchlichsten von allen Effektgrößen in dieser Kategorie.
Im Nenner wird mit der kleineren Anzahl der Freiheitsgrade multipliziert.
Abhängig davon, welche Variable weniger hat, wird ihr Wert hierfür genommen.

Wo braucht man dfkleiner und wie lässt es sich berechnen?
Das kleinere der beiden Ergebnisse ist dfkleiner

Wie lässt sich Cramers Phi im Vergleich zum regulären Phi interpretieren?
- Werte liegen wie bei Phi zwischen 0 und 1
- Je größer dfkleiner, desto geringer Cramers Phi, deshalb ist es nicht möglich Cramers Phi exakt wie Phi zu interpretieren
- Nur wenn dfkleiner = 1 kann Cramers Phi ebenso wie Phi interpretiert werden
In welchem Fall kann man Cramers Phi genau wie Phi interpretieren?
Wenn dfkleiner genau 1 ist, lässt sich Cramers Phi wie Phi interpretieren.

Wie lässt sich w beim χ2-Test auch mit zwei Variablen am einfachsten berechnen?
PS: Wie heisst der χ2-Test mit einer Variablen?
Genau wie beim χ2-Test mit einer Variablen (Anpassungstest)

Wie kann man Cramers Phi in w einfach umrechnen und wozu nutzt das?
Indem man die Wurzel aus dfkleiner multipliziert.
Hierdurch wird Cramers Phi interpretierbar.

Welche der Effektgrößen brauchen wir, um die Power beim χ2-Test für zwei Variablen berechnen zu können?
w
Liegt etwa Cramers Phi vor, muss erst in w umgerechnet werden.
Als welche Art von Verfahren ist der χ2-Test klassifizierbar?
Als Nonparametrisches Verfahren
Was bedeutet “nonparametrisches Verfahren”?
- Es werden keine Populationsparameter geschätzt
- Die Voraussetzungen sind weniger anspruchsvoll als bei parametrischen Testverfahren
- Verteilungsfrei (Keine spezifische Annahme über Verteilung der Population)
Welche Bedingungen müssen für einen χ2-Test erfüllt werden?
- Jede Person muss eindeutig einer bestimmten Merkmalsausprägung / Merkmalskombination zugeordnet werden können.
- Beobachtungen müssen voneinander unabhängig sein.
- (Umstritten) Es müssen bestimmte minimale erwartete Häufigkeiten gegeben sein, um ein korrektes Testergebnis zu erlangen.
(Normalerweise spricht man von mindestens 5)
Worin unterscheiden sich die χ2-Tests für eine und zwei Variablen?
Nur in ihren Effektgrößen.
Was unterscheidet den χ2-Test vom Binomialtest?
Beim Binomialtest können nur zwei Merkmalsausprägungen (ja/nein) untersucht werden, beim χ2-Test beliebig viele.
Welche Beispiele können wir nennen für den χ2-Test für
- Eine Variable und
- Zwei Variablen?
- Das auftreten einer Merkmalsausprägung in Abhängigkeit einer einzelnen Merkmalsausprägung einer Variable
z. B. Kommt Depression (Klare Ausprägung) in den Kalten Monaten (Jahreszeit: Winter) öfter vor? - Steht der Wohlstand einer Person in Zusammenhang mit dem Geschlecht und der Arbeit?
Welche Frage stellt man sich bei der Durchführung eines χ2-Tests mit einer Variable?
Weicht die in der Stichprobe beobachtete Häufigkeitsverteilung von der in der Population vermuteten Häufigkeitsverteilung signifikant ab?
Wie lassen sich die erwarteten Häufigkeiten bei einem χ2-Test mit einer Variable bestimmen?

Wie lautet die Formel für einen χ2-Test mit einer Variable?

Beschreibe den Vorgang der Berechnung eines χ2-Tests für eine Variable.
- Für jede Merkmalsausprägung wird zunächst die Differenz von b und e berechnet und dann quadriert.
- Division durch erwartete Werte (kommt Standardisierung gleich)
Abweichungen werden entsprechend ihrer Bedeutsamkeit gewichtet und so transformiert, dass sie vergleichbar werden!
* Aber: Chi-Quadrat-Wert bei großen Stichproben höher als bei kleinen, da der Chi^2-Wert von der Größe der Stichprobe abhängt
Was findet man alles in einer ANOVA-Tabelle?

Wann wird χ2 null und wann groß?
Erwartete und Beobachtete Werte stehen im Verhältnis zueinander, daher:
- Je ähnlicher b und e sind, desto näher ist χ2 an Null
- Je unterschiedlicher die Werte sind, desto größer wird χ2
Wie berechnen wir beim χ2-Test für eine Variable die Freiheitsgrade?
wobei k die Anzahl der Merkmalsausprägungen ist.
