D: Mehrdimensionale Daten Flashcards
<p>Welchen Laufindex haben die realisierten Ausprägungen bzgl X und Y ?</p>
<p>X: a1 - ak
Y: b1 - bl</p>
Was beschreiben die absoluten simultanen Häufigkeiten?
h( ai,bj ) =: h ij
Die Häufigkeiten innerhalb der Kreuztabelle
X wird spaltenweise und Y zeilenweise in der Kreuztabelle eingetragen!
Falsch!
X gehört in die Zeilen, Y in die Spalten
Wie werden die absoluten Randverteilungen von X benannt?
von X : h1. h2. h3. …. hk.
von Y : h.1 h.2 h.3 … h.l
Wie stellen wir die absoluten simultanen Häufigkeiten grafisch dar?
Gar nicht, es ist zu schwer.
Theoretisch: kleine Hochhäuser ( 3dimensional)
Gibt es absolute Häufigkeitsverteilungen nur für kardinal skalierte Merkmale?
Nein, für alle Skalierungen! auch nominal ( männlich, weiblich)
Relative bedingte Häufigkeiten geben Quoten ab.
Ja!
Bsp: Die Häufigkeit von dem Merkmal a1 unter der Bedingung b1.
fx ( a1 / b1 ) = hij / h.j
Dabei ist die Basis b1 immer der Bezug.
Wieviele bedingte rel. Häufigkeiten gibt es bei 10 X- Merkmalen und 3 Y-Merkmalen?
i = 10 j = 3
i*j = 30
Wie kann ich die Unabhängigkeit von 2 Merkmalen berechnen?
Sind alle Häufigkeiten einer Spalte ( Y) oder einer Zeile (X) gleichgroß, sind sie unabhängig vom anderen Merkmal.
Deshalb gilt bei Unabhängigkeit:
die erwartete Besetzungszahl gleicht der eingetretenen Häufigkeit:
˜h ij = hij –> Unabhängigkeit
wobei ˜h = rand* rand / n
Wie berechne ich ˜hij ?
rand * rand / n
Chi-Quadrat ist die Summe von ( Abweichung des realen Werts von den erwarteten Werten) / erwarteten Wert aller Felder innerhalb der Kontingenztafel.
Richtig:
X2 = Summe Summe ( hij - ˜hij) / ˜hij
Dabei geht X2 von 0 bis unendlich.
K* = 0 bedeutet, dass die Merkmale unabhängig sind.
Richtig! Der erwartete imaginäre Wert gleicht dem reelen Wert, sodass X2 = 0 und K = 0 und so K* = 0.
K* = 1 bedeutet hingegen Abhängigkeit