Statistik 2 Flashcards
1)Klären sie den Unterschied zwischen apriori- und aposteriori- Wahrscheinlichkeit.
Apriori: bedeutet im Vorhinein
Dabei kommt ein erwartbarer wert raus
Der Wahrscheinlichkeitswert wird mit allgemeinem Vorwissen gewonnen
—> LA PLACE (jedes Ereignis hat die gleiche Chance)
Aposteriori: bedeutet im Nachhinein
Dabei handelt es sich um einen Wert der den Wissensstand ü. einen unbekannten Umweltzustand nach der Beobachtung einer Zufallsgröße X darstellt.
—> LIMES (ein Wert nähert sich etwas an/gegen unendlich ist es gleich verteilt
2)Wie kann eine Beziehung zwischen relativen Häufigkeiten und Wahrscheinlichkeiten hergestellt werden?
Die relative Häufigkeit nähert sich mit häufiger Versuchsdurchführung der Wahrscheinlichkeit
P(A)=lim (fA/n)
3a)Begriffsklärung
ZUFALLSVARIABLE
Eine Größe, deren Wert vom Zufall abhängig ist
Beispiel: Glücksspiel
-> unendlich viele Ausprägungen
3b) Begriffsklärung
DISKRETE ZUFALLSVARIABLE
Eine Größe, deren Wert vom Zufall abhängig ist, die aber keine Zwischenwerte annehmen kann.
Z.B Augenzahl beim Würfel
-> endlich viele mögliche Ausprägungen
3c) Begriffsklärung
Kennwerte der Stichprobe
Maßzahlen die für die Grundgesamtheit berechnet werden./ Beschreibung von Eigenschaften der Stichprobe
z.B arith. Mittel, Median, Streuungsmaße
3d)Begriffsklärung
WAHRSCHEINLICHKEITSVERTEILUNG
Die Zuordnung von den Wahrscheinlichkeiten und ihren jeweiligen Ereignissen. Für jedes Ereignis (alle möglichen Ausgänge) wird die Wahrscheinlichkeit niedergeschrieben. Daraus kann z.B. ein Graf, eine Tabelle oder ein Balkendiagrammm entstehen.
-> lassen sich durch Erwartungswert/ Varianz beschreiben
3e) Begriffserklärung
KENNWERTEVERTEILUNG
Sie zeigt auf wie die Eigenschaften/Kennworte innerhalb einer Stichprobe verteilt sind.
Sie stellt eine Brücke zwischen Stichprobe und Grundgesamtheit dar => Gesamtheit aller Stichprobenwerte bildet die Kennwerteverteilung
Z.B Mittelwert von 4 Stichproben
5) Klären sie die Begriffe, Erwartungswert und Varianz einer Zufallsvariable.
Erwartungswert = Mittelwert der Zufallsvariable (n * π)
Varianz = durchschnittliche quadrierte Abweichung vom Mittelwert der Zufallsvariable
7a) Welcher Typ von Zufallsexperimenten kann durch Binomialverteilungen analysiert werden?
Binomialverteilungen werden vor allem bei Verteilungen genutzt, bei denen die Bedingungen gleich bleiben, also meist bei dichotomisierten Zufallsexperimenten mit Zurücklegen
7b) Erläutern sie die Parameter der Binomialverteilungen, wie wirken sich diese auf die Gestalt der Verteilung aus?
N= Größe der Stichprobe (beeinflusst Zahl der Säulen)
π= Anteilswert der Zufallsvariablen (beeinflusst die Höhe)
7c) Was unterscheidet die Binomial- von der HYpergeometrischen Verteilung?
Binomial: Zufallsexperimenten mit zurücklegen
Hypergeometrisch: Zufallsexperimenten ohne zurücklegen
7d) In welchen Fällen ist es erforderlich mit der hypergeometrischen Verteilung zu arbeiten?
Wenn dichotome Fälle ohne zurücklegen gewählt werden
- drei Parameter: Größe der GG, Größe der Stichprobe, Zahl der günstigen Fälle in GG
7e) UNter welcher Bedingung kann die Berechnung nach der hypergeometrischen Verteilung durch die Werte der Binomialverteilungen ersetzt werden?
Bei N/n> 20 darf die Binomialverteilungen statt die hypergeometrischen Verteilung genutzt werden, obwohl nicht zurück gelegt wird
N= Größe der Grundgesamtheit
N= Größe der Stichprobe
8a&b)Wo liegt der Unterschied zwischen stetigen und diskreten Zufallsvariablen? Geben sie Beispiele.
A) diskret = keine Zwischenwerte, Darstellung als Wahrscheinlichkeitsfunktion
Stetig = unendlich viele Zwischenwerte möglich, Darstellung als Dichtefunktion/Verteilungsfunktion
B) Diskret = Geschlecht eines Babys, Münzwurf, Sonntagsfrage
Stetig = Größe, Geschwindigkeit
8c) Darstellung der Wahrscheinlichkeitsverteilungen
diskret: Wahrscheinlichkeit als Höhe der Säulen, Gesamtwert von 1 als Summe der Höhe der Säulen
stetig: Wahrscheinlichkeit als Fläche unterhalb der Dichtefunktion, Gesamtwert von 1 als Gesamtfläche unter der Kurve
9a&b)
Klären sie, welche Informationen der Dichte- bzw. Der Verteilungsfunktion einer zufallsvariable zu entnehmen sind.
In welchem Verhältnis stehen Dichte- bzw. der Verteilungsfunktion?
> Einer Dichtefunktion kann der Mittelwert und die Standardabweichung entnommen werden
Eine Verteilungsfunktion gibt Aufschluss über den Anteilswert der jeweiligen Ereignisse
> Verteilungsfunktionen geben die kumulative Häufigkeit der Ereignisse (welche in der Dichtefunktion darstellbar sind) bis 100% dar
-> mathematisch gesehen ist die Verteilungsfunktion das Integral der Dichtefunktion
10a) Geben sie in eigenen Worten den zentralen Grenzwertsatz wieder
Wenn die Menge der gemessenen Ereignisse gegen unendlich geht, wird jede Dichtefunktion (annähernd) normalverteilt
10b) Warum sind bestimmte Phänomene (die Ergebnisse des Nagelbrett-Experiments, Körpergröße, näherungsweise Einkommen) normalverteilt? Beziehen sie sich dabei auf den zentralen Grenzwertsatz.
Sie sind normalverteilt, weil Ausläufer zunehmend von der Masse der Unendlichkeit verschluckt werden und sich ein Mittelwert ausprägt
10c) Was besagt der zentrale Grenzwertsatzüber die Verteilung von Stichprobenmittelwerten?
Die Verteilung wird annähernd normalverteilt, wenn eine gegen unendlich gehende Menge an Stichprobenmittelwerten in ihr dargestellt wird. Diese hat dann jedoch eine geringere Standardabweichung
=> DENN: bei den jeweiligen Stichproben werden durch das Ermitteln eines Mittelwertes bereits die extremen Ausläufer eingerechnet und fallen somit weniger ins Gewicht der Kennwerteverteilung
11a) Von welchen Parametern hängt die Gestalt der Normalverteilung ab?
Mittelwert —> Verschiebung der x-Achse
Standardabweichung —> steiler (erhöhen) flacher (verringern)
12a) Welche Parameter hat die Standardnormalverteilung?
Parameter 0 & 1
0= Mittelwert 1= Standardabweichung
12b) Was versteht man unter z-Transformation
Durch die z-Transformation wird jede Normalverteilung zu einer Standardnormalverteilung
Die variable wird standardisiert indem von einem Messwert der Mittelwert abgezogen wird & dies dann dividiert durch die Standardabweichung
14a) Stellen sie das Grundkonzept von Punkt- und Intervallschätzung dar.
Punktschätzung:
Schätzung von genau einem Wert/Schätzung eines Parameters in der GG aufgrund von Stichprobenkennwerten (Schätzer)/keine Angaben über Genauigkeit (Bsp: Einkommen)
Intervallschätzung:
Mit einer vorgegebenen Wahrscheinlichkeit liegt ein Parameter in dem zu schätzenden Intervall /
Angabe eines Konfidenzintervalls
14b) Wozu sind Intervallschätzungen erforderlich?
Berechnung der Signifikanz einer Hypothese
Wenn: berechneter Wert außerhalb des Signifikanzniveaus
—> Verwerfen der Hypothese
Berechnung des Risikos einer Fehleinschätzung
15)Welche Informationen müssen vorliegen um Intervallschätzungen vornehmen zu können?
S
Klären sie folgende Begriffe:
Kennwerteverteilung
Eine Art von Wahrscheinlichkeitsverteilung
Die Verteilung, die die Kennwerte einer Stichprobe beinhaltet
Brücke zwischen GG und Stichprobe
Klären sie folgende Begriffe:
Standardfehler
Streeungsmaß für eine Schätzfunktion für einen unbekannten Parameter der GG. Wie weit der Mittelwert der Stichprobe vom tatsächlichen Mittelwert durchschnittlich abweicht.
—> Standardabweichung der Kennwerteverteilung
Klären sie folgende Begriffe:
Stichprobenparameter/Populationsmerkmal
Stichprobenparameter: entsprechendes Merkmal der Stichprobe/Parameter einer Stichprobe
Populationsmerkmal: betreffendes Merkmal der GG
Klären sie folgende Begriffe:
Konfidenzniveau
Das Konfidenzniveau gibt an mit welcher Wahrscheinlichkeit die Lageschätzung eines statistischen Parameters (z.b. Mittelwert) aus einer Stichprobenerhebung auch f.d GG zutreffend ist.
—> Vertrauenniveau
Anteilswert, der den Grad der Sicherheit angibt
Klären Sie folgenden Begriff: Irrtumswahrscheinlichkeit
- Abweichung vom Intervall (alpha)
- gibt die Wahrscheinlichkeit an, eine falsche Schätzung vorzunehmen
- häufig: alpha=5/10%
Klären sie folgende Begriffe:
Konfidenzintervall
Das Konfidenzintervall ist ein Intervall, dass die Präzision der Lageschätzung eines Parameters angeben soll, Abkürzung c.i.
-> Parameter liegt mit einer bestimmten Wahrscheinlichkeit in diesem Intervall (Konfidenzniveau)
19a) Wann sollte bei Mittelwertschätzungen mit der Standardnormalverteilung, wann mit der T-Verteilung gearbeitet werden?
T —> Wenn x normalverteilt ist, Varianz unbekannt ist und n< 30
Standardnormalverteilung —> wenn x normalverteilt ist, Varianz bekannt ist und n> 30
19b) Was versteht man unter konservativem Schätzen?
Eine Schätzung die auf Vorsicht setzt und das Worst case Szenario für die Schätzung nutzt
—> z.b. für Risikobewertung
—> Verwendung der T-Verteilung, breitere Intervalle, höhere Wahrscheinlichkeit den zu schätzenden Populationsmittelwert abzudecken
20b) Wie verändert sich das Intervall, wenn der Stichprobenumfang eine geringere Anzahl an Menschen enthält?
Das Intervall wird breiter und somit ungenauer.
21b) Wie verändert sich die erforderliche Anzahl an Befragten
- wenn die Irrtumswahrscheinlichkeit erhöht wird?
Eine höhere Irrtumswahrscheinlichkeit bedeutet kleinere Z-Werte
—> Zahl der zu Befragten (n) wird geringer
Wenn wir eine höhere Chance haben uns zu irren, dann lassen sich „genauere“ Aussagen treffen
21c) Erläutern sie die Funktion der Endlichkeitskorrektur
N-n)/(N-1
Mit der Endlichkeitskorrektur lässt sich der Stichprobenfehler für „endliche“ Grundgesamtheiten, sowie Ziehungen „ohne zurücklegen“ anpassen
Der Stichprobenfehler wird also um das Ergebnis von (N-n)/(N-1) verändert
—> das Ergebnis liegt zwischen 0 und 1
Bei Stichprobengrößen von unter 5% der Grundgesamtheit sieht man von der Endlichkeitskorrektur ab.
22a) Stellen sie möglichst allgemeinverständlich dar, was man in der Statistik unter Testen versteht.
Beim Testen stellt man Hypothesen über eine Grundgesamtheit auf. Diese werden auf Grundlage von Stichprobenwerten angenommen oder verworfen. Dabei wird auch geschaut ob die Stichprobenwerte mit der Grundgesamtheit vereinbar sind
Ergebnis eines Tests ist eine dichotome Entscheidung über die Annahme oder Ablehnung einer Hypothese
22b) Geben sie Beispiele für die Anwendungsmöglichkeit von statistischen Tests.
Die Wahlforschung
Sieg/Verlust einer Partei
Unterschiede zwischen bestimmten Gruppen
Z.b Unterscheidet sich die Smartphone Nutzung zwischen Studenten und Schülern
22c) Warum braucht man statistische Tests, wenn doch auch mit Intervallschätzungen Aussagen über die „Unschärfe“ von Aussagen treffen kann, die aus einer Stichprobe gewonnen werden?
Intervallschätzung und statistische Tests liefern unterschiedliche Ergebnisse und man kann unterschiedliche Aussagen auf Basis dieser Ergebnisse treffen.
Bei einer Intervallschätzung erhält man ein Intervall, in diesem Intervall ist ein bestimmter (Anteils-)Wert vermutlich mit einer gewissen Irrtumswahrscheinlichkeit in der GG wiederzufinden.
—> Ergebnis Intervall
Bei einem Test wird eine Hypothese bzw. Eine Aussage über die Grundgesamtheit getroffen und überprüft. Am Schluss wird die Hypothese angenommen oder abgelehnt.
—> Ergebnis dichotome JA/NEIN Entscheidung
Klären sie folgende Begriffe
0-Hypothese / Alternativ-Hypothese
Die Nullhypothese ist jede Hypothese die überprüft werden soll. Über diese wird innerhalb des Prüfungsprozesses entschieden ob man sie annimmt oder ablehnt -> häufig kein Zusammenhang/Effekt
Die Alternativ-Hypothese stellt die alternativen Möglichkeiten dar.
Ein Beispiel:
Gibt es einen Unterschied im Essverhalten von Neugeborenen und Kleinkindern ?
0-Hypothese —> Es gibt keinen Unterschied im Essverhalten
Alternativ-Hypothese —> Es gibt einen Unterschied im Essverhalten
Klären sie folgende Begriffe
gerichtete und ungerichtete
Eine gerichtete Hypothese fragt nach einem Ereignis in eine bestimmte „Richtung“ (einseitig) =>alpha (vollständig)
Bsp: Wird der FC Köln mehr/weniger als 2 Tore schießen?
Eine ungerichtete Hypothese fragt nach einem eindeutigen Ergebnis. =>alpha/2
Bsp: Gibt es einen Unterschied in der Entlohnung zwischen Männern und Frauen?
H0= Es gibt keinen Unterschied
H1= Männer oder Frauen verdienen mehr/weniger
Klären sie folgende Begriffe
Irrtumswahrscheinlichkeit/Signifikanzniveau
Die Irrtumswahrscheinlichkeit beschreibt die Wahrscheinlichkeit mit der man sich irrt, wenn man eine Aussage trifft.
Das Signifikanzniveau wird durch den gleichen Wert beschrieben, so ist dieser aber in dem Fall dafür da einen Schluss darauf zu geben wie signifikant das Ergebnis ist.
Je geringer der Wert insgesamt ist, desto genauer ist die Aussage, die sich damit treffen lässt.
Klären sie folgende Begriffe
Alpha-Fehler
Beta-Fehler
Alpha-Fehler nennt man die Entscheidung, wenn die 0-Hypothese verworfen wird obwohl sie in der Wirklichkeit zutrifft.
Beta-Fehler nennt man eine Entscheidung bei der die Nullhypothese angenommen wird, obwohl die in Realität Alternativhypothese zutrifft.
Klären sie folgende Begriffe
Annahmebereich
Ablehnungsbereich
Kritischer Wert
Der Annahmebereich umfasst alle Stichprobenkennwerte, welche mit der Nullhypothese vereinbar sind.
Der Ablehnungbereich umfasst alle Stichprobenkennwerte, welche mit der Alternativ-Hypothese vereinbar sind.
Der kritische Wert wird aus dem Signifikanzniveau gewonnen und ist die Schwelle von Ablehnungs- und Annahmebereich.
24b) Beschreiben sie wie sie bei einer Hypothesenprüfung vorgehen.
- Hypothese formulieren (H0 und H1)
- Auswahl der Prüfgrößen und ihrer Verteilung (Standardnormalverteilung o. T-Verteilung)
- Annahme und Rückweisungsbereiche
(Z-Werte oder T-Werte f. Kritischen Wert ermitteln) - Auswertung und Testentscheidung
26a) Erläutern sie genauer, was unter einem Beta-Fehler zu verstehen ist und stellen sie dies graphisch dar.
Ein Beta-Fehler bedeutet, dass man eine falsche Nullhypothese annimmt obwohl eigentlich die Alternativhypothese zutrifft.
Der Beta-Fehler kann also nur auftreten, wenn die Nullhypothese falsch ist.
26b) Wie groß ist der Beta-Fehler, wenn die Nullhypothese und die Wirklichkeit zusammenfallen?
Der Beta-Fehler wird dann 0, da kein Unterschied zur Grundgesamtheit besteht und die Nullhypothese nicht falsch ist.
die Graphen liegen dann genau aufeinander.
26c) Wie lässt sich der Beta-Fehler beeinflussen?
Die Irrtumswahrscheinlichkeit, der Abstand zwischen Nullhypothese und Wirklichkeit, sowie die Fallzahl haben Einfluss auf die Größe des Fehlers. Wobei sich vor allem Einfluss mit der Fallzahl nehmen lässt da es so ist, dass wenn die Fallzahl steigt die Verteilung schmaler wird.
29a) Was ist ein Signifikanztest und welche Informationen liefert er, welche nicht?
-Signifikanztest = Hypothesentest
-statistischer Test: auf Stichprobenbasis Entscheidung über Beibehaltung/Ablehnung der H(0)
-signifikant: Stichprobenbefund nicht zufällig (mit einer gewissen Irrtumswahrscheinlichkeit alpha) => H (0) wird verworfen (Unterschied vorhanden)
-nicht signifikant: Stichprobenbefund zufällig (mit einer gewissen Irrtumswahrscheinlichkeit alpha) => H(0) wird behalten
ABER: keine Auskunft über inhaltliche Relevanz der Befunde, inhaltliche Adäquanz der Hypothese, Angemessenheit der Modelle/Messverfahren, methodische Probleme etc.
29b) Welche Rolle spielt die Teststärke/Power (Verhältnis von Alpha und Beta Fehler) für die Aussagekraft von Tests.
-Teststärke (Testgüte) ist die Wahrscheinlichkeit, einen tatsächlich existierenden Effekt mithilfe einer empirischen Untersuchung auch zu finden
=> ALSO eine de facto falsche Nullhypothese auch tatsächlich zu verwerfen und eine zutreffende Alternativhypothese zu erkennen
-Teststärke: 1-beta
-Je größer alpha, desto kleiner beta (bedingen sich gegenseitig)
29c) Was versteht man unter multiplem Testen und welche Probleme sind damit für Fragen der Signifikanzprüfung verbunden?
-multiples Testen: Durchführen von vielen Tests
=> aufgrund der hohen Anzahl der Tests steigt die Wahrscheinlichkeit von signifikanten Testresultaten (Risiko, dass mindestens einer der Tests zu unrecht signifikant ist, wird deutlich höher)
-> irrtümliche Ablehnung der H (0) wird wahrscheinlicher
29d)Was versteht man unter a-priori und a-posteriori -Tests und welche Probleme sind damit für die Fragen der Signifikanzprüfung verbunden?
-a-priori-Tests: Hypothesenbildung vor der Datenauswertung
-a-posteriori-Tests: Hypothesenbildung nach der Datenauswertung (nachträglich aufgestellte Hypothesen prüfen => zum Korrigieren der a-priori-Tests)
=> a-posteriori-Tests können an Ergebnisse angepasst werden => Frage nach Gültigkeit/Aussagekraft (eigene Interpretation lol)
30a) Wie kann ein Hypothesentest für d% erfolgen?
1) Formulierung der Hypothese (H0: delta%=0 und H1: delta% ungleich 0)
-ungerichtete Hypothese
2) Auswahl der Prüfgröße und ihrer Verteilung
-Stichprobenanteile sind normalverteilt
3)Bestimmung einer Irrtumswahrscheinlichkeit (und des Ablehnungsbereichs)
-alpha=1%, zweiseitiger Test
4) Entscheidung über Annahme/Ablehnung der Nullhypothese auf Basis der Stichprobendaten
-alpha=1% -> z1-alpha/2= 2,576
z=(p1-p2)-pi vermutlich/ Wurzel aus Bruch (p1(1-p1)/n1) + Bruch (p2(1-p2)/n2)
-Ergebnis
30b) Wie kann eine Intervall-Schätzung vorgenommen werden?
c.i. (delta %)=dyx%+/-z1-alpha/2100Wurzel aus Bruch (ac/(a+c)^3) +Bruch (bd/(b+d)^3)
dyx%= (p1-p2)-pi vermutlich
Bei einer Irrtumswahrscheinlichkeit von 1% liegt die Prozentsatzdifferenz in der GG zwischen … und … Prozentpunkten. Da wir sowohl + als auch - rechnen, ist das Ergebnis ein Intervall.
31a) Bedeutung der Größe Chi-Quadrat für die deskriptive und die induktive Statistik
- deskriptiv: Grundlage für Maße der Stärke eines Zusammenhangs
- induktiv: Prüfgröße für die Signifikanz eines Zusammenhangs („Nicht-Zufälligkeit“)
31b) Was ist ein Chi-Quadrat-Unabhängigkeitstest und was wird dort getestet (Null-/Alternativhypothese)?
- Prüfung, ob es einen Zsmh. zwischen den untersuchten Variablen gibt
- H0: Die Merkmale x und y sind stochastisch unabhängig
- H1: Die Merkmale x und y sind stochastisch abhängig
31c) Was ist ein Chi-Quadrat-Anpassungstest und was wird dort getestet (Null-/Alternativhypothese)?
- Überprüfung der Verteilung von Werten
- Anwendung auf alle Skalenniveaus
- H0: Gleichverteilung
- H1: Ungleichverteilung
32a) Zsmh. zw. Geschlecht und Bildungsabschluss
Vergleich Randverteilung mit bedingten Verteilungen
- Anteilswerte=> Prozentzahlen (spaltenweise)
- „keine Angabe“-> immer raus
32b) Berechnen Sie ein Chi-Quadrat basiertes Zsmhs.-maß
-> Mehrfeldertabelle => Cramér‘s
1) Berechnung der Indifferenztabelle
2) Bestimmung der Abweichung von Indifferenz-/Kontingenztabelle
Chi-Quadrat in Cramér‘s V Formel einsetzen
=> Ergebnis unter 0,2 -> schwacher Zsmh.
32c) Berechnen Sie die standardisierten Residuen und interpretieren Sie die Ergebnisse
- > Signifikanz der standardisierten Residuen ab |srij| > 1,96 (alpha 5%)
- Residuen sind der Abstand zwischen Erwartetem und Beobachtetem
32d) Führen Sie einen Chi-Quadrat-Unabhängigkeitstest (alpha=1%) durch
1) Formulierung der Hypothesen H0: piij= pii.*pij. H1: piij ungleich pii.*pij. 2) Bestimmung der Irrtumswahrscheinlichkeit alpha=1% 4) Berechnung/Entscheidung über Annahme/Ablehnung der H0 df= (i-1)*(j-1) => aus Tabelle ablesen
33a) Berechnen Sie ein Zsmhs.-maß (dichotomisierte Tabelle)
=> da Vierfeldertabelle -> d% als Zusammenhangsmaß
d%= 100*((a/a+c)- (b/b+d))
33b) Führen Sie einen entsprechenden Signifikanztest (Anteilswerte) durch
-Hypothesentest (Analyse von Vierfeldertabellen)
=> siehe 30a
33c) Berechnen Sie den Chi-Quadrat-Wert
1) Indifferenztabelle
2) Abweichung von Indifferenz-/Kontingenztabelle
33d) Führen Sie einen Chi-Quadrat-Unabhängigkeitstest (alpha=1%) durch
siehe 31b
33e) Interpretieren Sie die Ergebnisse der beiden Signifikanztests
Abweichung der Tests durch unterschiedliche Richtung/Größe
-> unterschiedliche Verfahren als Basis, daher nur schwer vergleichbar
34a) Geben Sie ein Beispiel für eine sinnvolle Anwendung des Chi-Quadrat-Anpassungstest
Da es beim Anpassungstest um die Verteilung von Werten geht, können wir Ausprägungen wie Wochentage, Monate, Würfelergebnisse, Zeit in Stunden etc. nehmen
- > Bsp.: Wie verteilen sich die Umsätze eines Unternehmens im Jahresverlauf?
- > Einheiten könnten Monate sein (Jan-Dez) und Ausprägungen die jeweiligen Geldbeträge
34b) genaue Vorgehensweise
- Werte in Form einer Tabelle notieren (Übersicht)
- Hypothesen formulieren
- H0: Gleichverteilung
- H1: Ungleichverteilung
- beobachtete Werte (ni)
- erwartete Werte (ei)
- Differenz: ni-ei
- Chi-Quadrat-Anteil: (ni-ei)^2/ei
- Annahme/Ablehnung der H0 nach Berechnung
35a) Welche Voraussetzungen müssen gegeben sein, um den Chi-Quadrat-Unabhängigkeitstest nutzen zu können?
-Mindestvoraussetzungen:
n>30 (nicht zu klein)
feij >0 (für alle feij) -> keine leeren Felder
feij >5 (für min. 80% feij). -> wenig gering besetzte Felder
-höhere Voraussetzungen:
feij >10
35b) Was kann bei deren Nicht-Vorliegen getan werden?
- Zeilen und Spalten können zusammengefasst werden, sodass unsere feij Voraussetzungen passen
- Verwendung von anderen Tests (z.B. fisher‘s exakter Test (SPSS)