Statistik 2 Flashcards

1
Q

1)Klären sie den Unterschied zwischen apriori- und aposteriori- Wahrscheinlichkeit.

A

Apriori: bedeutet im Vorhinein
Dabei kommt ein erwartbarer wert raus
Der Wahrscheinlichkeitswert wird mit allgemeinem Vorwissen gewonnen
—> LA PLACE (jedes Ereignis hat die gleiche Chance)

Aposteriori: bedeutet im Nachhinein
Dabei handelt es sich um einen Wert der den Wissensstand ü. einen unbekannten Umweltzustand nach der Beobachtung einer Zufallsgröße X darstellt.
—> LIMES (ein Wert nähert sich etwas an/gegen unendlich ist es gleich verteilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

2)Wie kann eine Beziehung zwischen relativen Häufigkeiten und Wahrscheinlichkeiten hergestellt werden?

A

Die relative Häufigkeit nähert sich mit häufiger Versuchsdurchführung der Wahrscheinlichkeit
P(A)=lim (fA/n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

3a)Begriffsklärung

ZUFALLSVARIABLE

A

Eine Größe, deren Wert vom Zufall abhängig ist
Beispiel: Glücksspiel
-> unendlich viele Ausprägungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

3b) Begriffsklärung

DISKRETE ZUFALLSVARIABLE

A

Eine Größe, deren Wert vom Zufall abhängig ist, die aber keine Zwischenwerte annehmen kann.
Z.B Augenzahl beim Würfel
-> endlich viele mögliche Ausprägungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

3c) Begriffsklärung

Kennwerte der Stichprobe

A

Maßzahlen die für die Grundgesamtheit berechnet werden./ Beschreibung von Eigenschaften der Stichprobe
z.B arith. Mittel, Median, Streuungsmaße

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

3d)Begriffsklärung

WAHRSCHEINLICHKEITSVERTEILUNG

A

Die Zuordnung von den Wahrscheinlichkeiten und ihren jeweiligen Ereignissen. Für jedes Ereignis (alle möglichen Ausgänge) wird die Wahrscheinlichkeit niedergeschrieben. Daraus kann z.B. ein Graf, eine Tabelle oder ein Balkendiagrammm entstehen.
-> lassen sich durch Erwartungswert/ Varianz beschreiben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

3e) Begriffserklärung

KENNWERTEVERTEILUNG

A

Sie zeigt auf wie die Eigenschaften/Kennworte innerhalb einer Stichprobe verteilt sind.
Sie stellt eine Brücke zwischen Stichprobe und Grundgesamtheit dar => Gesamtheit aller Stichprobenwerte bildet die Kennwerteverteilung
Z.B Mittelwert von 4 Stichproben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

5) Klären sie die Begriffe, Erwartungswert und Varianz einer Zufallsvariable.

A

Erwartungswert = Mittelwert der Zufallsvariable (n * π)

Varianz = durchschnittliche quadrierte Abweichung vom Mittelwert der Zufallsvariable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

7a) Welcher Typ von Zufallsexperimenten kann durch Binomialverteilungen analysiert werden?

A

Binomialverteilungen werden vor allem bei Verteilungen genutzt, bei denen die Bedingungen gleich bleiben, also meist bei dichotomisierten Zufallsexperimenten mit Zurücklegen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

7b) Erläutern sie die Parameter der Binomialverteilungen, wie wirken sich diese auf die Gestalt der Verteilung aus?

A

N= Größe der Stichprobe (beeinflusst Zahl der Säulen)

π= Anteilswert der Zufallsvariablen (beeinflusst die Höhe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

7c) Was unterscheidet die Binomial- von der HYpergeometrischen Verteilung?

A

Binomial: Zufallsexperimenten mit zurücklegen
Hypergeometrisch: Zufallsexperimenten ohne zurücklegen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

7d) In welchen Fällen ist es erforderlich mit der hypergeometrischen Verteilung zu arbeiten?

A

Wenn dichotome Fälle ohne zurücklegen gewählt werden

- drei Parameter: Größe der GG, Größe der Stichprobe, Zahl der günstigen Fälle in GG

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

7e) UNter welcher Bedingung kann die Berechnung nach der hypergeometrischen Verteilung durch die Werte der Binomialverteilungen ersetzt werden?

A

Bei N/n> 20 darf die Binomialverteilungen statt die hypergeometrischen Verteilung genutzt werden, obwohl nicht zurück gelegt wird
N= Größe der Grundgesamtheit
N= Größe der Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

8a&b)Wo liegt der Unterschied zwischen stetigen und diskreten Zufallsvariablen? Geben sie Beispiele.

A

A) diskret = keine Zwischenwerte, Darstellung als Wahrscheinlichkeitsfunktion
Stetig = unendlich viele Zwischenwerte möglich, Darstellung als Dichtefunktion/Verteilungsfunktion

B) Diskret = Geschlecht eines Babys, Münzwurf, Sonntagsfrage
Stetig = Größe, Geschwindigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

8c) Darstellung der Wahrscheinlichkeitsverteilungen

A

diskret: Wahrscheinlichkeit als Höhe der Säulen, Gesamtwert von 1 als Summe der Höhe der Säulen
stetig: Wahrscheinlichkeit als Fläche unterhalb der Dichtefunktion, Gesamtwert von 1 als Gesamtfläche unter der Kurve

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

9a&b)
Klären sie, welche Informationen der Dichte- bzw. Der Verteilungsfunktion einer zufallsvariable zu entnehmen sind.

In welchem Verhältnis stehen Dichte- bzw. der Verteilungsfunktion?

A

> Einer Dichtefunktion kann der Mittelwert und die Standardabweichung entnommen werden
Eine Verteilungsfunktion gibt Aufschluss über den Anteilswert der jeweiligen Ereignisse

> Verteilungsfunktionen geben die kumulative Häufigkeit der Ereignisse (welche in der Dichtefunktion darstellbar sind) bis 100% dar
-> mathematisch gesehen ist die Verteilungsfunktion das Integral der Dichtefunktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

10a) Geben sie in eigenen Worten den zentralen Grenzwertsatz wieder

A

Wenn die Menge der gemessenen Ereignisse gegen unendlich geht, wird jede Dichtefunktion (annähernd) normalverteilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

10b) Warum sind bestimmte Phänomene (die Ergebnisse des Nagelbrett-Experiments, Körpergröße, näherungsweise Einkommen) normalverteilt? Beziehen sie sich dabei auf den zentralen Grenzwertsatz.

A

Sie sind normalverteilt, weil Ausläufer zunehmend von der Masse der Unendlichkeit verschluckt werden und sich ein Mittelwert ausprägt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

10c) Was besagt der zentrale Grenzwertsatzüber die Verteilung von Stichprobenmittelwerten?

A

Die Verteilung wird annähernd normalverteilt, wenn eine gegen unendlich gehende Menge an Stichprobenmittelwerten in ihr dargestellt wird. Diese hat dann jedoch eine geringere Standardabweichung
=> DENN: bei den jeweiligen Stichproben werden durch das Ermitteln eines Mittelwertes bereits die extremen Ausläufer eingerechnet und fallen somit weniger ins Gewicht der Kennwerteverteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

11a) Von welchen Parametern hängt die Gestalt der Normalverteilung ab?

A

Mittelwert —> Verschiebung der x-Achse

Standardabweichung —> steiler (erhöhen) flacher (verringern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

12a) Welche Parameter hat die Standardnormalverteilung?

A

Parameter 0 & 1

0= Mittelwert 1= Standardabweichung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

12b) Was versteht man unter z-Transformation

A

Durch die z-Transformation wird jede Normalverteilung zu einer Standardnormalverteilung

Die variable wird standardisiert indem von einem Messwert der Mittelwert abgezogen wird & dies dann dividiert durch die Standardabweichung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

14a) Stellen sie das Grundkonzept von Punkt- und Intervallschätzung dar.

A

Punktschätzung:
Schätzung von genau einem Wert/Schätzung eines Parameters in der GG aufgrund von Stichprobenkennwerten (Schätzer)/keine Angaben über Genauigkeit (Bsp: Einkommen)

Intervallschätzung:
Mit einer vorgegebenen Wahrscheinlichkeit liegt ein Parameter in dem zu schätzenden Intervall /
Angabe eines Konfidenzintervalls

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

14b) Wozu sind Intervallschätzungen erforderlich?

A

Berechnung der Signifikanz einer Hypothese

Wenn: berechneter Wert außerhalb des Signifikanzniveaus
—> Verwerfen der Hypothese

Berechnung des Risikos einer Fehleinschätzung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

15)Welche Informationen müssen vorliegen um Intervallschätzungen vornehmen zu können?

A

S

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Klären sie folgende Begriffe:

Kennwerteverteilung

A

Eine Art von Wahrscheinlichkeitsverteilung
Die Verteilung, die die Kennwerte einer Stichprobe beinhaltet
Brücke zwischen GG und Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Klären sie folgende Begriffe:

Standardfehler

A

Streeungsmaß für eine Schätzfunktion für einen unbekannten Parameter der GG. Wie weit der Mittelwert der Stichprobe vom tatsächlichen Mittelwert durchschnittlich abweicht.
—> Standardabweichung der Kennwerteverteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Klären sie folgende Begriffe:

Stichprobenparameter/Populationsmerkmal

A

Stichprobenparameter: entsprechendes Merkmal der Stichprobe/Parameter einer Stichprobe

Populationsmerkmal: betreffendes Merkmal der GG

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Klären sie folgende Begriffe:

Konfidenzniveau

A

Das Konfidenzniveau gibt an mit welcher Wahrscheinlichkeit die Lageschätzung eines statistischen Parameters (z.b. Mittelwert) aus einer Stichprobenerhebung auch f.d GG zutreffend ist.
—> Vertrauenniveau
Anteilswert, der den Grad der Sicherheit angibt

30
Q

Klären Sie folgenden Begriff: Irrtumswahrscheinlichkeit

A
  • Abweichung vom Intervall (alpha)
  • gibt die Wahrscheinlichkeit an, eine falsche Schätzung vorzunehmen
  • häufig: alpha=5/10%
31
Q

Klären sie folgende Begriffe:

Konfidenzintervall

A

Das Konfidenzintervall ist ein Intervall, dass die Präzision der Lageschätzung eines Parameters angeben soll, Abkürzung c.i.
-> Parameter liegt mit einer bestimmten Wahrscheinlichkeit in diesem Intervall (Konfidenzniveau)

32
Q

19a) Wann sollte bei Mittelwertschätzungen mit der Standardnormalverteilung, wann mit der T-Verteilung gearbeitet werden?

A

T —> Wenn x normalverteilt ist, Varianz unbekannt ist und n< 30
Standardnormalverteilung —> wenn x normalverteilt ist, Varianz bekannt ist und n> 30

33
Q

19b) Was versteht man unter konservativem Schätzen?

A

Eine Schätzung die auf Vorsicht setzt und das Worst case Szenario für die Schätzung nutzt
—> z.b. für Risikobewertung

—> Verwendung der T-Verteilung, breitere Intervalle, höhere Wahrscheinlichkeit den zu schätzenden Populationsmittelwert abzudecken

34
Q

20b) Wie verändert sich das Intervall, wenn der Stichprobenumfang eine geringere Anzahl an Menschen enthält?

A

Das Intervall wird breiter und somit ungenauer.

35
Q

21b) Wie verändert sich die erforderliche Anzahl an Befragten
- wenn die Irrtumswahrscheinlichkeit erhöht wird?

A

Eine höhere Irrtumswahrscheinlichkeit bedeutet kleinere Z-Werte
—> Zahl der zu Befragten (n) wird geringer
Wenn wir eine höhere Chance haben uns zu irren, dann lassen sich „genauere“ Aussagen treffen

36
Q

21c) Erläutern sie die Funktion der Endlichkeitskorrektur

N-n)/(N-1

A

Mit der Endlichkeitskorrektur lässt sich der Stichprobenfehler für „endliche“ Grundgesamtheiten, sowie Ziehungen „ohne zurücklegen“ anpassen

Der Stichprobenfehler wird also um das Ergebnis von (N-n)/(N-1) verändert
—> das Ergebnis liegt zwischen 0 und 1
Bei Stichprobengrößen von unter 5% der Grundgesamtheit sieht man von der Endlichkeitskorrektur ab.

37
Q

22a) Stellen sie möglichst allgemeinverständlich dar, was man in der Statistik unter Testen versteht.

A

Beim Testen stellt man Hypothesen über eine Grundgesamtheit auf. Diese werden auf Grundlage von Stichprobenwerten angenommen oder verworfen. Dabei wird auch geschaut ob die Stichprobenwerte mit der Grundgesamtheit vereinbar sind
Ergebnis eines Tests ist eine dichotome Entscheidung über die Annahme oder Ablehnung einer Hypothese

38
Q

22b) Geben sie Beispiele für die Anwendungsmöglichkeit von statistischen Tests.

A

Die Wahlforschung
Sieg/Verlust einer Partei

Unterschiede zwischen bestimmten Gruppen
Z.b Unterscheidet sich die Smartphone Nutzung zwischen Studenten und Schülern

39
Q

22c) Warum braucht man statistische Tests, wenn doch auch mit Intervallschätzungen Aussagen über die „Unschärfe“ von Aussagen treffen kann, die aus einer Stichprobe gewonnen werden?

A

Intervallschätzung und statistische Tests liefern unterschiedliche Ergebnisse und man kann unterschiedliche Aussagen auf Basis dieser Ergebnisse treffen.

Bei einer Intervallschätzung erhält man ein Intervall, in diesem Intervall ist ein bestimmter (Anteils-)Wert vermutlich mit einer gewissen Irrtumswahrscheinlichkeit in der GG wiederzufinden.
—> Ergebnis Intervall

Bei einem Test wird eine Hypothese bzw. Eine Aussage über die Grundgesamtheit getroffen und überprüft. Am Schluss wird die Hypothese angenommen oder abgelehnt.
—> Ergebnis dichotome JA/NEIN Entscheidung

40
Q

Klären sie folgende Begriffe

0-Hypothese / Alternativ-Hypothese

A

Die Nullhypothese ist jede Hypothese die überprüft werden soll. Über diese wird innerhalb des Prüfungsprozesses entschieden ob man sie annimmt oder ablehnt -> häufig kein Zusammenhang/Effekt
Die Alternativ-Hypothese stellt die alternativen Möglichkeiten dar.
Ein Beispiel:
Gibt es einen Unterschied im Essverhalten von Neugeborenen und Kleinkindern ?
0-Hypothese —> Es gibt keinen Unterschied im Essverhalten
Alternativ-Hypothese —> Es gibt einen Unterschied im Essverhalten

41
Q

Klären sie folgende Begriffe

gerichtete und ungerichtete

A

Eine gerichtete Hypothese fragt nach einem Ereignis in eine bestimmte „Richtung“ (einseitig) =>alpha (vollständig)
Bsp: Wird der FC Köln mehr/weniger als 2 Tore schießen?

Eine ungerichtete Hypothese fragt nach einem eindeutigen Ergebnis. =>alpha/2
Bsp: Gibt es einen Unterschied in der Entlohnung zwischen Männern und Frauen?
H0= Es gibt keinen Unterschied
H1= Männer oder Frauen verdienen mehr/weniger

42
Q

Klären sie folgende Begriffe

Irrtumswahrscheinlichkeit/Signifikanzniveau

A

Die Irrtumswahrscheinlichkeit beschreibt die Wahrscheinlichkeit mit der man sich irrt, wenn man eine Aussage trifft.

Das Signifikanzniveau wird durch den gleichen Wert beschrieben, so ist dieser aber in dem Fall dafür da einen Schluss darauf zu geben wie signifikant das Ergebnis ist.

Je geringer der Wert insgesamt ist, desto genauer ist die Aussage, die sich damit treffen lässt.

43
Q

Klären sie folgende Begriffe

Alpha-Fehler
Beta-Fehler

A

Alpha-Fehler nennt man die Entscheidung, wenn die 0-Hypothese verworfen wird obwohl sie in der Wirklichkeit zutrifft.

Beta-Fehler nennt man eine Entscheidung bei der die Nullhypothese angenommen wird, obwohl die in Realität Alternativhypothese zutrifft.

44
Q

Klären sie folgende Begriffe
Annahmebereich

Ablehnungsbereich

Kritischer Wert

A

Der Annahmebereich umfasst alle Stichprobenkennwerte, welche mit der Nullhypothese vereinbar sind.

Der Ablehnungbereich umfasst alle Stichprobenkennwerte, welche mit der Alternativ-Hypothese vereinbar sind.

Der kritische Wert wird aus dem Signifikanzniveau gewonnen und ist die Schwelle von Ablehnungs- und Annahmebereich.

45
Q

24b) Beschreiben sie wie sie bei einer Hypothesenprüfung vorgehen.

A
  1. Hypothese formulieren (H0 und H1)
  2. Auswahl der Prüfgrößen und ihrer Verteilung (Standardnormalverteilung o. T-Verteilung)
  3. Annahme und Rückweisungsbereiche
    (Z-Werte oder T-Werte f. Kritischen Wert ermitteln)
  4. Auswertung und Testentscheidung
46
Q

26a) Erläutern sie genauer, was unter einem Beta-Fehler zu verstehen ist und stellen sie dies graphisch dar.

A

Ein Beta-Fehler bedeutet, dass man eine falsche Nullhypothese annimmt obwohl eigentlich die Alternativhypothese zutrifft.
Der Beta-Fehler kann also nur auftreten, wenn die Nullhypothese falsch ist.

47
Q

26b) Wie groß ist der Beta-Fehler, wenn die Nullhypothese und die Wirklichkeit zusammenfallen?

A

Der Beta-Fehler wird dann 0, da kein Unterschied zur Grundgesamtheit besteht und die Nullhypothese nicht falsch ist.
die Graphen liegen dann genau aufeinander.

48
Q

26c) Wie lässt sich der Beta-Fehler beeinflussen?

A

Die Irrtumswahrscheinlichkeit, der Abstand zwischen Nullhypothese und Wirklichkeit, sowie die Fallzahl haben Einfluss auf die Größe des Fehlers. Wobei sich vor allem Einfluss mit der Fallzahl nehmen lässt da es so ist, dass wenn die Fallzahl steigt die Verteilung schmaler wird.

49
Q

29a) Was ist ein Signifikanztest und welche Informationen liefert er, welche nicht?

A

-Signifikanztest = Hypothesentest
-statistischer Test: auf Stichprobenbasis Entscheidung über Beibehaltung/Ablehnung der H(0)
-signifikant: Stichprobenbefund nicht zufällig (mit einer gewissen Irrtumswahrscheinlichkeit alpha) => H (0) wird verworfen (Unterschied vorhanden)
-nicht signifikant: Stichprobenbefund zufällig (mit einer gewissen Irrtumswahrscheinlichkeit alpha) => H(0) wird behalten
ABER: keine Auskunft über inhaltliche Relevanz der Befunde, inhaltliche Adäquanz der Hypothese, Angemessenheit der Modelle/Messverfahren, methodische Probleme etc.

50
Q

29b) Welche Rolle spielt die Teststärke/Power (Verhältnis von Alpha und Beta Fehler) für die Aussagekraft von Tests.

A

-Teststärke (Testgüte) ist die Wahrscheinlichkeit, einen tatsächlich existierenden Effekt mithilfe einer empirischen Untersuchung auch zu finden
=> ALSO eine de facto falsche Nullhypothese auch tatsächlich zu verwerfen und eine zutreffende Alternativhypothese zu erkennen
-Teststärke: 1-beta
-Je größer alpha, desto kleiner beta (bedingen sich gegenseitig)

51
Q

29c) Was versteht man unter multiplem Testen und welche Probleme sind damit für Fragen der Signifikanzprüfung verbunden?

A

-multiples Testen: Durchführen von vielen Tests
=> aufgrund der hohen Anzahl der Tests steigt die Wahrscheinlichkeit von signifikanten Testresultaten (Risiko, dass mindestens einer der Tests zu unrecht signifikant ist, wird deutlich höher)
-> irrtümliche Ablehnung der H (0) wird wahrscheinlicher

52
Q

29d)Was versteht man unter a-priori und a-posteriori -Tests und welche Probleme sind damit für die Fragen der Signifikanzprüfung verbunden?

A

-a-priori-Tests: Hypothesenbildung vor der Datenauswertung
-a-posteriori-Tests: Hypothesenbildung nach der Datenauswertung (nachträglich aufgestellte Hypothesen prüfen => zum Korrigieren der a-priori-Tests)
=> a-posteriori-Tests können an Ergebnisse angepasst werden => Frage nach Gültigkeit/Aussagekraft (eigene Interpretation lol)

53
Q

30a) Wie kann ein Hypothesentest für d% erfolgen?

A

1) Formulierung der Hypothese (H0: delta%=0 und H1: delta% ungleich 0)
-ungerichtete Hypothese
2) Auswahl der Prüfgröße und ihrer Verteilung
-Stichprobenanteile sind normalverteilt
3)Bestimmung einer Irrtumswahrscheinlichkeit (und des Ablehnungsbereichs)
-alpha=1%, zweiseitiger Test
4) Entscheidung über Annahme/Ablehnung der Nullhypothese auf Basis der Stichprobendaten
-alpha=1% -> z1-alpha/2= 2,576
z=(p1-p2)-pi vermutlich/ Wurzel aus Bruch (p1(1-p1)/n1) + Bruch (p2(1-p2)/n2)
-Ergebnis

54
Q

30b) Wie kann eine Intervall-Schätzung vorgenommen werden?

A

c.i. (delta %)=dyx%+/-z1-alpha/2100Wurzel aus Bruch (ac/(a+c)^3) +Bruch (bd/(b+d)^3)
dyx%= (p1-p2)-pi vermutlich
Bei einer Irrtumswahrscheinlichkeit von 1% liegt die Prozentsatzdifferenz in der GG zwischen … und … Prozentpunkten. Da wir sowohl + als auch - rechnen, ist das Ergebnis ein Intervall.

55
Q

31a) Bedeutung der Größe Chi-Quadrat für die deskriptive und die induktive Statistik

A
  • deskriptiv: Grundlage für Maße der Stärke eines Zusammenhangs
  • induktiv: Prüfgröße für die Signifikanz eines Zusammenhangs („Nicht-Zufälligkeit“)
56
Q

31b) Was ist ein Chi-Quadrat-Unabhängigkeitstest und was wird dort getestet (Null-/Alternativhypothese)?

A
  • Prüfung, ob es einen Zsmh. zwischen den untersuchten Variablen gibt
  • H0: Die Merkmale x und y sind stochastisch unabhängig
  • H1: Die Merkmale x und y sind stochastisch abhängig
57
Q

31c) Was ist ein Chi-Quadrat-Anpassungstest und was wird dort getestet (Null-/Alternativhypothese)?

A
  • Überprüfung der Verteilung von Werten
  • Anwendung auf alle Skalenniveaus
  • H0: Gleichverteilung
  • H1: Ungleichverteilung
58
Q

32a) Zsmh. zw. Geschlecht und Bildungsabschluss

Vergleich Randverteilung mit bedingten Verteilungen

A
  • Anteilswerte=> Prozentzahlen (spaltenweise)

- „keine Angabe“-> immer raus

59
Q

32b) Berechnen Sie ein Chi-Quadrat basiertes Zsmhs.-maß

A

-> Mehrfeldertabelle => Cramér‘s
1) Berechnung der Indifferenztabelle
2) Bestimmung der Abweichung von Indifferenz-/Kontingenztabelle
Chi-Quadrat in Cramér‘s V Formel einsetzen
=> Ergebnis unter 0,2 -> schwacher Zsmh.

60
Q

32c) Berechnen Sie die standardisierten Residuen und interpretieren Sie die Ergebnisse

A
  • > Signifikanz der standardisierten Residuen ab |srij| > 1,96 (alpha 5%)
  • Residuen sind der Abstand zwischen Erwartetem und Beobachtetem
61
Q

32d) Führen Sie einen Chi-Quadrat-Unabhängigkeitstest (alpha=1%) durch

A
1) Formulierung der Hypothesen 
H0: piij= pii.*pij.
H1: piij ungleich pii.*pij.
2) Bestimmung der Irrtumswahrscheinlichkeit 
alpha=1%
4) Berechnung/Entscheidung über Annahme/Ablehnung der H0
df= (i-1)*(j-1) 
=> aus Tabelle ablesen
62
Q

33a) Berechnen Sie ein Zsmhs.-maß (dichotomisierte Tabelle)

A

=> da Vierfeldertabelle -> d% als Zusammenhangsmaß

d%= 100*((a/a+c)- (b/b+d))

63
Q

33b) Führen Sie einen entsprechenden Signifikanztest (Anteilswerte) durch

A

-Hypothesentest (Analyse von Vierfeldertabellen)

=> siehe 30a

64
Q

33c) Berechnen Sie den Chi-Quadrat-Wert

A

1) Indifferenztabelle

2) Abweichung von Indifferenz-/Kontingenztabelle

65
Q

33d) Führen Sie einen Chi-Quadrat-Unabhängigkeitstest (alpha=1%) durch

A

siehe 31b

66
Q

33e) Interpretieren Sie die Ergebnisse der beiden Signifikanztests

A

Abweichung der Tests durch unterschiedliche Richtung/Größe

-> unterschiedliche Verfahren als Basis, daher nur schwer vergleichbar

67
Q

34a) Geben Sie ein Beispiel für eine sinnvolle Anwendung des Chi-Quadrat-Anpassungstest

A

Da es beim Anpassungstest um die Verteilung von Werten geht, können wir Ausprägungen wie Wochentage, Monate, Würfelergebnisse, Zeit in Stunden etc. nehmen

  • > Bsp.: Wie verteilen sich die Umsätze eines Unternehmens im Jahresverlauf?
  • > Einheiten könnten Monate sein (Jan-Dez) und Ausprägungen die jeweiligen Geldbeträge
68
Q

34b) genaue Vorgehensweise

A
  • Werte in Form einer Tabelle notieren (Übersicht)
  • Hypothesen formulieren
  • H0: Gleichverteilung
  • H1: Ungleichverteilung
  • beobachtete Werte (ni)
  • erwartete Werte (ei)
  • Differenz: ni-ei
  • Chi-Quadrat-Anteil: (ni-ei)^2/ei
  • Annahme/Ablehnung der H0 nach Berechnung
69
Q

35a) Welche Voraussetzungen müssen gegeben sein, um den Chi-Quadrat-Unabhängigkeitstest nutzen zu können?

A

-Mindestvoraussetzungen:
n>30 (nicht zu klein)
feij >0 (für alle feij) -> keine leeren Felder
feij >5 (für min. 80% feij). -> wenig gering besetzte Felder

-höhere Voraussetzungen:
feij >10

70
Q

35b) Was kann bei deren Nicht-Vorliegen getan werden?

A
  • Zeilen und Spalten können zusammengefasst werden, sodass unsere feij Voraussetzungen passen
  • Verwendung von anderen Tests (z.B. fisher‘s exakter Test (SPSS)