Signifikanztests Flashcards

1
Q

Was ist eine Alternativhypothese?

A

Sie widerspricht anderen Hypothesen oder ergänzt den Wissensstand wesentlich.
kann gerichtet oder ungerichtet sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist ein systematischer Unterschied?

A

kein zufälliges Ergebnis (durch Fehlerrisiken ausgerechnet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie ist der Zusammenhang zwischen der Verteilung eines Merkmals in der Grundgesamtheit und dem in einer Stichprobe?

A

Stichprobe wie Zufallsexperiment, man kann auf Grundgesamtheit zurückschätzen
Stichprobe als Zufallsauswahl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie ergibt sich die Mittelwertsverteilung und was hat man davon?

A
theoretischer Schritt:
1. Ziehung einer Stichprobe mit Umfang n
2. Ermittlung des Mittelwerts x'
3. k-mal wiederholen
==> Verteilung der k Mittelwerte
==> BÄM! Mittelwert der Mittelwerte entspricht dem wahren my, dem wahren Mittelwert der Grundgesamtheit (Gesetz der großen Zahlen); keine systematische Unter- oder Überschätzungen

Die Mittelwertsverteilung ist nach dem zentralen Grenzwerttheorem normalverteilt ab einer Fallzahl n > 30

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Eigenschaften hat eine einfache Zufallsauswahl (simple random sample)?

A
  1. jede Einheit aus der Grundgesamtheit hat die gleiche Wahrscheinlichkeit, gezogen zu werden
  2. Unabhängigkeit: die Auswahl einer Einheit hat keinen Einfluss auf die Auswahl der anderen Einheiten

iid => independently and identically distributed

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was besagt das zentrale Grenzwerttheorem?

A

Werden aus ein und derselben Grundgesamtheit
Stichproben des Umfangs n entnommen, so geht
die Verteilung der Mittelwerte dieser Stichproben
mit zunehmendem n in eine Normalverteilung
über.

gilt nur für n >= 30
wenn die Varianz bekannt ist
unabhängig von der Verteilung des Merkmals in der Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie stehen die Standardabweichung und die Fallzahl miteinander im Verhältnis?

A

die Standardabweichung wird kleiner, je größer die Fallzahl wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der Standardfehler?

A

Die geschätzte Standardabweichung der Mittelwertsverteilung
Die Streuung der Mittelwertsverteilung
FORMEL
abhängig von n, je größer n, desto Präziser Standardfehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie schätzt man die Varianz der Population?

A

FORMEL
mit dem Korrekturfaktor
weil die Varianz der Stichprobe die Populationsvarianz unterschätzt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie lautet die richtige Formulierung für den Antwortsatz bei der Sache mit den Konfidenzintervallen?

A

95 von 100 Stichproben würden den wahren Wert umschließen, wenn das Intervall so angegeben wird.
ääh oder so ähnlich
man sollte die margin of error Unsicherheit der Schätzung jedenfalls klar ausdrücken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist die Nullhypothese?

A

sie negiert die Alternativhypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind Unterschiedshypothesen?

A

sie postulieren einen Unterschied

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Zusammenhangshypothesen?

A

sie postulieren einen Zusammenhang

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was passiert mit der inhaltlichen Hypothese?

A

sie wird in eine statistische Hypothese überführt, um sie empirisch zu überprüfen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wann begeht man den alpha-Fehler?

A

Wenn man die Alternativhypothese annimmt, in Population gilt aber die Nullhypothese.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wann begeht man den beta-Fehler?

A

Wenn man die Nullhypothese annimmt, in Population gilt aber die Alternativhypothese.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wofür braucht man den alpha- und beta-Fehler?

A

Um die Irrtumswahrscheinlichkeit zu berechnen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was sind die Konventionen zur Interpretation der Irrtumswahrscheinlichkeit?

A

Irrtumswahrscheinlichkeit für alpha-Fehler 5% oder geringer => signifikantes Ergebnis
1% oder geringer => sehr signifikantes Ergebnis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was sind die kritischen Werte für die 5%- und 1%-Hürde bei der Normalverteilung bei gerichteten und ungerichteten Hypothesen?

A

gerichtet ~ zweiseitiger Test (man schneidet von beiden Seiten der Verteilung ab)
5% => 1,96
1% => 2,58

ungerichtet ~ einseitiger Test (man schneidet nur von einer Seite der Verteilung ab)
5% => 1,64
1% => 2,33

20
Q

Unter welchen Bedingungen können die Wahrscheinlichkeiten für den alpha- und beta-Fehler berechnet werden?

A

alpha-Fehler: nur mit spezifischer H0
beta-Fehler: nur mit spezifischer H1
gleichzeitig alpha und beta nur, wenn sowohl H1 als auch H0 spezifisch sind (Neyman-Pearson-Ansatz)

21
Q

Was macht der t-Test, wofür ist er gut?

A

er vergleicht Mittelwerte
es gibt drei verschiedene t-tests:

1-Stichproben-t-Test: vergleicht Stichprobenmittelwert und Populationmittelwert

unabhängiger 2-Stichproben-t-Test: vergleicht Stichprobenmittelwerte aus unabhängigen Stichproben

abhängiger 2-Stichproben-t-Test: vergleicht Stichprobenmittelwerte aus abhängigen Stichproben

22
Q

Was ist eine gerichtete, was eine ungerichtete Hypothese?

A

Gerichtete Hypothesen beziehen sich auf größer(gleich)- und kleiner(gleich)-Beziehungen zwischen Kennwerten.
Ungerichtete Hypothesen beziehen sich auf die Ungleichheit zwischen Kennwerten.
Gerichtete Hypothese: 𝜇𝜇𝐹𝐹 > 𝜇𝜇𝑀𝑀 - Einkommen von Frauen größer als Einkommen von
Männern
Ungerichtete Hypothese: 𝜇𝜇𝐹𝐹 ≠ 𝜇𝜇𝑀𝑀 – Einkommen von Frauen ungleich Einkommen von
Männern

23
Q

Welche Parameter müssen zur Durchführung des t-Tests bekannt sein?

A

my: arithmetisches Mittel in der Population
x_: arithmetisches Mittel in der Stichprobe
sigma2 oder ^sigma2: Standardabweichung oder geschätzte Standardabweichung in der Population
n: Stichprobengröße

24
Q

Welche Parameter müssen zur Durchführung des t-Tests bekannt sein?

A

my: arithmetisches Mittel in der Population
x_: arithmetisches Mittel in der Stichprobe
sigma2 oder ^sigma2: Standardabweichung oder geschätzte Standardabweichung in der Population
n: Stichprobengröße

25
Q

Welche Parameter müssen zur Durchführung des ein-Stichproben t-Tests bekannt sein?

A

FORMEL
my: arithmetisches Mittel in der Population
x_: arithmetisches Mittel in der Stichprobe
sigma2 oder ^sigma2: Standardabweichung oder geschätzte Standardabweichung in der Population
n: Stichprobengröße

26
Q

In welchen Fällen kann ich mit der z-Transformation arbeiten?

A

Normalverteilung + Populationsvarianz bekannt

egal-Verteilung + Populationsvarianz bekannt + n>30

egal-Verteilung + Populationsvarianz unbekannt = geschätzt + n>120

27
Q

In welchen Fällen kann ich mit der z-Transformation arbeiten?

A

Normalverteilung + Populationsvarianz bekannt

egal-Verteilung + Populationsvarianz bekannt + n>30

egal-Verteilung + Populationsvarianz unbekannt = geschätzt + n>120

28
Q

Was sind die Freiheitsgrade?

A

Anzahl der frei wählbaren Elemente in einer Berechnung

bei jeder Schätzung geht ein FG verloren

29
Q

Was ist ein Konfidenzintervall?

A

es gibt die Präzision der Schätzung eines Parameters an, z.B. des Lageparameters arithmetisches Mittel
FORMEL

30
Q

Was ist der p-Wert?

A

Wie wahrscheinlich ist es den Mittelwert x_ (oder einen betragsmäßig größeren Mittelwert) aus der Stichprobe zu erhalten, wenn diese aus einer GG mit wahrem Mittelwert µ0 gezogen wurde?

Ergebnis eines Signifikanztests
Der p-Wert ist die Wahrscheinlichkeit, dass unter der Annahme, die Nullhypothese sei wahr, die Teststatistik den beobachteten oder einen extremeren Wert annimmt

Konsequenz:
kleiner p-Wert => H0 verwerfen, H1 annehmen
großer p-Wert => bei H0 bleiben

31
Q

Was braucht man für den zwei-Stichproben-t-Test im Unterschied zum ein-Stichproben-t-Test?

A

Standardfehler der beiden Stichprobeneinheiten/ Teilpopulationen
dabei kann es sein, dass die Streuungen, also Standardfehler der beiden gleich sind oder ungleich

wenn die Varianzen gleich sind, darf man den Standarddings unterm Bruchstich poolen
wenn die Varianzen nicht gleich sind, muss man separat schätzen

32
Q

Wie schätzt man die Varianz der Grundgesamtheit?

A

man nimmt die Varianz der Stichprobe und multipliziert sie mit dem Korrekturfaktor
FORMEL

33
Q

Worauf muss ich achten beim t-Test mit zwei Stichproben, unterm Bruchstrich?

A

Da kommt nicht mehr der Standardfehler hin, wie bei der z-Transformation bzw. dem ein-Stichproben-t-Test, sondern die geschätzte Varianz der beiden Stichproben!!!

34
Q

Wie funktioniert der zwei-Stichproben-t-Test für unabhängige Stichproben?

A

FORMEL

man muss die Varianzschätzung noch machen (gepoolt oder nicht gepoolt)

35
Q

Was ist der Unterschied zwischen dem abhängigen und dem unabhängigen zwei-Stichproben-t-Test?

A

beim unabhängigen:
bei gleicher Stichprobenvarianz kann man die geschätzte Varianz poolen (überlegen: ja/nein)
beim abhängigen:
man kann die Varianz nie poolen

36
Q

Wie funktioniert der zwei-Stichproben-t-Test für abhängige Stichproben?

A
  1. rechne die Differenz für die Paare aus
  2. rechne den Mittelwert der Differenzen aus
  3. bei Annahme der H0 ist my0=0
  4. Standardfehler für die Mittelwertsdifferenz berechnen:
    Varianz der Differenzen berechnen
    Varianz durch n-1 und daraus Wurzel
    t-Test durchführen
    df ausrechnen
    mit kritischen Werten vergleichen
    FORMEL
    fertig
37
Q

Was ist der F-Test und was macht er?

A

überprüft, ob Varianzen in zwei Gruppen gleich sind

man rechnet mit der H1 und nicht wie beim t-Test mit der H0

38
Q

Wie funktioniert der F-Test?

A
  1. von Stichprobenvarianz s2 auf geschätzte Varianz der beiden Stichproben kommen (FORMEL)
  2. Freiheitsgrade bestimmen für jede der beiden Stichprobe
  3. F-Test durchführen (größerer Wert nach oben, kleinerer nach unten)
    FORMEL
  4. Tabelle angucken
    ACHTUNG BEI TABELLE
    kritische Werte von größerer Varianz stehen in den Spalten
    kritische Werte von kleinerer Varianz stehen in den Zeilen
39
Q

Was sind die Voraussetzungen für den F-Test?

A

Normalverteilung des Merkmals

bei großen Stichproben geht’s auch ohne Normalverteilung

40
Q

Was ist der Chi-Quadrat-Test und was macht er?

A

Test für Variablen auf Nominalskalenniveau
getestet werden Häufigkeitsunterschiede
vgl. empirische Verteilung und erwartete/ theoretische Verteilung

41
Q

Welche sind die kritischen Werte für den Chi-Quadrat-Test? (5% und 1%)

A

5% => 3,84
1% => 6,63
für ungerichtete Hypothesen
VERÄNDERN SICH IN ABHÄNGIGKEIT VON DEN FREIHEITSGRADEN

42
Q

Wie rechnet man von der Randverteilung ausgehend die erwartete Verteilung einer Zelle aus?

A

Zelle mal Spalte durch Gesamtzahl

43
Q

Wie geht man beim Chi-Quadrat-Test vor?

A
  1. beobachtete Häufigkeiten anschauen
  2. erwartete Häugikeiten ggf. ermitteln
  3. FORMEL einsetzen
  4. Freiheitsgrade berechnen
  5. Vergleich mit kritischen Werten
44
Q

Wie berechnet man die Freiheitsgrade für den Chi-Quadrat-Test, wenn man eine Kreuztabelle hat?

A

df = (J – 1) * (K – 1) = (2 – 1) * (2 – 1) = 1

45
Q

Was sollte man sich noch zum Chi-Quadrat-Test merken?

A

die erwarteten Häufigkeiten sollten pro Zelle mindestens 5 betragen
je mehr df desto größere kritische Werte
je mehr Zeilen und Spalaten, desto mehr df
einzelne Beobachtungen müssen voneinander unabhängig sein