Sitzung 11: Logik des statistischen Schätzens und Testens Flashcards
Überblick Notation: Grundgesamtheit vs. Stichprobe
A) Anzahl der Fälle
B) Anteil von diskreter Variable
A) Grundgesamtheit: N, Stichprobe: n
B) Grundgesamtheit: P, Stichprobe: p
Überblick Notation: Grundgesamtheit vs. Stichprobe
A) Mittelwert
B) Standardabweichung
C) Varianz
A) Grundgesamtheit: μ, Stichprobe: x(Strich)
B) Grundgesamtheit: σ, Stichprobe: S
C) Grundgesamtheit: σ^2, Stichprobe: S^2
Notation:
A) Standardfehler des Schätzers (bei Anteilswert)
B) Standardfehler des Schätzers des Mittelwerts
C) Mittelwert der Stichprobenverteilung (bei Anteilswert)
D) Mittelwert der Stichprobenverteilung (bei Mittelwerten)
A) σP
B) σx (Strich)
C) μP
D) μX (Strich)
„^“ über einem Symbol
Es handelt sich um eine Schätzung auf Basis einer Stichprobe
Was ist die Wahrscheinlichkeitstheorie?
Bei Zufallsstichproben kann über diese angegeben werden, mit welchen Verzerrungen zu rechnen ist.
Über die Wahrscheinlichkeitstheorie kann die Verteilung der Anteilswerte bestimmt werden.
Als was bezeichnet man Schätzen und Testen?
Als induktive, schließende oder Inferenzstatistik.
Diese Methoden benötigen Zufallsstichproben!
Was ist ein Konfidenzintervall (KI)?
Intervall um die Punktschätzer innerhalb dessen mit einer bestimmten Sicherheit davon auszugehen ist, dass dort der wahre Anteilswert liegt.
Vertrauenswahrscheinlichkeit
= Sicherheit, mit der man eine Aussage treffen möchte
→ Je größer die angestrebte Vertrauenswahrscheinlichkeit, desto breiter das Kondenzintervall (d.h. ungenauer die Schätzung)
KIB
Breite des Konfidenzintervalls
Wie soll ein Schätzer sein?
erwartungstreu, konsistent und effizient
Erwartungstreue
wenn im Durchschnitt (bei wiederholter Zufallsstichprobe) der Wert der Grundgesamtheit richtig geschätzt wird
Konsistenz
wenn mit wachsendem Stichprobenumfang sich der Kennwert der Stichprobe immer mehr dem wahren Parameter in der Grundgesamtheit annähert.
Effizienz
wenn die Schätzungen (bei wiederholter Zufallsstichprobe) um den arithmetischen Mittelwert so gering streuen, dass kein anderer Schätzer eine geringere Streuung aufweist.
Zentrales Grenzwerttheorem
Nach diesem sind die Mittelwerte der Stichproben normalverteilt
Erwartungswert der Stichprobenmittelwerte
Entspricht dem Mittelwert der Grundgesamtheit
Standardabweichung der Stichprobenmittelwerte = ….
Standardfehler des Schätzers des Mittelwerts
α-Fehler
Dieser gibt die Wahrscheinlichkeit an, dass der Test H0 ablehnt, obwohl H0 eigentlich wahr ist.
β-Fehler
Dieser gibt die Wahrscheinlich an, dass der Test H1 ablehnt, obwohl H1 eigentlich wahr ist.
Spezifität
Diese gibt die Wahrscheinlichkeit an, das der Test H0 annimmt und dies auch in Wirklichkeit so ist.
(=1−α)
Sensitivität
Diese gibt die Wahrscheinlichkeit dass der Test H1 annimmt und das in Wirklichkeit auch so ist.
(= 1 − β )
Wie viele Fehler kann man begehen?
Immer nur einen, je nachdem ob man die H0 im Test annimmt oder ablehnt.
Schritte von statistischen Tests
- Formulierung der inhaltlich interessierenden Hypothese H1(oder Alternativhypothese)
- Formulierung der Nullhypothese H0
- Auswahl des geeigneten statistischen Testverfahrens (und Konstruktion der Teststatistik)
- Festlegung des Signikanzniveaus
- Festlegung des Ablehnungsbereichs der Nullhypothese (einseitiger oder zweiseitiger Test)
- Berechnung der Teststatistik und Beurteilung von H0 und H1
Was ist ein einseitiger Test?
- eine gerichtete Hypothese
- Bsp.: Alternativhypothese (H1): A hat die Wahl mit absoluter Mehrheit gewonnen, d.h. mehr als 50% der Stimmen erhalten [PA > 0, 5]
Was ist ein zweiseitiger Test?
- eine ungerichtete Hypothese
- Bsp.: Alternativhypothese (H1): A hat einen von B verschiedenen Stimmenanteil [PA ̸= PB ].
Warum formuliert man überhaupt eine H0?
Um auszuschließen, dass der Unterschied in der Stichprobe nur durch zufällige Schwankungen zustande gekommen ist.
Teststatistik
In einer Teststatistik fasst man diejenigen Charakteristika der Beobachtungsdaten zusammen die unsere Fragestellung ausmachen und wählt entsprechend ein geeignetes Testverfahren:
Arten von Testverfahren
- Differenz von beobachteten Anteilen zu Anteilswerten, die unter Zufallsbedingungen auftreten würden → z-Verteilung
- Differenz von Stichprobenmittelwert zu einem theoretisch unter Zufallsbedingungen erwarteten Mittelwert → z-Verteilung
- Differenz von zwei Stichprobenmittelwerten → t-Verteilung
Was sind in den Sozialwissenschaften gebräuchliche Signifikanzniveaus?
Von 10, 5, oder 1 %
Z-Test des Mittelwerts
Man kann überprüfen, ob der Mittelwert einer Zufallsstichprobe x Strich aus einer Grundgesamtheit mit Mittelwert μ kommen kann.
Letztlich wird also getestet, ob x Strich sich signikant von μ unterscheidet.
T-Test auf Mittelwertunterschiede
Vergleicht Mittelwerte verschiedener Gruppen (es gibt 3 Varianten)
- t-Test für unabhängige Stichproben mit unterschiedlichen Standardabweichungen in den Stichproben (S1 ̸= S2)
- t-Test für unabhängige Stichproben mit konstanter Standardabweichung in den Stichproben (S1 = S2)
- t-Test für abhängige Stichproben
Signifikanz Alpha
Irrtumswahrscheinlichkeit der Testentscheidung entspricht alpha Fehler
Tritt ein, wenn H0 zu UNrecht abgelehnt wird
Signifikanz eines Zusammenhangs
Wahrscheinlichkeit, mit der ein vermuteter Zusammenhang (Korrelation) auch in Wirklichkeit besteht
Empirischer Wert ist größer
H0 wird abgelehnt, H1 beibehalten, signifikant
Empirischer Wert ist kleiner
H0 wird beibehalten, H1 wird abgelehnt, nicht signifikant
Vervierfachung des Stichprobenumfangs entspricht ……….. des Kondenzintervalls
Halbierung