Konfidenzintervalle Flashcards
1
Q
Konfidenzintervalle
A
Wahrscheinlichkeitsintervall um den Populationskennwert
- Zentraler Grenzwertsatz: Wenn ich aus einer Population wiederholt Stichproben ziehe, dann sind deren Kennwerte normalverteilt
- Ich kann also um den Populationskennwert ein Intervall bilden, in dem der Kennwert einer zufällig gezogenen Stichprobe mit einer bestimmten Wahrscheinlichkeit enthalten sein wird
- Diese Logik drehe ich nun um, um Konfidenzintervalle zu konstruieren …
- Konfidenzintervalle schätzen den Populationskennwert ausgehend vom Stichprobenkennwert. Das Intervall wird um den Stichprobenkennwert herum gebildet
Konfidenzintervall um den Stichprobenkennwert
- Mit einem Konfidenzintervall kann man KEINE Wahrscheinlichkeitsaussage über den wahren Populationskennwert machen (außer ich spreche von einem unbestimten Intervall ohne feste Grenzen)
- Man weiß nur eines: Wenn man unendlich viele Stichproben aus derselben Population zieht und anschließend 90%-Konfidenzintervalle konstruiert, dann enthalten 90% dieser Intervalle den wahren Populationskennwert
- Das Konfidenzintervall, das ich auf Grundlage meiner einen Stichprobe konstruiert habe, ist also zu 90% eines der “richtigen” Intervalle und enthält dann den wahren Populationswert mit Wahrscheinlichkeit 1. Zu 10% ist es eines der “falschen” Intervalle und enthält dann den wahren Populationswert mit Wahrscheinlichkeit 0.
- Je höher die Konfidenz, desto weiter wird das Intervall. Ein 95%-Konfidenzintervall ist weiter als ein 90%-Konfidenzintervall.
- Konvention: 90% und 95% Konfidenzintervalle. 100% sind zwecklos, denn dann deckt das Intervall den gesamten Wertebereich ab und sagt nichts informatives mehr aus (trivial). 50% wären auch nicht gut, weil zu unsicher, zu geringe Aussagekraft.
2
Q
Vorgehensweise bei der Konstruktion von Konfidenzintervallen
A
- Stichprobe ziehen und Stichprobenkennwerte berechnen.
- Der Stichprobenanteil/-mittelwert wird als Schätzung für den Populationsanteil/-mittelwert benutzt und die Stichprobenvarianz ist die Grundlage für die Schätzung der Populationsvarianz: Die Summe der Abweichungsquadrate wird dabei durch n-1 und nicht durch n geteilt, um einer Unterschätzung entgegenzuwirken.
- Die geschätzte Populationsvarianz wiederum ist die Grundlage für die Schätzung des Standardfehlers der Stichprobenverteilung. Der Standardfehler ist die Wurzel aus der geschätzten Populationsvarianz
- In der z-Verteilung / t-Verteilung die passenden Werte für die gewünschte Höhe der Konfidenz bestimmen.
3
Q
Konfidenzintervalle für Anteile vs Mittelwerte
A
Konfidenzintervalle für Anteile
- man nimmt die z-Verteilung
Konfidenzintervalle für Mittelwerte
- die z-Verteilung versagt hier
- stattdessen nimmt man die t-Verteilung, denn sie liefert für kleine Stichprobengrößen genauere Ergebnisse
- William Gosset, ein Brauereiangestellter, entwickelte 1908 die t-Verteilung, um mit kleinen Stichproben aus Gerstenlieferungen die Qualität der Gerste beurteilen zu können
- Im Unterschied zur z-Verteilung ist die t-Verteilung abhängig von der Stichprobengröße (für n gegen unendlich geht die t-Verteilung in die z-Verteilung über). Allerdings rechnet man nicht mit n selbst, sondern mit Freiheitsgraden
4
Q
Konfidenzintervalle für Mittelwertsunterschiede - unabhängige vs abhängige Messung
A
Konfidenzintervalle für Mittelwertsunterschiede - unabhängige Messung
- z.B. Vergleich zweier Stichproben womöglich unterschiedlicher Größe; between-subjects-design
- Vorgehen: Die Populationsvarianzen beider Stichproben jeweils einzeln bestimmen. Dann aber den Standardfehler der Differenz schätzen (Formel: S.344)
Konfidenzintervalle für Mittelwertsunterschiede - abhängige Messung
- within-subjects-design. Die beiden Messwertpaare korrelieren häufig und n ist bei beiden Stichproben gleich groß
- Vorgehen: für jedes einzelne Wertepaar die Differenz bilden und einfach mit dieser soeben konstruierten dritten Variable ganz normal losrechnen
- wenn die Messwertpaare positiv korrelieren → gemeinsamer Standardfehler wird kleiner → Konfidenzintervall wird kleiner als bei unabhängiger Messung → präzisere Schätzung
- wenn die Messwertpaare negativ korrelieren → … → grobere Schätzung