Parameterschätzung&Konfidenzintervalle Flashcards
Population
Grundgesamtheit
Stichprobe
Teilmenge der Grundgesamtheit
Standardabweichung Population
sigma
Korrelation Population
ro
Arithmetisches Mittel Population
mü
Arithmetisches Mittel Stichprobe
M oder x strich
standardabweichung Stichprobe
s
Korrelation Stichprobe
r
Endliche (finite) Population
Umfang ist bekannt und endlich
Zusammensetzung ändert sich durch das Ziehen eines Elements
Unendliche (infinite) Population
Zusammensetzung ändert sich durch das Ziehen eines Elementes nicht (z. B. Ziehen mit
Zurücklegen)
Was setzen die Interferenzstatistischen Verfahren voraus?
unendliche Populationen
Wann ist es unproblematisch statistische Verfahren für unendliche Stichproben zu verwenden, obwohl streng genommen alle finit sind?
Die Stichprobe muss maximal 5% der Population umfasst
Konkrete Population
Elemente sind klar identifizierbar.
Beispiel: Population der an deutschen Hochschulen tätigen Professoren
Fiktive Populationen
Elemente sind nicht eindeutig identifizierbar.
Beispiel: Vergleich der Depressivität von Personen, die sich zwei verschiedenen
Behandlungsmethoden unterzogen haben
Die zugrunde gelegte Population ist die Menge aller Personen, die sich einer solchen Behandlung unterzogen haben könnten (dies ist eine infinite, nicht konkrete Population)
Einfache Zufallsstichprobe
Alle möglichen Stichproben der Größe n haben die gleiche Wahrscheinlichkeit, gezogen zu werden
Geschichtete Zufallsstichproben
Disjunkte und exhaustive Zerlegung einer Population in unterschiedliche Schichten
▪ Zufallsstichprobe aus jeder Schicht
Klumpenstichprobe
Umfasst alle Elemente zufällig ausgewählter Klumpen einer Population
Mehrstufige Auswahlverfahren
Schachtelung der Populationselemente in verschiedene Ebenen Sukzessive Stichprobenziehung aus verschiedenen Ebenen
Einzelfall
mehrfache Befragung einer Person
Repräsentativität
bedeutet „durch Zufallsauswahl aus der Grundgesamtheit entstanden“
Stichprobenfehler (Sampling error)
Stichprobenkennwerte weichen von Populationsparametern trotz zufälliger Ziehung ab.
Systematischer Fehler (nonsampling error)
Keine Zufallsauswahl, Stichprobe liegt andere Population als die intendierte Population
zugrunde (nichtrepräsentative Stichprobe)
▪ Beispielsweise durch Teilnahmeverweigerung
Stichprobenkennwerteverteilung
die Verteilung der Kennwerte von wiederholten Stichprobenziehungen aus der gleichen Population)
Was ist der Standardfehler?
Die Streuung der Mittelwerte
(Standardfehler des Mittelwerts)
sigma x strich
(Standardfehler der Varianz)
sigma s Quadrat
(Standardfehler der Standardabweichung)
sigma s
Wovon ist der Standardfehler abhängig?
Populationsstandardabweichung und große der Stichprobe
Was passiert mit größerer Stichprobengröße mit dem standardfehler?
wird kleiner
Zentraler Grenzwertsatz
die Stichprobenkennwertverteilung von stichprobenmittelwerten aus Stichproben nähert sich der Größe n mit zunehmendem n einer Normalverteilung an, unabhängig davon wie das Merkmal in der Population verteilt ist.
Voraussetzung dabei : die einzelnen Stichproben wurden unabhängig voneinander gezogen und die Population im Vergleich zu den Stichproben sehr groß ist.
Punktschätzung / Parameterschätzung
Ziel, den Parameter möglichst genau zu treffen. Das Ziel ist also die „gute“ Schätzung.
Beispiel: Schätzung des Mittelwerts und der Varianz einer Normalverteilung (z.B. Intelligenz)
Was sind erwartungstreue Schätzungen?
Stichprobenmittelwert
Stichprobenvarianz
Was sind keine erwartungstreuen Schätzungen?
Empirische Varianz
Was unterschätzt die empirische Varianz?
die Populationsvarianz systematisch um die Varianz der Mittelwerte.
Wann heißt eine Statistik Konsistent?
wenn sie mit wachsender stichpürobengröße stochastisch gegen den Parameter konvergiert.Die WSK dass die Statistik beliebig nahe an dem Parameter liegt,strebt mit wachsender Stichprobengröße gegen 1
Was sind konsistente Schätzer?
Stichprobenmittelwert Empirische Varianz
Wann ist die Schätzung eines Populationsparameters effizient?
wenn sie den geringsten Standard
Wann ist eine Statistik suffizient (erschöpfend oder exhaustiv)?
wenn sie alle in den Daten enthaltenen Informationen nutzt, sodass die Berechnung einer weiteren Statistik keine zusätzliche Info über den Parameter enthält.
Beispiele für suffizients?
Zwar ist der Median bei symmetrischen Verteilungen ein erwartungstreuer Schätzer des Populationsmittelwertes, er ist aber nicht suffizient, da er die nicht alle Informationen aus den Daten nutzt (er nutzt nur Informationen zu Rangunterschieden, nicht aber zu Messwertdifferenzen).
Der Stichprobenmittelwert ist suffizient.
Intervallschätzung
Bestimmung des Bereichs (Intervalls)
um den geschätzten Populationsparameter, in dem
der wahre
Populationsparameter mit hoher Sicherheit liegt.
Was bezeichnet das Konfidenzintervall 1- alpha
bezeichnet den Bereich um einen geschätzten Populationsparameter, fü den gilt, dass er mit einer WSK von 1- alpha den Populationsparameter überdeckt
was macht man, wenn die Populationsvarianz bekannt ist?
Eigenschaften der Normalverteilung
zu Nutze. Im Bereich von ±1,96 ∗ 𝜎 𝑋ത
herum liegen 95% der Werte.
Wo liegt der individuelle Stichprobenmittelwert mit einer WSK von 95%
Konfidenzintervall
Eigenschaften des Konfidenzintervalls
Ein Konfidenzintervall enthält entweder den unbekannten Populationsparameter oder nicht.
❖Wir wissen nicht, ob ein bestimmtes Konfidenzintervall den Parameter enthält oder nicht.
❖Der Konfidenzkoeffizient (Überdeckungswahrscheinlichkeit) ist die Wahrscheinlichkeit, dass ein beliebiges Intervall zu denjenigen zählt, die den wahren Populationsparameter enthalten („überdecken“).
Was besagt eine KI von bsp95 %
wenn man (unendlich) viele Zufallsstichproben gleicher Größe aus der Population ziehen würde und ▪ für jede Stichprobe das Konfidenzintervall berechnen würde, ▪ in 95 % aller Konfidenzintervalle der unbekannte Populationsparameter zu finden ist, ▪ in 5 % der Konfidenzintervalle hingegen nicht.
Ab wann KI?
Normalverteilung der Stichprobenkennwerteverteilung ❖ Populationsvarianz ist bekannt
Was muss man machen, wenn die Populationsvarianz unbekannt ist?
Populationsvarianz muss aus den Stichprobendaten geschätzt werden.
Was sind Freiheitsgerade?
sind die Anzahl der Komponenten bei der Schätzung eines Parameters, die frei variieren können
Wie berechnet man die Freiheitsgerade?
n-1