6. Grundlagen Inferenzstatistik I: Parameterschätzung (fl) Flashcards
Welche Kennwerte zur Beschreibung der Verteilung von Merkmalen gibt es?
Nenne die jeweiligen Bezeichnungen für
Arithmetisches Mittel, Standartabweichung und Korrelation
- Parameter (wahre Wert)
-
Stichprobenkennerwerte
(statistische Masszahlen, Statistiken)-
Arithmetisches Mittel
Parameter = mü Stichprob. = M, xmit Dach - Standartabweichung
Parameter = ó (sigma) Stichprob. = s -
Korrelation
Parameter = *p * Stichprob. = r
-
Arithmetisches Mittel
Erkläre die Parameterschätzung und dessen Gütekritieren (4)
Aufgabe der Inferrenzstatistik ist es, die Verteilungswerte der Population (Parameter) aus den Verteilungskennwerten einer Stichtprobe zu schätzen.
Verteilungswerte / Stichprobenkennwerte => Statistiken
Gütekriterien
- Erwartungstreue
- Konstistenz
- Effizienz
- Erschöpftheit
Nenne die Typen (5) der Stichprobe
- Einfache Zufallsstichprobe
Alle n haben gleiche Wahrscheinlichkeit, gezogen zu werden. - Geschichtete Zusfallsstichprobe
- Disjunkte & exhaustive Zerlegung einer Population in unters. Schichten
- Zufallsstichprobe aus jeder Schicht -> Alle Merkmale vorhanden - Klumpenstichprobe
* *Umfasst alle Elemente** zufällig ausgewählter Klumpen einer Population - Mehrstufige Auswahlverfahren
- Schachtelung der Populationselemente in verschiedenen Ebenen
- Sukzessive Stichprobenziehung aus verschiedenen Ebenen z.B Ziehung innerhalbt in der Uni -> Studiengänge -> VL - Einzelstichprobe
Wie repräsentativ sind Stichproben?
Erkläre den Stichprobenfehler und systematischer Fehler
- Zufallsstichprobe sind repräsentative Stichproben
- Repräsentativ: Durch Zufallsauswahl aus Grundgesamtheit entstanden
-
Stichprobenfehler sampling error
- Stichprobenkennwerte weichen von Populationsparameter trotz Zufälliger Ziehung ab
-
Systematischer Fehler nonsampling error
- Keine Zufallsauswahl, Stichprobe liegt andere Population als die intendierte Population zugrunde (nicht repräsentativ!)
- z.b durch Teilnahmeverweigerung
Beschreibe die Parameterschätzung
- Schätzung der Population anhand Stichprobenkennwert
- Stichprobenkennwertverteilung
= Aus einer Stichprobe werden mehrere Stichproben gezogen
Wie verhalten sich kleine und grosse Stichproben in Bezug auf die empirischen Ermittlung einer Stichprobenkennwerteverteilung?
- kleine Stichproben -> Keine gute Schätzung (Variabilität ist grösser)
- grosse Stichproben -> Gute Schätzung (näher am Mittelwert)
Je grösser die Stichprobe, desto kleiner der Standardfehler!
⇒ Je grösser n, desto steiler ist die Verteilung
Nenne die Bezeichungen des Standardfehlers
Was ist der zetrale Grenzwertsatz?
Die Stichprobenkennwerteverteilung der Mittelwerte nähert sich mit zunehmender Grösse der Normalverteilung an, unabhängig davon, wie das Merkmal der Population verteilt ist.
Ab n 30 bei Gleichverteilung geht der Stichprobenkennwert in die Normalverteilung über.
Erwartungstreue der Parameterschätzung. Erkläre
Nenne einen erwartungstreuen und einen erwartungsuntreuen Schätzer.
Stichprobenkennwert schätzt einen Parameter (Populationskennwert) erwartungstreu, wenn der Strichprobenkennwerteverteilung dem Parameter entspricht.
Je mehr Stichproben gezogen werden, desto näher am wahren Parameter -> Erwartungswert
ein erwartungstreuer Schätzer wäre bspw. Der Stichprobenmittelwert für den Populationsmittelwert ⇒ E(Xquer) = µ
ein erwartungsuntreuer Schätzert wäre bspw. die empirische Varianz für die Populationsvarianz ⇒ E(S2x) ≠ σ2x
Was bedeutet “Konsistenz” im Zusammenhang mit der Parameterschätzung?
Stichprobenkennwerte schätz einen Parameter (Populationskennwert) konstistenz, wenn er sich mit wachsender Stichprobengrösse dem Parameter nähert.
Erkläre Exhaustivität (Suffizienz) in Bezug auf die Parameterschätzung?
Schätzwert ist exhaustiv (suffizient, erschöpfend), wenn er alle in den Daten erhaltenen Informationen berücksichtigt, so dass durch die Berechnung einer weitere Statistik keine zusätzlichen Informationene über den Parameter gewonnen werden kann.
Erkläre “Effizient” in Bezug auf die Paramterschätzung
Stichprobenkennwert schätzt einen Parameter (Populationskennwert) effizient, wenn er den geringsten Standardfehler aller erwartungsteuen Schätzer aufweist.
- Bei normalverteilten Varbiabeln kann der Populationsmittelwert mit dem
- Stichprobenmittelwert
- Stichprobenmedian
- erwartungstreu und konstistent geschätzt werden
- Die Schätzung mittels des Stichprobenmittelwerts ist effizienter
Definiere die Intervallsschätzung in Bezug auf die Parameterschätung.
Bestimmung des Bereichs (Intervall) um den geschätzen Populationsparameter, in dem der wahre Populationsparameter mit hoher Sicherheit liegt.
Was ist der Kofidenzintervall (Vertrauensintervall) bei der Parameterschätzung?
Bezeichnet den Bereich um einen geschätzen Populationsparameter, für den gilt, dass er mit einer Wahrscheinlichkeit von 1 - alpha den Populationsparameter überdeckt.
Welche Parameter haben Einfluss auf das Konfidenzinteravall?
Eine Stichprobe x hat mit der Wahrscheinlichkeit p einen Mittelwert im Intervall zwischen:
Arithmethisches Mittel der Stichprobenkennwerte +/- (der Standartfehler der Mittelwerts * Z-Wert der Standardnormalverteilung
=> Somit haben Standartfehler und der entsprechende Z-Wert Einfluss.