6. Grundlagen Inferenzstatistik I: Parameterschätzung (fl) Flashcards
Welche Kennwerte zur Beschreibung der Verteilung von Merkmalen gibt es?
Nenne die jeweiligen Bezeichnungen für
Arithmetisches Mittel, Standartabweichung und Korrelation
- Parameter (wahre Wert)
-
Stichprobenkennerwerte
(statistische Masszahlen, Statistiken)-
Arithmetisches Mittel
Parameter = mü Stichprob. = M, xmit Dach - Standartabweichung
Parameter = ó (sigma) Stichprob. = s -
Korrelation
Parameter = *p * Stichprob. = r
-
Arithmetisches Mittel
Erkläre die Parameterschätzung und dessen Gütekritieren (4)
Aufgabe der Inferrenzstatistik ist es, die Verteilungswerte der Population (Parameter) aus den Verteilungskennwerten einer Stichtprobe zu schätzen.
Verteilungswerte / Stichprobenkennwerte => Statistiken
Gütekriterien
- Erwartungstreue
- Konstistenz
- Effizienz
- Erschöpftheit
Nenne die Typen (5) der Stichprobe
- Einfache Zufallsstichprobe
Alle n haben gleiche Wahrscheinlichkeit, gezogen zu werden. - Geschichtete Zusfallsstichprobe
- Disjunkte & exhaustive Zerlegung einer Population in unters. Schichten
- Zufallsstichprobe aus jeder Schicht -> Alle Merkmale vorhanden - Klumpenstichprobe
* *Umfasst alle Elemente** zufällig ausgewählter Klumpen einer Population - Mehrstufige Auswahlverfahren
- Schachtelung der Populationselemente in verschiedenen Ebenen
- Sukzessive Stichprobenziehung aus verschiedenen Ebenen z.B Ziehung innerhalbt in der Uni -> Studiengänge -> VL - Einzelstichprobe
Wie repräsentativ sind Stichproben?
Erkläre den Stichprobenfehler und systematischer Fehler
- Zufallsstichprobe sind repräsentative Stichproben
- Repräsentativ: Durch Zufallsauswahl aus Grundgesamtheit entstanden
-
Stichprobenfehler sampling error
- Stichprobenkennwerte weichen von Populationsparameter trotz Zufälliger Ziehung ab
-
Systematischer Fehler nonsampling error
- Keine Zufallsauswahl, Stichprobe liegt andere Population als die intendierte Population zugrunde (nicht repräsentativ!)
- z.b durch Teilnahmeverweigerung
Beschreibe die Parameterschätzung
- Schätzung der Population anhand Stichprobenkennwert
- Stichprobenkennwertverteilung
= Aus einer Stichprobe werden mehrere Stichproben gezogen
Wie verhalten sich kleine und grosse Stichproben in Bezug auf die empirischen Ermittlung einer Stichprobenkennwerteverteilung?
- kleine Stichproben -> Keine gute Schätzung (Variabilität ist grösser)
- grosse Stichproben -> Gute Schätzung (näher am Mittelwert)
Je grösser die Stichprobe, desto kleiner der Standardfehler!
⇒ Je grösser n, desto steiler ist die Verteilung
Nenne die Bezeichungen des Standardfehlers

Was ist der zetrale Grenzwertsatz?
Die Stichprobenkennwerteverteilung der Mittelwerte nähert sich mit zunehmender Grösse der Normalverteilung an, unabhängig davon, wie das Merkmal der Population verteilt ist.
Ab n 30 bei Gleichverteilung geht der Stichprobenkennwert in die Normalverteilung über.
Erwartungstreue der Parameterschätzung. Erkläre
Nenne einen erwartungstreuen und einen erwartungsuntreuen Schätzer.
Stichprobenkennwert schätzt einen Parameter (Populationskennwert) erwartungstreu, wenn der Strichprobenkennwerteverteilung dem Parameter entspricht.
Je mehr Stichproben gezogen werden, desto näher am wahren Parameter -> Erwartungswert
ein erwartungstreuer Schätzer wäre bspw. Der Stichprobenmittelwert für den Populationsmittelwert ⇒ E(Xquer) = µ
ein erwartungsuntreuer Schätzert wäre bspw. die empirische Varianz für die Populationsvarianz ⇒ E(S2x) ≠ σ2x
Was bedeutet “Konsistenz” im Zusammenhang mit der Parameterschätzung?
Stichprobenkennwerte schätz einen Parameter (Populationskennwert) konstistenz, wenn er sich mit wachsender Stichprobengrösse dem Parameter nähert.
Erkläre Exhaustivität (Suffizienz) in Bezug auf die Parameterschätzung?
Schätzwert ist exhaustiv (suffizient, erschöpfend), wenn er alle in den Daten erhaltenen Informationen berücksichtigt, so dass durch die Berechnung einer weitere Statistik keine zusätzlichen Informationene über den Parameter gewonnen werden kann.
Erkläre “Effizient” in Bezug auf die Paramterschätzung
Stichprobenkennwert schätzt einen Parameter (Populationskennwert) effizient, wenn er den geringsten Standardfehler aller erwartungsteuen Schätzer aufweist.
- Bei normalverteilten Varbiabeln kann der Populationsmittelwert mit dem
- Stichprobenmittelwert
- Stichprobenmedian
- erwartungstreu und konstistent geschätzt werden
- Die Schätzung mittels des Stichprobenmittelwerts ist effizienter
Definiere die Intervallsschätzung in Bezug auf die Parameterschätung.
Bestimmung des Bereichs (Intervall) um den geschätzen Populationsparameter, in dem der wahre Populationsparameter mit hoher Sicherheit liegt.
Was ist der Kofidenzintervall (Vertrauensintervall) bei der Parameterschätzung?
Bezeichnet den Bereich um einen geschätzen Populationsparameter, für den gilt, dass er mit einer Wahrscheinlichkeit von 1 - alpha den Populationsparameter überdeckt.
Welche Parameter haben Einfluss auf das Konfidenzinteravall?
Eine Stichprobe x hat mit der Wahrscheinlichkeit p einen Mittelwert im Intervall zwischen:
Arithmethisches Mittel der Stichprobenkennwerte +/- (der Standartfehler der Mittelwerts * Z-Wert der Standardnormalverteilung
=> Somit haben Standartfehler und der entsprechende Z-Wert Einfluss.
Wenn wir ein Konfidenzintervall mit der Wahrscheinlichkeit von 95% berechnen wollen. Welchen z-Wert der Standardnormalverteilung müssen wir ablesen um den Zp -Wert für unsere berechnung zu erhalten?
beim z-Wert bei 0.975, da ein Intervall berechnet wird.
0.950 = 0.975 - ( 1 - 0.975)
Welche Eigenschaften hat das Konfidenzintervall?
Was verteht man unter dem Konfidenzkoeffizent (Überdeckungswahrscheinlichkeit)?
Allgemein wir wird der Konfidenzkoeffizient für ein Konfidenzintervall definiert (mit was hängt er direkt zusammen)?
- Bestimmung des Bereichs um den geschätzten Populationsparameter, in dem der wahre Populationsparameter mit Wahrscheinlichkeit p liegt. (liegt also nicht immer drin!!)
- is die Wahrscheinlichkeit, ddass ein beliebiges Intervall zu denjenigen zählt, die den wahren Populationsparameter enthalten (“überdecken”).
Allgemein: p = (1-alpha)*100 - Konfidenzintervall x-Strich +/- z(alpha/2) * Stichprobenfehler
=> hängt also direkt von alpha ab!
- Welche Eigenschaft hat die Students t Verteilung, was misst er?
- Was ist ein Freiheitsgrad?
- Wieviele Komponenten gehen in eine Berechnung ein und wieviele können frei variiert werden?
- Schätzung des Standardfehlers des Mittelwerts aus den Stichproben bei unbekannter Populationsvarian
- je grösser Freiheitsgrad, desto näher ist sie an der Normalverteilung
- auch “degree of freedom (df) entsprechen einer Prüfgrösse der Anzahl der Komponenten dieser Grösse, die frei variieren.
- in eine Berechnung gehen n+2 Komponenten ein. Wobei aber Anzahl der Messwerte und der Mittelwert aus den n individuellen messwerten festgelegt ist. Der n-1te Messwert kann aus den anderen Messwerten abgeleitet werden, da die Summe der Abweichungen vom Mittelwert = 0 sein muss!
Erkläre das Konzept der Nullhypothese:
- Wann sind Ergebnisse signifikantund wie wird es angegeben?
- Was ist das Signifikantsniveau ?
- wenn der Wert der statistischen Kenngrösse in einen vorher festgelegten Bereich fällt, der am stärksten gegen die Nullhypothese spricht. Konvention ist <5%!
- Wird in Überschreitungswahrscheinlichkeit p angegeben -> Wahrscheinlichkeit, dass das gefundene Ergebnis oder noch ein stärker gegen die Nullhypothese sprechendes Ereignis unter Gültigkeit der Nullhypothese zu finden.
- = festgelegte Grenze der Wahrscheinlichkeit.
Wie wird zwischen Alternativhypothese und Nullhypothese unterschieden?
Entspricht dem binären Entscheidungskonzept nach Neyman und Pearson.
- Alternativhypothese:
- Bsp. Die Person (bzw. Stichprobe) stammt aus einer Population mit einem Mittelwert von µ < 50
- allgemein: H1: µ1 > µ0
- Nullhypothese:
- Die Person (bzw. Stichprobe) stammt aus einer Population mit einem Mittelwert von µ <= 50
- allgemein H0: µ <= µ0
Somit gilt** µ1 != µ0** und (** µ1 und µ0) decken die gesammte Population ab**!
Beschreibe die Art und Wahrscheinlichkeit richtiger und falscher Entscheidungen beim statistischen Testen.
Statistische Eintscheidung
Realität
H0ist wahr
H1 ist falsch
Realität
H0ist falsch
H1ist wahr
H0wird verworfen
H1 wird beibehalten
Fehler erster Art
( α )
richtige Entscheidung
(1- β)
H0beibbehalten
H1 verworfen
richtige Entscheidung
(1- α)
Fehler zweiter Art
( β)
Beschreibe den Fehler erster Art ( α )
Die Irrtumswahrscheinlichkeit (α) ist die Wahrscheinlichkeit, mit der ein Test ein signifikantes Ergebnis produziert, obwohl in Wirklichkeit die H0 gilt.
Beschreibe den Fehler zweiter Art
Um die β-Fehlerwahrscheinlichkeit bestimmen zu können, muss in der Alternativenhypothese genau spezifisiert werden, wie gross der Unterschied/Zusammenhang ist. (spezifische Hypothese)
Die Irrtumswahrscheinlichkeit beta ist die Wahrscheinlichkeit, mit der ein statistischer Test ein nicht- signifikantes Ereignis produziert, obwohl in Wirklichkeit die H1 gilt.
Was versteht man unter der Teststärke (Power) ?
Von was hängt die Teststärke (Power) ab?
- 1 - β ist die Wahrscheinlichkeit, mit der ein Test ein signifikantes Ergebnis produziert, unter der Annahme, dass ein Effekt einer bestimmten (hypothetischen festlegung) Grösse tatsächlich existiert.
- β und (1-β) hängen ab von:
- Effektgrösse
- Signifikanzniveau α
- Streuung der Populationsmerkmalsverteilung
- Stichprobengrösse
- Art des Tests (einseitig vs. zweiseitig)
Was gilt allgemein für einseitige/zweiseitige Tests?
- Nenne Zusammenhänge zwishen β und der Grösse des Effekts.
- Nenne Zusammenhänge zwishen β und Signifikanzniveau α.
- Nenne Zusammenhänge zwishen β und der Streuung der Populationsverteilung
- Nenne Zusammenhänge zwishen β und des Stichprobenumfangs
Sie ist bei einem einseitigen Test grösser als bei einem zweiseitigen Test.
- Je grösser ε, desto kleiner β
- je grösser α, desto grösser β
- je kleiner die Merkmalstreuungsverteilung, je Steiler die Verteilung, desto kleiner ist β
- je grösser n, desto grösser β
Welche Hypothese braucht man um den α Fehler zu bestimmen und welche für den β -Fehler?
- α-Fehler = braucht nur H0 Hypothese
- β -Fehler = braucht zusätzlich eine /zwei sezifische Hypothese
Führe einen vergleich eines Stichprobenmittelweres mit einem Populationsmittelwert bei bekannter Populationsvarianz durch. Was fällt auf?
Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert bei bekannter Populationsvarianz
Einstichproben-Gauss-Test
zemp= 3.58
zkrit(1) = -1.96
zkrit(2) = +1.96
zemp<= zkrit(1)
zemp>=zkrit(2)
Einstichproben-t-Test
temp= 3.25
tkrit(1) = -2.09
tkrit(2) =+2.09
temp<= tkrit(1)
temp>=tkrit(2)
wobei der geschätzte Stichprobenmittelwet bei 2.46 liegen würde.
was ist die Eigenschaft eines p-Werts in einem zweiseitigen Test?
- Wahrscheinlichkeit,unter H0 den beobachteten Prüfgrössenwert oder einen (in Richtung Alternative) noch extremeren Ert zu erhalten .
- Bezieht sich auf Betrag der Prüfgrösse
- Gleicher Wert der Prüfgrösse geht beim zweiseitigen Test - im Vergleich zum einseitigen Test - mit doppeltem p-Wert einher.
- Einseitiger Test hat mehr Power!