6. Grundlagen Inferenzstatistik I: Parameterschätzung (fl) Flashcards

1
Q

Welche Kennwerte zur Beschreibung der Verteilung von Merkmalen gibt es?

Nenne die jeweiligen Bezeichnungen für

Arithmetisches Mittel, Standartabweichung und Korrelation

A
  • Parameter (wahre Wert)
  • Stichprobenkennerwerte
    (statistische Masszahlen, Statistiken)
    • Arithmetisches Mittel
      Parameter = mü Stichprob. = M, xmit Dach
    • Standartabweichung
      Parameter = ó (sigma) Stichprob. = s
    • Korrelation
      Parameter = *p * Stichprob. = r
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Erkläre die Parameterschätzung und dessen Gütekritieren (4)

A

Aufgabe der Inferrenzstatistik ist es, die Verteilungswerte der Population (Parameter) aus den Verteilungskennwerten einer Stichtprobe zu schätzen.
Verteilungswerte / Stichprobenkennwerte => Statistiken

Gütekriterien

  • Erwartungstreue
  • Konstistenz
  • Effizienz
  • Erschöpftheit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nenne die Typen (5) der Stichprobe

A
  1. Einfache Zufallsstichprobe
    Alle n haben gleiche Wahrscheinlichkeit, gezogen zu werden.
  2. Geschichtete Zusfallsstichprobe
    - Disjunkte & exhaustive Zerlegung einer Population in unters. Schichten
    - Zufallsstichprobe aus jeder Schicht -> Alle Merkmale vorhanden
  3. Klumpenstichprobe
    * *Umfasst alle Elemente** zufällig ausgewählter Klumpen einer Population
  4. Mehrstufige Auswahlverfahren
    - Schachtelung der Populationselemente in verschiedenen Ebenen
    - Sukzessive Stichprobenziehung aus verschiedenen Ebenen z.B Ziehung innerhalbt in der Uni -> Studiengänge -> VL
  5. Einzelstichprobe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie repräsentativ sind Stichproben?

Erkläre den Stichprobenfehler und systematischer Fehler

A
  • Zufallsstichprobe sind repräsentative Stichproben
  • Repräsentativ: Durch Zufallsauswahl aus Grundgesamtheit entstanden
  • Stichprobenfehler sampling error
    • Stichprobenkennwerte weichen von Populationsparameter trotz Zufälliger Ziehung ab
  • Systematischer Fehler nonsampling error
    • Keine Zufallsauswahl, Stichprobe liegt andere Population als die intendierte Population zugrunde (nicht repräsentativ!)
    • z.b durch Teilnahmeverweigerung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Beschreibe die Parameterschätzung

A
  • Schätzung der Population anhand Stichprobenkennwert
  • Stichprobenkennwertverteilung
    = Aus einer Stichprobe werden mehrere Stichproben gezogen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie verhalten sich kleine und grosse Stichproben in Bezug auf die empirischen Ermittlung einer Stichprobenkennwerteverteilung?

A
  • kleine Stichproben -> Keine gute Schätzung (Variabilität ist grösser)
  • grosse Stichproben -> Gute Schätzung (näher am Mittelwert)

Je grösser die Stichprobe, desto kleiner der Standardfehler!

⇒ Je grösser n, desto steiler ist die Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nenne die Bezeichungen des Standardfehlers

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der zetrale Grenzwertsatz?

A

Die Stichprobenkennwerteverteilung der Mittelwerte nähert sich mit zunehmender Grösse der Normalverteilung an, unabhängig davon, wie das Merkmal der Population verteilt ist.

Ab n 30 bei Gleichverteilung geht der Stichprobenkennwert in die Normalverteilung über.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erwartungstreue der Parameterschätzung. Erkläre

Nenne einen erwartungstreuen und einen erwartungsuntreuen Schätzer.

A

Stichprobenkennwert schätzt einen Parameter (Populationskennwert) erwartungstreu, wenn der Strichprobenkennwerteverteilung dem Parameter entspricht.

Je mehr Stichproben gezogen werden, desto näher am wahren Parameter -> Erwartungswert

ein erwartungstreuer Schätzer wäre bspw. Der Stichprobenmittelwert für den Populationsmittelwert ⇒ E(Xquer) = µ

ein erwartungsuntreuer Schätzert wäre bspw. die empirische Varianz für die Populationsvarianz ⇒ E(S2x) ≠ σ2x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was bedeutet “Konsistenz” im Zusammenhang mit der Parameterschätzung?

A

Stichprobenkennwerte schätz einen Parameter (Populationskennwert) konstistenz, wenn er sich mit wachsender Stichprobengrösse dem Parameter nähert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Erkläre Exhaustivität (Suffizienz) in Bezug auf die Parameterschätzung?

A

Schätzwert ist exhaustiv (suffizient, erschöpfend), wenn er alle in den Daten erhaltenen Informationen berücksichtigt, so dass durch die Berechnung einer weitere Statistik keine zusätzlichen Informationene über den Parameter gewonnen werden kann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Erkläre “Effizient” in Bezug auf die Paramterschätzung

A

Stichprobenkennwert schätzt einen Parameter (Populationskennwert) effizient, wenn er den geringsten Standardfehler aller erwartungsteuen Schätzer aufweist.

  • Bei normalverteilten Varbiabeln kann der Populationsmittelwert mit dem
    • Stichprobenmittelwert
    • Stichprobenmedian
    • erwartungstreu und konstistent geschätzt werden
  • Die Schätzung mittels des Stichprobenmittelwerts ist effizienter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Definiere die Intervallsschätzung in Bezug auf die Parameterschätung.

A

Bestimmung des Bereichs (Intervall) um den geschätzen Populationsparameter, in dem der wahre Populationsparameter mit hoher Sicherheit liegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist der Kofidenzintervall (Vertrauensintervall) bei der Parameterschätzung?

A

Bezeichnet den Bereich um einen geschätzen Populationsparameter, für den gilt, dass er mit einer Wahrscheinlichkeit von 1 - alpha den Populationsparameter überdeckt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welche Parameter haben Einfluss auf das Konfidenzinteravall?

A

Eine Stichprobe x hat mit der Wahrscheinlichkeit p einen Mittelwert im Intervall zwischen:

Arithmethisches Mittel der Stichprobenkennwerte +/- (der Standartfehler der Mittelwerts * Z-Wert der Standardnormalverteilung

=> Somit haben Standartfehler und der entsprechende Z-Wert Einfluss.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wenn wir ein Konfidenzintervall mit der Wahrscheinlichkeit von 95% berechnen wollen. Welchen z-Wert der Standardnormalverteilung müssen wir ablesen um den Zp -Wert für unsere berechnung zu erhalten?

A

beim z-Wert bei 0.975, da ein Intervall berechnet wird.

0.950 = 0.975 - ( 1 - 0.975)

17
Q

Welche Eigenschaften hat das Konfidenzintervall?

Was verteht man unter dem Konfidenzkoeffizent (Überdeckungswahrscheinlichkeit)?

Allgemein wir wird der Konfidenzkoeffizient für ein Konfidenzintervall definiert (mit was hängt er direkt zusammen)?

A
  • Bestimmung des Bereichs um den geschätzten Populationsparameter, in dem der wahre Populationsparameter mit Wahrscheinlichkeit p liegt. (liegt also nicht immer drin!!)
  • is die Wahrscheinlichkeit, ddass ein beliebiges Intervall zu denjenigen zählt, die den wahren Populationsparameter enthalten (“überdecken”).

Allgemein: p = (1-alpha)*100 - Konfidenzintervall x-Strich +/- z(alpha/2) * Stichprobenfehler

=> hängt also direkt von alpha ab!

18
Q
  1. Welche Eigenschaft hat die Students t Verteilung, was misst er?
  2. Was ist ein Freiheitsgrad?
  3. Wieviele Komponenten gehen in eine Berechnung ein und wieviele können frei variiert werden?
A
  1. Schätzung des Standardfehlers des Mittelwerts aus den Stichproben bei unbekannter Populationsvarian
    • je grösser Freiheitsgrad, desto näher ist sie an der Normalverteilung
  2. auch “degree of freedom (df) entsprechen einer Prüfgrösse der Anzahl der Komponenten dieser Grösse, die frei variieren.
  3. in eine Berechnung gehen n+2 Komponenten ein. Wobei aber Anzahl der Messwerte und der Mittelwert aus den n individuellen messwerten festgelegt ist. Der n-1te Messwert kann aus den anderen Messwerten abgeleitet werden, da die Summe der Abweichungen vom Mittelwert = 0 sein muss!
19
Q

Erkläre das Konzept der Nullhypothese:

  1. Wann sind Ergebnisse signifikantund wie wird es angegeben?
  2. Was ist das Signifikantsniveau ?
A
  1. wenn der Wert der statistischen Kenngrösse in einen vorher festgelegten Bereich fällt, der am stärksten gegen die Nullhypothese spricht. Konvention ist <5%!
    • Wird in Überschreitungswahrscheinlichkeit p angegeben -> Wahrscheinlichkeit, dass das gefundene Ergebnis oder noch ein stärker gegen die Nullhypothese sprechendes Ereignis unter Gültigkeit der Nullhypothese zu finden.
  2. = festgelegte Grenze der Wahrscheinlichkeit.
20
Q

Wie wird zwischen Alternativhypothese und Nullhypothese unterschieden?

A

Entspricht dem binären Entscheidungskonzept nach Neyman und Pearson.

  • Alternativhypothese:
    • Bsp. Die Person (bzw. Stichprobe) stammt aus einer Population mit einem Mittelwert von µ < 50
    • allgemein: H1: µ1 > µ0
  • Nullhypothese:
    • Die Person (bzw. Stichprobe) stammt aus einer Population mit einem Mittelwert von µ <= 50
    • allgemein H0: µ <= µ0

Somit gilt** µ1 != µ0** und (** µ1 und µ0) decken die gesammte Population ab**!

21
Q

Beschreibe die Art und Wahrscheinlichkeit richtiger und falscher Entscheidungen beim statistischen Testen.

A

Statistische Eintscheidung

Realität

H0ist wahr

H1 ist falsch

Realität

H0ist falsch

H1ist wahr

H0wird verworfen

H1 wird beibehalten

Fehler erster Art

( α )

richtige Entscheidung

(1- β)

H0beibbehalten

H1 verworfen

richtige Entscheidung

(1- α)

Fehler zweiter Art

( β)

22
Q

Beschreibe den Fehler erster Art ( α )

A

Die Irrtumswahrscheinlichkeit (α) ist die Wahrscheinlichkeit, mit der ein Test ein signifikantes Ergebnis produziert, obwohl in Wirklichkeit die H0 gilt.

23
Q

Beschreibe den Fehler zweiter Art

A

Um die β-Fehlerwahrscheinlichkeit bestimmen zu können, muss in der Alternativenhypothese genau spezifisiert werden, wie gross der Unterschied/Zusammenhang ist. (spezifische Hypothese)

Die Irrtumswahrscheinlichkeit beta ist die Wahrscheinlichkeit, mit der ein statistischer Test ein nicht- signifikantes Ereignis produziert, obwohl in Wirklichkeit die H1 gilt.

24
Q

Was versteht man unter der Teststärke (Power) ?

Von was hängt die Teststärke (Power) ab?

A
  • 1 - β ist die Wahrscheinlichkeit, mit der ein Test ein signifikantes Ergebnis produziert, unter der Annahme, dass ein Effekt einer bestimmten (hypothetischen festlegung) Grösse tatsächlich existiert.
  • β und (1-β) hängen ab von:
    • Effektgrösse
    • Signifikanzniveau α
    • Streuung der Populationsmerkmalsverteilung
    • Stichprobengrösse
    • Art des Tests (einseitig vs. zweiseitig)
25
Q

Was gilt allgemein für einseitige/zweiseitige Tests?

  1. Nenne Zusammenhänge zwishen β und der Grösse des Effekts.
  2. Nenne Zusammenhänge zwishen β und Signifikanzniveau α.
  3. Nenne Zusammenhänge zwishen β und der Streuung der Populationsverteilung
  4. Nenne Zusammenhänge zwishen β und des Stichprobenumfangs
A

Sie ist bei einem einseitigen Test grösser als bei einem zweiseitigen Test.

  1. Je grösser ε, desto kleiner β
  2. je grösser α, desto grösser β
  3. je kleiner die Merkmalstreuungsverteilung, je Steiler die Verteilung, desto kleiner ist β
  4. je grösser n, desto grösser β
26
Q

Welche Hypothese braucht man um den α Fehler zu bestimmen und welche für den β -Fehler?

A
  • α-Fehler = braucht nur H0 Hypothese
  • β -Fehler = braucht zusätzlich eine /zwei sezifische Hypothese
27
Q

Führe einen vergleich eines Stichprobenmittelweres mit einem Populationsmittelwert bei bekannter Populationsvarianz durch. Was fällt auf?

A

Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert bei bekannter Populationsvarianz

Einstichproben-Gauss-Test

zemp= 3.58

zkrit(1) = -1.96

zkrit(2) = +1.96

zemp<= zkrit(1)

zemp>=zkrit(2)

Einstichproben-t-Test

temp= 3.25

tkrit(1) = -2.09

tkrit(2) =+2.09

temp<= tkrit(1)

temp>=tkrit(2)

wobei der geschätzte Stichprobenmittelwet bei 2.46 liegen würde.

28
Q

was ist die Eigenschaft eines p-Werts in einem zweiseitigen Test?

A
  • Wahrscheinlichkeit,unter H0 den beobachteten Prüfgrössenwert oder einen (in Richtung Alternative) noch extremeren Ert zu erhalten .
  • Bezieht sich auf Betrag der Prüfgrösse
  • Gleicher Wert der Prüfgrösse geht beim zweiseitigen Test - im Vergleich zum einseitigen Test - mit doppeltem p-Wert einher.
  • Einseitiger Test hat mehr Power!