Inferenzielle Datenanalyse II Flashcards
Theoretische Stichprobenverteilung: Streuung der Verteilung: Standardfehler
die Populationsstreuung ist per se unbekannt, kann aber aus der Streuung der
Stichprobendaten geschätzt werden
-d. h., man verwendet anstelle von s die geschätzte Standardabweichung für die
Population: (sigma)
-die Standardabweichung einer Stichprobenverteilung – der sog. Standardfehler –
(sigma dach i), SE, bei Mittelwerten oft SEM für standard error of mean) kann nun aus N und
der Populationsstreuung geschätzt werden
-z. B. bei Mittelwerten wird diese anschließend durch die Wurzel der
Stichprobengröße geteilt (Wurzel-N-Gesetz):
Konfidenzintervall Definition
Ein Konfidenzintervall ist ein Wertebereich, der den wahren Parameter in der Population mit der Wahrscheinlichkeit X beinhaltet.
Konfidenzintervalle allgemeine Veranschaulichung
Einfluss der Stichprobengröße auf das KI
Dilemma der Inferenzstatistik
P-Wert Def
P und Alpha - Signifikanz
Ein- und Zweiseitiges Testen
Beispiel Ein- und Zweiseitiges Testen
P-Wert und Stichprobengröße
Beta-Fehler
Alpha und Beta
Frequentistische Inferenzstatistik Recap
- generelle Idee: Was würde passieren, wenn die Studie immer wieder durchgeführt und der Kennwert bestimmt würde?
- diese Idee wird durch die theoretische Stichprobenverteilung repräsentiert
- die Stichprobenverteilung von Kennwerten ist laut dem Zentralen Grenzwertsatz immer normalverteilt
- die Standardabweichung der Stichprobenverteilung wird Standardfehler genannt
- Konfidenzintervalle geben die Verlässlichkeit der Parameterschätzung als Intervall an
- der p-Wert des Signifikanztests gibt an, wie wahrscheinlich ein Ergebnis unter der Annahme eines Nulleffektes in der Population ist
- Signifikanztests sollen eine Entscheidungshilfe beim Abwägen von Hypothesen sein
Warum nähert sich die Form der Stichprobenverteilung einer Normalverteilung an?
Dies ist eine Folge des Zentralen Grenzwertsatzes.
Ab einer Stichprobengröße von etwa 30 nähert sich die Verteilung der Kennwerte einer Normalverteilung an.
Dies gilt unabhängig von der ursprünglichen Verteilung der Daten in der Population.
Was besagt der Zentrale Grenzwertsatz in der inferenziellen Statistik?
Der Zentrale Grenzwertsatz besagt, dass die Verteilung von Kennwerten aus Stichproben bei ausreichend großen Stichproben immer einer Normalverteilung folgt, unabhängig von der ursprünglichen Verteilung der Population.
Diese Verteilung entsteht, weil die Studienergebnisse zufällig um den wahren Populationsparameter schwanken.
Wie wird der Mittelwert der theoretischen Stichprobenverteilung bestimmt?
Der Mittelwert der theoretischen Stichprobenverteilung wird um den Kennwert der Studie herum konstruiert, da dieser die beste Schätzung für den unbekannten Populationsparameter darstellt.
Streuung der Stichprobenverteilung
Die Streuung hängt von der Stichprobengröße und der Streuung der Werte in der Population ab.
Größere Stichproben und geringere Populationsstreuung führen zu geringerer Streuung der Ergebnisse, was die Schätzung genauer macht.