Inferenzielle Datenanalyse II Flashcards
Theoretische Stichprobenverteilung: Streuung der Verteilung: Standardfehler
die Populationsstreuung ist per se unbekannt, kann aber aus der Streuung der
Stichprobendaten geschätzt werden
-d. h., man verwendet anstelle von s die geschätzte Standardabweichung für die
Population: (sigma)
-die Standardabweichung einer Stichprobenverteilung – der sog. Standardfehler –
(sigma dach i), SE, bei Mittelwerten oft SEM für standard error of mean) kann nun aus N und
der Populationsstreuung geschätzt werden
-z. B. bei Mittelwerten wird diese anschließend durch die Wurzel der
Stichprobengröße geteilt (Wurzel-N-Gesetz):
Konfidenzintervall Definition
Ein Konfidenzintervall ist ein Wertebereich, der den wahren Parameter in der Population mit der Wahrscheinlichkeit X beinhaltet.
Konfidenzintervalle allgemeine Veranschaulichung
Einfluss der Stichprobengröße auf das KI
Dilemma der Inferenzstatistik
P-Wert Def
P und Alpha - Signifikanz
Ein- und Zweiseitiges Testen
Beispiel Ein- und Zweiseitiges Testen
P-Wert und Stichprobengröße
Beta-Fehler
Alpha und Beta
Frequentistische Inferenzstatistik Recap
- generelle Idee: Was würde passieren, wenn die Studie immer wieder durchgeführt und der Kennwert bestimmt würde?
- diese Idee wird durch die theoretische Stichprobenverteilung repräsentiert
- die Stichprobenverteilung von Kennwerten ist laut dem Zentralen Grenzwertsatz immer normalverteilt
- die Standardabweichung der Stichprobenverteilung wird Standardfehler genannt
- Konfidenzintervalle geben die Verlässlichkeit der Parameterschätzung als Intervall an
- der p-Wert des Signifikanztests gibt an, wie wahrscheinlich ein Ergebnis unter der Annahme eines Nulleffektes in der Population ist
- Signifikanztests sollen eine Entscheidungshilfe beim Abwägen von Hypothesen sein
Warum nähert sich die Form der Stichprobenverteilung einer Normalverteilung an?
Dies ist eine Folge des Zentralen Grenzwertsatzes.
Ab einer Stichprobengröße von etwa 30 nähert sich die Verteilung der Kennwerte einer Normalverteilung an.
Dies gilt unabhängig von der ursprünglichen Verteilung der Daten in der Population.
Was besagt der Zentrale Grenzwertsatz in der inferenziellen Statistik?
Der Zentrale Grenzwertsatz besagt, dass die Verteilung von Kennwerten aus Stichproben bei ausreichend großen Stichproben immer einer Normalverteilung folgt, unabhängig von der ursprünglichen Verteilung der Population.
Diese Verteilung entsteht, weil die Studienergebnisse zufällig um den wahren Populationsparameter schwanken.
Wie wird der Mittelwert der theoretischen Stichprobenverteilung bestimmt?
Der Mittelwert der theoretischen Stichprobenverteilung wird um den Kennwert der Studie herum konstruiert, da dieser die beste Schätzung für den unbekannten Populationsparameter darstellt.
Streuung der Stichprobenverteilung
Die Streuung hängt von der Stichprobengröße und der Streuung der Werte in der Population ab.
Größere Stichproben und geringere Populationsstreuung führen zu geringerer Streuung der Ergebnisse, was die Schätzung genauer macht.
Was ist der Standardfehler und wie wird er berechnet?
Der Standardfehler ist die Standardabweichung der theoretischen Stichprobenverteilung.
Er wird berechnet, indem die geschätzte Populationsstreuung durch die Wurzel der Stichprobengröße geteilt wird.
Was zeigt ein Konfidenzintervall an?
Ein Konfidenzintervall gibt einen Bereich an, in dem der wahre Populationsparameter mit einer bestimmten Wahrscheinlichkeit liegt.
Übliche Wahrscheinlichkeiten sind 90%, 95% oder 99%.
Je enger das Intervall, desto verlässlicher ist die Schätzung.
Was bedeutet die Vertrauenswahrscheinlichkeit (z.B. 95%) eines Konfidenzintervalls?
Die Vertrauenswahrscheinlichkeit gibt an, dass, wenn man 100 Studien durchführt, in X Fällen (z.B. 95) das Konfidenzintervall den wahren Wert enthalten würde.
Wie beeinflusst die Stichprobengröße das Konfidenzintervall?
Größere Stichproben führen zu schmaleren Konfidenzintervallen, da die Schätzungen genauer und die Streuung geringer wird.
Was prüfen Signifikanztests in der inferenziellen Statistik?
Signifikanztests prüfen Hypothesen, insbesondere ob ein beobachteter Effekt in der Stichprobe signifikant ist oder rein zufällig entstanden ist.
Sie führen zu einer ja/nein-Entscheidung basierend auf dem p-Wert.
Was besagt die Nullhypothese in einem Signifikanztest?
Die Nullhypothese besagt, dass es keinen Effekt gibt und der beobachtete Unterschied rein zufällig ist.
Die Verteilung der Nullhypothese wird um den Wert 0 konstruiert und zeigt, wie Ergebnisse zufällig um 0 schwanken können.
Was gibt der p-Wert in einem Signifikanztest an?
Der p-Wert gibt die Wahrscheinlichkeit an, mit der ein beobachtetes Ergebnis oder ein extremeres auftreten würde, wenn die Nullhypothese wahr ist.
Ein niedriger p-Wert (z.B. p < 0,05) führt zur Ablehnung der Nullhypothese und spricht für einen signifikanten Effekt.