Inferenzielle Datenanalyse II Flashcards

1
Q

Theoretische Stichprobenverteilung: Streuung der Verteilung: Standardfehler

A

die Populationsstreuung ist per se unbekannt, kann aber aus der Streuung der
Stichprobendaten geschätzt werden
-d. h., man verwendet anstelle von s die geschätzte Standardabweichung für die
Population: (sigma)
-die Standardabweichung einer Stichprobenverteilung – der sog. Standardfehler –
(sigma dach i), SE, bei Mittelwerten oft SEM für standard error of mean) kann nun aus N und
der Populationsstreuung geschätzt werden
-z. B. bei Mittelwerten wird diese anschließend durch die Wurzel der
Stichprobengröße geteilt (Wurzel-N-Gesetz):

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Konfidenzintervall Definition

A

Ein Konfidenzintervall ist ein Wertebereich, der den wahren Parameter in der Population mit der Wahrscheinlichkeit X beinhaltet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Konfidenzintervalle allgemeine Veranschaulichung

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Einfluss der Stichprobengröße auf das KI

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dilemma der Inferenzstatistik

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

P-Wert Def

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

P und Alpha - Signifikanz

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ein- und Zweiseitiges Testen

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beispiel Ein- und Zweiseitiges Testen

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

P-Wert und Stichprobengröße

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Beta-Fehler

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Alpha und Beta

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Frequentistische Inferenzstatistik Recap

A
  • generelle Idee: Was würde passieren, wenn die Studie immer wieder durchgeführt und der Kennwert bestimmt würde?
  • diese Idee wird durch die theoretische Stichprobenverteilung repräsentiert
  • die Stichprobenverteilung von Kennwerten ist laut dem Zentralen Grenzwertsatz immer normalverteilt
  • die Standardabweichung der Stichprobenverteilung wird Standardfehler genannt
  • Konfidenzintervalle geben die Verlässlichkeit der Parameterschätzung als Intervall an
  • der p-Wert des Signifikanztests gibt an, wie wahrscheinlich ein Ergebnis unter der Annahme eines Nulleffektes in der Population ist
  • Signifikanztests sollen eine Entscheidungshilfe beim Abwägen von Hypothesen sein
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Warum nähert sich die Form der Stichprobenverteilung einer Normalverteilung an?

A

Dies ist eine Folge des Zentralen Grenzwertsatzes.
Ab einer Stichprobengröße von etwa 30 nähert sich die Verteilung der Kennwerte einer Normalverteilung an.
Dies gilt unabhängig von der ursprünglichen Verteilung der Daten in der Population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was besagt der Zentrale Grenzwertsatz in der inferenziellen Statistik?

A

Der Zentrale Grenzwertsatz besagt, dass die Verteilung von Kennwerten aus Stichproben bei ausreichend großen Stichproben immer einer Normalverteilung folgt, unabhängig von der ursprünglichen Verteilung der Population.
Diese Verteilung entsteht, weil die Studienergebnisse zufällig um den wahren Populationsparameter schwanken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie wird der Mittelwert der theoretischen Stichprobenverteilung bestimmt?

A

Der Mittelwert der theoretischen Stichprobenverteilung wird um den Kennwert der Studie herum konstruiert, da dieser die beste Schätzung für den unbekannten Populationsparameter darstellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Streuung der Stichprobenverteilung

A

Die Streuung hängt von der Stichprobengröße und der Streuung der Werte in der Population ab.
Größere Stichproben und geringere Populationsstreuung führen zu geringerer Streuung der Ergebnisse, was die Schätzung genauer macht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist der Standardfehler und wie wird er berechnet?

A

Der Standardfehler ist die Standardabweichung der theoretischen Stichprobenverteilung.
Er wird berechnet, indem die geschätzte Populationsstreuung durch die Wurzel der Stichprobengröße geteilt wird.

17
Q

Was zeigt ein Konfidenzintervall an?

A

Ein Konfidenzintervall gibt einen Bereich an, in dem der wahre Populationsparameter mit einer bestimmten Wahrscheinlichkeit liegt.
Übliche Wahrscheinlichkeiten sind 90%, 95% oder 99%.
Je enger das Intervall, desto verlässlicher ist die Schätzung.

18
Q

Was bedeutet die Vertrauenswahrscheinlichkeit (z.B. 95%) eines Konfidenzintervalls?

A

Die Vertrauenswahrscheinlichkeit gibt an, dass, wenn man 100 Studien durchführt, in X Fällen (z.B. 95) das Konfidenzintervall den wahren Wert enthalten würde.

19
Q

Wie beeinflusst die Stichprobengröße das Konfidenzintervall?

A

Größere Stichproben führen zu schmaleren Konfidenzintervallen, da die Schätzungen genauer und die Streuung geringer wird.

20
Q

Was prüfen Signifikanztests in der inferenziellen Statistik?

A

Signifikanztests prüfen Hypothesen, insbesondere ob ein beobachteter Effekt in der Stichprobe signifikant ist oder rein zufällig entstanden ist.
Sie führen zu einer ja/nein-Entscheidung basierend auf dem p-Wert.

21
Q

Was besagt die Nullhypothese in einem Signifikanztest?

A

Die Nullhypothese besagt, dass es keinen Effekt gibt und der beobachtete Unterschied rein zufällig ist.
Die Verteilung der Nullhypothese wird um den Wert 0 konstruiert und zeigt, wie Ergebnisse zufällig um 0 schwanken können.

22
Q

Was gibt der p-Wert in einem Signifikanztest an?

A

Der p-Wert gibt die Wahrscheinlichkeit an, mit der ein beobachtetes Ergebnis oder ein extremeres auftreten würde, wenn die Nullhypothese wahr ist.
Ein niedriger p-Wert (z.B. p < 0,05) führt zur Ablehnung der Nullhypothese und spricht für einen signifikanten Effekt.

23
Q

Was ist ein Alpha-Fehler in der inferenziellen Statistik?

A

Ein Alpha-Fehler tritt auf, wenn die Nullhypothese abgelehnt wird, obwohl sie wahr ist.
Dies bedeutet, dass ein Effekt als signifikant betrachtet wird, obwohl er tatsächlich nicht existiert.

24
Q

Was ist ein Beta-Fehler in der inferenziellen Statistik?

A

Ein Beta-Fehler tritt auf, wenn die Nullhypothese fälschlicherweise beibehalten wird, obwohl ein echter Effekt existiert.
Dies bedeutet, dass ein existierender Effekt als nicht signifikant übersehen wird.

25
Q

Was ist der Ansatz von Neyman und Pearson bei Signifikanztests?

A

Der Ansatz von Neyman und Pearson betrachtet sowohl die Nullhypothese (H0) als auch die Alternativhypothese (H1).
Signifikanztests helfen, zwischen diesen beiden Hypothesen zu entscheiden.
Dabei werden Alpha- und Beta-Fehler gegeneinander abgewogen, und es wird eine ausreichende Teststärke (Power) angestrebt.

26
Q

Was ist der Unterschied zwischen einseitigem und zweiseitigem Testen?

A

Bei ungerichteten Hypothesen wird zweiseitig getestet, wobei die Irrtumswahrscheinlichkeit auf beide Enden der Verteilung verteilt wird.
Bei gerichteten Hypothesen wird einseitig getestet, was die Wahrscheinlichkeit für ein signifikantes Ergebnis erhöht.

27
Q

Was sind die zentralen Konzepte der frequentistischen Inferenzstatistik?

A

Sie basiert auf der Idee, was passieren würde, wenn eine Studie unendlich oft wiederholt wird.
Die theoretische Stichprobenverteilung folgt laut Zentralem Grenzwertsatz einer Normalverteilung.
Konfidenzintervalle und der p-Wert in Signifikanztests dienen als Werkzeuge zur Beurteilung der Verlässlichkeit von Schätzungen und der Hypothesenprüfung.

28
Q

Wie wird die Stichprobenverteilung für die Nullhypothese (H0) konstruiert?

A

Die H0-Verteilung wird um den Wert 0 konstruiert, der den angenommenen Nulleffekt repräsentiert.
Diese Verteilung zeigt, wie die Ergebnisse zufällig um 0 schwanken können, selbst wenn kein echter Effekt existiert.

29
Q

Was sind Prüfverteilungen und warum werden sie verwendet?

A

Prüfverteilungen, wie z-, t- und F-Verteilungen, sind standardisierte Verteilungen, die in Signifikanztests verwendet werden.
Sie erleichtern die Bestimmung des p-Wertes, indem sie die Lage des empirischen Ergebnisses in der H0-Verteilung anzeigen.

30
Q

Was prüft der z-Test in der inferenziellen Statistik?

A

Der z-Test prüft, ob sich ein empirischer Kennwert signifikant von einem erwarteten Kennwert unterscheidet.
Die Nullhypothese repräsentiert den erwarteten Wert, und der z-Wert gibt an, wie weit das empirische Ergebnis von diesem Wert abweicht.

31
Q

Welche Vor- und Nachteile hat ein einseitiger gegenüber einem zweiseitigen Test?

A

Einseitiger Test: Hat mehr Power, da die gesamte Irrtumswahrscheinlichkeit auf eine Seite der Verteilung gelegt wird.
Zweiseitiger Test: Berücksichtigt beide möglichen Richtungen eines Effekts, reduziert aber die Power, da die Irrtumswahrscheinlichkeit auf beide Seiten verteilt wird.

32
Q

Was versteht man unter der Teststärke (Power) eines Signifikanztests?

A

Die Teststärke gibt die Wahrscheinlichkeit an, dass ein Signifikanztest einen vorhandenen Effekt korrekt entdeckt.
Eine hohe Teststärke reduziert das Risiko eines Beta-Fehlers (Fehler 2. Art) und wird durch große Stichproben und präzise Messungen erreicht.

33
Q

Wie sollten Alpha- und Beta-Fehler gegeneinander abgewogen werden?

A

Die Bedeutung von Alpha- (Fehler 1. Art) und Beta-Fehlern (Fehler 2. Art) sollte abhängig vom Kontext der Studie abgewogen werden.
In manchen Fällen kann ein Alpha-Fehler schwerwiegender sein, während in anderen ein Beta-Fehler schwerwiegender ist.

34
Q

Wie wird die Alternativhypothese (H1) im Neyman-Pearson-Ansatz definiert?

A

Die Alternativhypothese (H1) repräsentiert den vermuteten oder erhofften Effekt, der vor der Studie festgelegt wird.
Diese Hypothese steht im Widerstreit zur Nullhypothese (H0), und der Signifikanztest hilft, zwischen beiden zu entscheiden.

35
Q

Wie beeinflusst die Stichprobengröße den p-Wert in Signifikanztests?

A

Größere Stichproben führen zu schmaleren Stichprobenverteilungen, wodurch es leichter wird, einen signifikanten p-Wert zu erhalten.
Dies erhöht die Teststärke (Power) des Signifikanztests.

36
Q

Was ist die generelle Kritik an Signifikanztests?

A

Signifikanztests basieren auf abstrakten Annahmen und willkürlichen Schwellenwerten (z.B. Alpha-Niveau).
Sie liefern eine Ja/Nein-Entscheidung, die oft überinterpretiert wird, und berücksichtigen nicht die Größe oder praktische Bedeutung eines Effekts.

37
Q

Worin unterscheiden sich Konfidenzintervalle von Signifikanztests?

A

Konfidenzintervalle geben einen Wertebereich an, der den wahren Populationsparameter mit einer bestimmten Wahrscheinlichkeit enthält und zeigen die Präzision der Schätzung an.
Signifikanztests prüfen, ob ein Effekt signifikant ist, bieten aber keine Informationen über die Größe des Effekts oder seine praktische Bedeutung.

38
Q

Warum wird der z-Wert im z-Test verwendet?

A

Der z-Wert standardisiert das Ergebnis, indem er die Abweichung des empirischen Kennwerts vom erwarteten Wert in Standardabweichungen ausdrückt.
Dadurch wird es möglich, die Wahrscheinlichkeit des Ergebnisses unter der Nullhypothese zu bestimmen.

39
Q

Was ist der Unterschied zwischen Standardfehler und Standardabweichung?

A

Die Standardabweichung misst die Streuung der Daten in einer Stichprobe.
Der Standardfehler misst die Streuung der Stichprobenmittelwerte um den Populationsmittelwert und wird kleiner bei größeren Stichproben.

40
Q

Wie und wo werden Konfidenzintervalle typischerweise verwendet?

A

Konfidenzintervalle werden in wissenschaftlichen Texten als inferenzstatistische Angaben verwendet, um die Präzision der Schätzung zu zeigen.
Sie werden auch in Abbildungen als Fehlerbalken dargestellt, die den Unsicherheitsbereich um den geschätzten Parameter anzeigen.

41
Q

Warum ist die Wahl des Signifikanzniveaus (Alpha) wichtig?

A

Das Signifikanzniveau bestimmt die Schwelle, bei der die Nullhypothese abgelehnt wird.
Ein niedrigeres Alpha reduziert das Risiko eines Alpha-Fehlers, erhöht aber das Risiko eines Beta-Fehlers und macht es schwieriger, einen signifikanten Effekt zu finden.

42
Q
A