VL1 Einführung & Grundlagen Flashcards
Was sind die zentralen Inhalte der Inferenzstatistik?
Rückschluss von Stichproben auf die Grundgesamtheit.
Bewertung, ob beobachtete Unterschiede zufällig oder systematisch sind.
Nutzung der Wahrscheinlichkeitstheorie zur Quantifizierung von Unsicherheit.
Was versteht man unter Wahrscheinlichkeiten?
Wahrscheinlichkeit ist eine Zahl zwischen 0 und 1, die das Eintreten eines Ereignisses beschreibt.
Die Wahrscheinlichkeiten aller möglichen Ereignisse summieren sich zu 1.
Beispiele: Münzwurf (0.5 für Kopf) oder Würfeln einer Sechs (1/6 ≈ 0.1667).
Was ist der frequentistische Ansatz in der Statistik?
Wahrscheinlichkeit beschreibt die relative Häufigkeit eines Ereignisses bei vielen Wiederholungen eines Zufallsexperiments.
Wahrscheinlichkeiten werden durch Beobachtungen geschätzt.
Zentrale Aufgaben: Schätzen und Testen.
Was ist ein Signifikanzniveau, und warum ist es wichtig?
Grenze, ab der eine Beobachtung unter der Nullhypothese als unplausibel gilt.
Üblicherweise bei 5 % oder 1 % festgelegt.
Unterschreiten der Grenze führt zur Ablehnung der Nullhypothese.
Wie funktioniert ein Nullhypothesensignifikanztest?
Aufstellen von Null- und Alternativhypothese.
Festlegen des Signifikanzniveaus (z. B. 5 %).
Daten erheben und analysieren.
Berechnen des p-Werts und Vergleich mit dem Signifikanzniveau.
Entscheidung: Nullhypothese beibehalten oder ablehnen.
Was bedeutet ein „nicht-signifikantes“ Ergebnis?
Beobachtungen sind plausibel unter der Nullhypothese.
Beibehaltung der Nullhypothese bedeutet nicht, dass sie bewiesen ist.
Mögliche Gründe: Kein Effekt oder zu geringe Teststärke.
Was ist eine Stichprobenkennwerteverteilung?
Verteilung von Kennwerten (z. B. Mittelwert) aus vielen Stichproben einer Population.
Hilft, die Präzision einer Schätzung zu beurteilen.
Streuung dieser Verteilung wird als Standardfehler bezeichnet.
Was ist ein t-Test für unabhängige Stichproben?
Testet, ob sich die Mittelwerte zweier Gruppen signifikant unterscheiden.
Voraussetzungen: Normalverteilung und Homoskedastizität (Varianzgleichheit). (Auch möglich mit verschiedenen Varianzen –> Welch’s tTest)
Alternativhypothese: Mittelwerte der Gruppen sind unterschiedlich.
Wie wird die t-Statistik berechnet?
Was ist der p-Wert, und wie wird er interpretiert?
Wahrscheinlichkeit, eine beobachtete (oder extremere) Abweichung zu finden, wenn die Nullhypothese wahr ist.
p<α: Nullhypothese wird abgelehnt
p größer gleich α: Nullhypothese wird beibehalten
Was sind Konfidenzintervalle, und was sagen sie aus?
Bereich, in dem der wahre Wert mit einer bestimmten Wahrscheinlichkeit liegt (z. B. 95 %).
Wenn das Intervall die Null nicht enthält, ist der Unterschied signifikant.
Was ist der Standardfehler, und warum ist er wichtig?
Welche Hypothesen können bei einem t-Test gerichtet oder ungerichtet sein?
Ungerichtet: Unterschied in beiden Richtungen möglich (μ1 ist ungleich μ2)
Gerichtet: Erwartung eines Effekts in eine spezifische Richtung (μ1 > μ2 oder μ1<μ2)
Welche statistischen Modelle beschäftigen sich mit Unterschieden und Zusammenhängen?
Unterschiede: Vergleich von Mittelwerten zwischen Gruppen, Bedingungen oder über die Zeit.
Zusammenhänge: Beziehung zwischen Variablen, z. B. Korrelation oder Regression.
Was ist eine Normalverteilung, und warum ist sie wichtig?
Definition: Symmetrische, glockenförmige Verteilung mit Mittelwert = Median = Modus.
Bedeutung: Viele statistische Tests basieren auf der Annahme der Normalverteilung.
Was sind die Eigenschaften einer Normalverteilung?
Symmetrisch um den Mittelwert.
68 % der Werte liegen innerhalb von ±1 Standardabweichung.
95 % der Werte liegen innerhalb von ±2 Standardabweichungen.
Was ist eine Effektstärke, und warum ist sie wichtig?
Definition: Maß für die Größe eines Effekts unabhängig von der Stichprobengröße.
Bedeutung: Ergänzt den p-Wert, um die praktische Relevanz eines Ergebnisses zu bewerten.
Beispiele: Cohen’s d, r², eta-quadrat (η²)
Was ist Cohen’s d, und wie wird es berechnet?
Was ist eine Varianzanalyse (ANOVA), und wann wird sie verwendet?
Definition: Testet Mittelwertsunterschiede zwischen mehr als zwei Gruppen.
Anwendung: Bei mehreren unabhängigen Gruppen oder Faktoren.
Nullhypothese: Alle Gruppenmittelwerte sind gleich.
Was ist der F-Wert in der ANOVA?
Was ist Homoskedastizität, und warum ist sie wichtig?
Definition: Annahme, dass die Varianzen der Gruppen gleich sind.
Bedeutung: Verletzung dieser Annahme kann zu verzerrten Testergebnissen führen.
Test auf Homoskedastizität: Levene-Test.
Was ist der Unterschied zwischen parametrischen und nicht-parametrischen Tests?
Parametrische Tests: Erfordern bestimmte Annahmen (z. B. Normalverteilung, gleiche Varianzen). Beispiele: t-Test, ANOVA.
Nicht-parametrische Tests: Keine strengen Annahmen, geeignet für ordinale Daten oder Verteilungen ohne Normalität. Beispiele: Mann-Whitney-U-Test, Kruskal-Wallis-Test.
Was ist ein Konfidenzintervall, und wie wird es interpretiert?
Definition: Bereich, in dem der wahre Populationsparameter mit einer bestimmten Wahrscheinlichkeit liegt (z. B. 95 %).
Interpretation: Ein 95%-Konfidenzintervall enthält in 95 von 100 Fällen den wahren Wert, wenn das Experiment wiederholt wird.
Was ist der Unterschied zwischen deskriptiver und inferentieller Statistik?
Deskriptive Statistik: Beschreibung und Zusammenfassung von Daten (z. B. Mittelwert, Median, Standardabweichung).
Inferentielle Statistik: Rückschlüsse von Stichprobendaten auf die Population (z. B. Hypothesentests, Konfidenzintervalle).