9. Inferenzstatistik Flashcards
Womit beschäftigt sich Inferenzstatistik?
Schluss von einer Stichprobe auf die Grundgesamtheit
Testtheorie
= statistisches Prüfen von Hypothesen ausgehend von Stichproben
-> Welchen Schluss lässt beobachteter Unterschied in Stichprobe in Bezug zur Grundgesamtheit zu?
-> Wie wahrscheinlich ist es, dass der in Bezug zur Stichprobe festgestellte Unterschied auch in der Grundgesamtheit vorkommt, bzw. wie wahrscheinlich ist es, dass dieser Unterschied dort nicht existiert?
(-> Beobachteter Unterschied ist nur Zufallsbefund)
Methodenkritik
„In der wissenschaftlichen Literatur gilt ein Ergebnis im Allgemeinen genau dann als ‚signifikant‘, wenn die Wahrscheinlichkeit, dass es sich um einen Zufallsbefund handelt, höchstens 5 Prozent beträgt, was mit dem Ausdruck ‚p≤ 0,05‘ angegeben wird.
-> Dieses Fünfprozentniveau hat keinen tieferen Sinn. Es ist eine willkürlich festgelegte, aber allgemein und international akzeptierte Konvention. In den letzten Jahrzehnten hat die ‚statistische Signifikanz‘ eine herausragende Rolle in der Wissenschaft bekommen und sich zur heiligen Kuh entwickelt“
Normalverteilung
Sehr wichtige Grundannahme in der Inferenzstatistik.
= Werte verteilen sich symmetrisch um arithmetischen Mittelwert; Standardabweichung ebenfalls von Bedeutung
Fläche im Intervall immer = 68,3% der Fläche
Häufigkeiten unterhalb eines bestimmten Wertes: Fläche im Intervall [-∞; μ+1*σ] immer = 84,25% der Fläche
Verfahren, welche auf der Existenz einer Normalverteilung beruhen, können für Stichprobenkennwerte angewendet werden
Standardnormalverteilung
Die Werte werden z-Standardisiert.
Ziel: jedem Wert einen z-Wert zuweisen, welcher den Abstand des Wertes zum arithmetischen Mittelwert (μ) gemessen in Standardabweichungen (σ) angibt.
𝑧 = (𝑥−μ) / σ
Für die resultierende Verteilung ergibt sich ein arithm. Mittelwert von 0 bei einer Standardabweichung von 1.
Jede Normalverteilung lässt sich durch diese z-Transformation in eine Standardnormalverteilung wandeln. Nutzen: Flächenanteile berechnen
Für jeden z-Wert in der Standardnormalverteilung ist ein fester Flächenanteil bestimmbar, welche in der Abbildung Standardnormalverteilung links von diesem z-Wert liegt.
Normalverteilung in der Sozialwissenschaft
Problem: Für die Inferenzstatistik werden häufig Schlüsse verwendet, welche auf der Gültigkeit der Normalverteilung beruhen.
Nur: Viele relevante Daten in der Sozialwissenschaft sind nicht normalverteilt!
Aber: Maßzahlen für Stichproben (z.B. arithmetischer Mittelwert) sind normalverteilt (→Stichprobenkennwerte)
Konfidenzintervalle
Der Schluss von der Stichprobe auf die Grundgesamtheit ist mit einer gewissen Unsicherheit verbunden. Diese ist statistisch erfassbar.
Der Konfidenzintervall gibt einen Bereich an, in dem der Kennwert der Population mit einer bestimmten statistischen Sicherheit bestimmt werden kann.
Punktschätzung
Sinn der Stichprobenziehung ist es, ohne Kenntnis der Gesamtpopulation von der Stichprobe auf diese Population zu schätzen
Nullhypothese
Durch das gewählte Testverfahren wird die Nullhypothese überprüft.
Ergibt dieses Testverfahren, dass die Verteilung nicht zufällig ist, wird die Nullhypothese verworfen. Es kann dann angenommen werden dass die Hypothese zutrifft.
Wichtig: Bestätigung der Nullhypothese beweist nicht das Gegenteil der eigentlichen Hypothese!
Nullhypothese und Prüfwert
Alles bis auf 5. ausgeklammert:
- Formulierung der Alternativhypothese (𝐻1 )
- Formulierung der Nullhypothese (𝐻0)
- Festlegung des Signifikanz-Niveaus
- Auswahl Testverfahren
- Berechnung der Prüfwerte (Software)!
- Auswertung der Prüfwerte, Analyse
Der Prüfwert soll demnach eine Aussage über die Wahrscheinlichkeit eines Zufallsbefundes treffen. Wie wahrscheinlich ist es, dass der gemessene Stichprobenkennwert in der einen beliebigen Stichprobe vorkommt.
α-Fehler / β-Fehler
Beim Schließen von der Stichprobe auf die Grundgesamtheit können hier zwei mögliche Fehler identifiziert werden:
- Stichprobe weist auf Alternativhypothese hin, in Grundgesamtheit liegt aber die Nullhypothese vor (α-Fehler).
- Stichprobe weist auf Nullhypothese hin, obwohl in Grundgesamtheit die Alternativhypothese gilt (β-Fehler).
Da die Grundgesamtheit nicht bekannt ist, muss die Wahrscheinlichkeit berechnet werden, mit welcher diese Fehler ausgeschlossen werden können.
Signifikanzniveaus
In der Sozialwissenschaft wird sehr häufig bei dem α-Fehler eine Irrtumswahrscheinlichkeit von 5% akzeptiert. Ein solcher Schluss wird als „auf dem 5%-Niveau signifikant“ angesehen.
Mittelwerttest
Ziel: These, welche die Wirkung einer unabhängigen Variable auf die abhängige Variable besagt, soll geprüft werden.
einseitige / zweiseitige Fragestellung
Eine zweiseitige Fragestellung ist ungerichtet: „Altersschnitt in Unistädten unterscheidet sich signifikant von Gesamtpopulation“
Eine einseitige Fragestellung ist gerichtet: „Der Altersschnitt in Unistädten ist signifikant niedriger als in der Gesamtpopulation