Stichprobe & Population Flashcards
Probabilistische Stichprobe
Stichprobe, die nach Zufallsprinzipien aus der Grundgesamtheit bestimmt wurde. Die Auswahlwahrscheinlichkeiten aller Objekte sind gleich hoch. Wichtige probabilistische Stichproben sind die einfache Zufallsstichprobe, die Klumpenstichprobe und die geschichtete Stichprobe.
Nicht-probabilistische Stichprobe
Stichprobe, die nicht nach Zufallsprinzipien bestimmt wurde. Die Auswahlwahrscheinlichkeiten aller Objekte sind ungleich. Zu den nicht-probabilistischen Stichproben gehören die Quotenstichprobe, die theoretische Stichprobe sowie die Ad-hoc-Stichprobe.
Probabilistisch:
Einfache Zufallsstichprobe
- Wird angewandt, wenn über die Verteilung der untersuchten Merkmale nichts bekannt ist.
- Aus einer Grundgesamtheit von N Objekten wird eine Stichprobe von n Objekten gezogen. Ist eine
Zufallsstichprobe einfach, so besitzt jedes Objekt der Grundgesamtheit die gleiche Wahrscheinlichkeit,
ausgewählt zu werden. - Häufig sind nicht alle Untersuchungsobjekte, die zu einer Population gehören, bekannt, sodass man
gelegentlich mit Ad-hoc-Stichproben arbeitet (bspw. TeilnehmerInnen in einem Seminar). Somit werden
die Personen, die gerade umständehalber zur Verfügung stehen, als Stichprobe genommen.
Probabilistisch:
Klumpenstichprobe
- Bezeichnet vorgruppierte Teilmengen (Cluster Samples).
- Begriff Klumpenstichprobe nur zulässig, wenn mehrere zufällig ausgewählte Klumpen vollständig
untersucht werden. Entspricht einer eingeschränkten Zufallsauswahl! - Die Klumpen sollen die meiste Variation des zu untersuchenden Merkmals jeweils selbst
beinhalten und ansonsten möglichst homogen zueinander sein. Man unterscheide:
• einstufige Klumpenstichproben: in den ausgewählten Klumpen findet eine Totalerhebung statt.
• zweistufige Klumpenstichproben: in den ausgewählten Klumpen findet eine zufällige Teilerhebung statt.
Probabilistisch:
Geschichtete Stichprobe
Hierbei sind die Determinanten, welche die Verteilung eines Merkmals beeinflussen, bekannt. So empfiehlt es sich eine Stichprobe zu generieren, die bezüglich der Determinanten für die Grundgesamtheit spezifisch repräsentativ sind. Die Relevanz der Merkmale ist hierbei ausschlaggebend. Die Schichten sollen hinsichtlich eines oder mehrerer Merkmale, die auch die Ausprägung des letztlich interessierenden Merkmals beeinflussen, in sich relativ homogen sein und sich voneinander möglichst deutlich unterscheiden. Typische Schichten wären etwa Altersgruppen oder Bevölkerungsschichten nach Einkommen, Bildungsabschluss, Wohnort etc.
Nicht-probabilistische Stichproben Arten
Quotenstichprobe:
(keine Zufallsstichproben, beruhen auf einer bewussten Auswahl von
Zielpersonen. Es wird versucht, eine repräsentative Zusammensetzung der
Stichprobe durch die Festlegung von Quoten an bestimmten Merkmalen,
deren Verteilung in der Grundgesamtheit bekannt sein müssen,
herbeizuführen. Den Interviewern werden genaue Vorgaben gemacht,
welche Eigenschaften die zu befragenden Personen haben müssen).
Theoretische Stichprobe:
(wählt gezielt MerkmalsträgerInnen, an denen die zu untersuchende
Eigenschaft besonders deutlich oder in besonders geringem Umfang in
Erscheinung tritt. Ferner wird nach sehr ähnlichen und betont-verschiedenen
Fällen gesucht. Auf diese Weise wird Schritt für Schritt das Spektrum der
Messwerte abgesteckt.
Ad-hoc-Stichprobe
Stichprobenverteilung
Die Stichprobenverteilung stellt eine theoretische Verteilung dar, welche die möglichen Ausprägungen eines statistischen Kennwerts sowie deren Auftretenswahrscheinlichkeit beim Ziehen von Zufallsstichproben des Umfangs n beschreibt.
Empirische Stichprobenverteilung vs. Theoretische Stichprobenverteilung
Während eine empirische Stichprobenverteilung die Ergebnisse einer endlichen Anzahl realer Studien abbildet, zeigt eine theoretische Stichprobenverteilung, wie sich die Ergebnisse verteilen würden, wenn man theoretisch unendlich viele Stichproben ziehen würde (Schäfer, 2016).
Standardfehler
Anstatt der Varianz der Mittelwertverteilung verwendet man ihre Standardabweichung, diese wird als Standardfehler des Mittelwerts bezeichnet.
Der Standardfehler des Mittelwertes gibt an, wie sehr der Mittelwert einer Stichprobe vom tatsächlichen Mittelwert in der Grundgesamtheit abweicht. Der Standardfehler wird auch Stichprobenfehler oder SEM genannt.
Der Standardfehler verringert/ vergrößert sich genauso wie die Varianz der Mittelwertverteilung mit wachsendem/ schrumpfenden Stichprobenumfang.
→ Der Standardfehler gibt darüber Auskunft, wie verlässlich unsere Schätzung des statistischen Kennwertes ist
Kriterien der Parameterschätzung
- Konsistenz = von einem konsistenten Schätzwert wird gesprochen, wenn sich ein statistischer Kennwert mit wachsendem Stichprobenumfang dem Parameter, den er schätzen soll, nähert.
- Erwartungstreue= ein statistischer Kennwert schätzt einen Populationsparameter erwartungstreu, wenn der Erwartungswert der Stichprobenverteilung dem Populationsparameter entspricht.
- Effizienz = je größer die Varianz der Stichprobenverteilung, desto geringer ist die Effizienz des entsprechenden Schätzwertes.
- Suffizienz = ein Schätzwert ist suffizient oder erschöpfend hinsichtlich eines Parameters, wenn er alle in einer Stichprobe enthaltenen Informationen berücksichtigt.
Intervallschätzung
- Schätzung von Populationsparametern durch einen einzigen Wert, der aus beobachteten Daten einer Stichprobe ermittelt wird, wird als Punktschätzer bezeichnet.
- Die Punktschätzungen schwanken jedoch von Zufallsstichprobe zu Zufallsstichprobe.
- Das Stichprobenmittel können wir nur schätzen, allerdings wird diese Schätzung immer mit einem Fehler behaftet sein (Standardfehler). Wichtig ist deshalb die Aussagekraft über die Genauigkeit einer Schätzung, wie sie bereits der Standardfehler darstellt.
- In der Praxis wird jedoch standardmäßig die Berechnung eines Bereiches angewandt, in dem man den unbekannten Parameter mit großer Sicherheit vermuten darf. Dieser Bereich nennt sich Konfidenzintervall.
Konfidenzintervall
Erweist sich eine Stichprobenverteilung als normalverteilt, so wird vermutet, dass sich der Mittelwert der Zufallsstichprobe mit einer Wahrscheinlichkeit von 95,5% im Bereich µ ± 2 * 𝜎 von 𝑥(Strich) befindet. Es wird also davon ausgegangen, dass der Mittelwert der Stichprobe vermutlich aus der Population stammt und diesem „wahren“ Populationswert sehr nahe kommt.