VL8 - Stichprobenziehung Flashcards
Def. Population
= die Menge aller potentiellen Untersuchungsobjekte
Warum werden Stichproben erhoben?
Weil man nicht die gesamte Population untersuchen kann.
Vor- und Nachteile von Stichproben
+ ökonomischer, weniger Ressourcen (Geld, Zeit, Personal) nötig
+ ggf. bessere Qualität der Daten, da die Ressourcen konzentriert werden können
- verschiedene Fehlerquellen, u.a. Stichprobenfehle
Inferenzschluss
In der Wissenschaft wird eine Schätzung auf die Population anhand der in der Stichproben erhobenen Daten getätigt
Stichprobenumfang
- Allgemein gilt: Je größer der Stichprobenumfang, desto kleiner der Stichprobenfehler. Allerdings können auch bei großen Stichproben Verzerrungen auftreten, was von der Art der Stichprobenziehung abhängt.
- Verzerrte Stichproben stellen eines der Hauptprobleme der Forschung dar. Gegen systematische Verzerrungen (= bias) helfen auch große Stichproben nichts.
Coverage Fehler
Mangelnde Übereinstimmung zwischen Ziel- und Erhebungspopulation (over- / under-coverage möglich)
Stichprobenfehler
Fehler bei der Übertragung der Stichprobenergebnisse auf Populationsparameter
Nonresponse-Fehler
Fehler durch Nichtbeantwortung vereinzelter oder mehrerer Fragen bis hin zur kompletten Nichtteilnahme
EE
Erhebungseinheiten
undercoverage
EE, die zur Zielpopulation gehören, aber nicht Teil der Erhebungspopulation sind.
overcoverage
EE, die sich in der Erhebungspopulation befindet, obwohl sie nicht zur Zielpopulation gehören.
Zufallsstichproben vs. Nicht-Zufallsstichproben
Zufallsstichproben: Wahrscheinlichkeitsstichproben, probability samples
Nicht- Zufallsstichproben: nonprobability samples, manchmal auch purposive samples, die mit nicht zufällig, sondern gezielt und mit einer bestimmten Absicht zusammengestellt werden
Nicht-Zufallsstichproben (6)
Gelegenheitsstichproben
Systematische Stichproben
Stichproben nach dem Schneeballsystem
Quotenstichproben:
-Einfache Quotierung
-Kombinierte Quotierung
Stichproben nach dem Schneeballsystem
EE wählen weitere EE aus oder geben die
Befragungsinstrumente weiter, die dann anonym zurückgesendet werden
Gelegenheitsstichproben
convenience sample, EE werden auf Basis der leichten Verfügbarkeit ausgewählt
Systematische Stichproben
werden aufgrund von speziellen Erwägungen (z.B. Expertise in einem Bereich) ausgewählt
Quotenstichproben
EE werden so ausgewählt, dass ihre Anteile (Quoten) denen in der Population hinsichtlich einiger Variablen entsprechen. Diese Gruppe von Verfahren lassen sich unterteilen in Einfache Quotierung und Kombinierte Quotierung
Einfache Quotierung
Die Randverteilungen der Quotierungsvariablen in der Stichprobe stimmen mit denen in der Population überein. (z.B. Geschlecht)
Kombinierte Quotierung
Die Kombination von Quotierungsvariablen in der Stichprobe stimmen mit denen in der Population überein
Warum überhaupt Nicht Zufallsstichproben erheben?
- Nicht-Zufallsstichproben sind weit verbreitet und oftmals der einzig praktikable Weg, eine Stichprobe zu erheben.
- Ihr Hauptproblem besteht in der subjektiven Auswahl der EE, die z.B. die Abschätzung des Stichprobenfehlers unmöglich macht.
- Verzerrte Stichproben können eine große Gefahr für die Validität der Schlussfolgerungen aus der jeweiligen Studie darstellen
Def. Zufallsauswahl
ist ein Stichprobenverfahren, bei dem jedem Element der Grundgesamtheit eine bestimmte Wahrscheinlichkeit (pi) zukommt, in die Stichprobe aufgenommen zu werden. In den allermeisten Fällen sollte für eine Zufallsauswahl jedem Element dieselbe Wahrscheinlichkeit zukommen.
Arten Zufallswahl
- Einfache Zufallsauswahl (simple random sampling)
- Mehrstufige Zufallsauswahl (multistage random sampling)
- Geschichtete Zufallsauswahl (stratified sampling)
- Klumpenauswahl (cluster sampling)
einfache Zufallsauswahl
- liegt dann vor, wenn die Auswahlwahrscheinlichkeit für alle EE der Grundgesamtheit gleich ist.
- Die Stichprobe muss zudem in einem einstufigen Verfahren erhoben werden.
- Benötigt wird eine durchnummerierte Liste mit allen EE (Population) und eine Methode der zufälligen Auswahl, z.B. über Zufallszahlen.
mehrstufigen Zufallsauswahl
Bei der mehrstufigen Zufallsauswahl werden aus der Population sequentiell Zufallsstichproben gezogen.
Beispiele:
Mehrstufige Auswahl: 1. Stufe –Zufallsauswahl von Haushalten via Telefonbuch, 2. Stufe – Individuumsauswahl im Haushalt via Schlüssel, z.B. Schwedenschlüssel.
Dreistufige Auswahl
Standardvorgehen der „Arbeitsgemeinschaft deutscher Marktforschungsinstitute“ (ADM-Design), mit denen z.B. Wahlumfragen betrieben werden
Beispiel einer Dreistufigen Auswahl
1.Stufe: Auswahl der Stimmbezirke
2.Stufe: Auswahl von Haushalten über Random-Route-Verfahren
3.Stufe: Individuumsauswahl per Schwedenschlüssel
geschichteten Zufallsauswahl
- Bei der geschichteten Zufallsauswahl wird die Population zunächst nach mehreren Merkmalen (in Schichten) unterteilt.
- Dann zieht man für jede Schicht Zufallsstichproben bestimmter Größe.
a) Die Größe dieser Teilstichproben entspricht bei proportionaler Schichtung ihrem Anteil an der Population.
b) Bei disproportionaler Schichtung werden bestimmte Schichten absichtlich über- bzw. unterrepräsentiert (= over- bzw. undersampling). Die Über- bzw. Unterrepräsentanz muss später über Gewichte wieder ausgeglichen werden.
Klumpenauswahl
Bei der Klumpenauswahl wird wie in der zweistufigen Zufallsauswahl vorgegangen, nur dass in der zweiten Stufe alle EE aufgenommen werden.
Klumpeneffekt
Ein großes Problem stellt der Klumpeneffekt dar, d.h. dass die Verteilung der EE auf die Klumpen meist nicht unabhängig von den Eigenschaften der EE sind.
+/- Der Stichprobenfehler ist umso größer… (Klumpenauswahl)
- je weniger Klumpen
- je größer die Klumpen relativ zur Population
- je homogener die EE innerhalb der Klumpen
- je heterogener die EE zwischen den Klumpen
Welche Fehlerquellen werden unterschieden?
(1) Zufallsfehler der Stichprobe (Stichprobenfehler)
(2) Systematische Fehler (bias) durch das Verfahren der Stichprobenauswahl,
- z.B. wenn bestimmte EE über- bzw. unterrepräsentiert sind
(3) Verzerrungen, die nicht direkt durch das Auswahlverfahren produziert werden (nonsampling error)
Unterteilung nonsampling error (4)
- (coverage-Fehler)
- Non-response
- Messfehler
- Fehler bei der Datenaufbereitung und -analyse
Non-response
=(Ausfälle) können sich beziehen auf die gesamte Befragung
(= unit non-response) oder nur auf einzelne Fragen (item non-response)
Ursachen von unit non-response
- Die mangelnde Erreichbarkeit der Befragten.
- Die Weigerung, an der Studie teilzunehmen.
- Die Unfähigkeit der Befragten, an der Studie teilzunehmen.
Ursachen von item non-response
Bei item non-response kommen als Ursachen neben der Weigerung (z.B. bei sensiblen Fragen) auch das unzureichende Verständnis der Frage oder die Einschätzung des Befragten, nicht über die Information zu verfügen, in Betracht.
Konsequenzen von non-response
- Verringerung des Stichprobenumfangs (Erhöhung des Stichprobenfehlers, Schwierigkeiten bei der statistischen Analyse)
- ggf. Verzerrungen (bias), wenn die Nicht-Teilnahme mit den erfassten Variablen zusammenhängt
- Beispiel für bias: Unterschätzung der Zahl der Single-Haushalte in Abhängigkeit von der Häufigkeit der Kontaktversuche
- Beispiel: Drop-out in einer klinischen Studie, Einführung eines Bewegungsprogrammes in der stationären Rehabilitation für psychisch Kranke
Maßnahmen zur Reduktion der Weigerung an einer Studie teilzunehmen
- Vorabinformationen
- Anreize für die Teilnahme
- Geringeren Umfang der Studie