Kap.6-Stichprobenziehung Flashcards
Warum Stichproben?
- Man kann nicht alle Untersuchungseinheiten miteinbeziehen: zu viel Zeit und Kosten > Stichproben
- Hängt mit Wahrscheinlichkeitstheorie zusammen
Grundgesamtheit (Population)
- Elemente auf die sich Aussagen einer statistischen Analyse beziehen
- Sachlich, räumlich, zeitlich exakt zu definieren
- Totalerhebung zu teuer deshalb Stichprobe
Stichprobe (Sample)
Auswahl von Elementen
Sollte möglichst repräsentatives Bild der GG liefern
Zufallsstichprobe: Erhebungseinheiten werden nach dem Zufallsprinzip ausgewählt
Erhebungseinheiten: Elemente der Population auf die sich die Auswahl bezieht und welche Chance haben, in die Stichprobe aufgenommen zu werden
Stichprobenverfahren
- Vorschrift, welche festlegt, wie Elemente der GG ausgewählt werden
Stichprobenumfang
- Anzahl der ausgewählten Elemente, die i.d.R. Mit N bezeichnet werden
- Meist mit Unsicherheitsintervall
Vorteile von Stichproben
- billiger als Totalerhebungen
- Schnellere Ergebnisse
- Weniger MA
- Bessere Umgang mit Ausfällen (Nichterreichbarkeit) möglich
Nachteile von Stichproben
- bei zu kleinen GG (300) nicht sinnvoll
- Bei Subpopulationen auch nicht anwendbar
- Nicht möglich bei Rückrufaktionen für bspw. Autos
Zufallsstichproben
- zufällig, wenn jede Einheit der Auswahlgesamtheit die gleiche Wahrscheinlichkeit hat in Stichprobe u gelangen
Verschieden Verfahren
- Einfache Zufallsstichproben
- Komplexe Zufallsstichproben
- wenn keine Liste vorliegt: random-route-Optionen: setzt Vorgabe von Startadressen voraus
Grundformen der Auswahlverfahren
- Vollerhebung
- Teilerhebung
- willkürliche Auswahl
- Repräsentative Auswahl
- Bewusste Auswahl
- Quotenauswahl
- Auswahl nach dem Konzentrationsprinzip
- Typische Auswahl
- Zufallsauswahl
- Einfach Zufallsauswahl
- Uneingeschränkte Zufallsauswahl (Lotterieauswahl)
- Auswahltechniken (z.B. Systematische Zufallsauswahl)e
- Sonderformen
- Klumpenauswahl
- Geschichtete Auswahl
- Proportional
- Disproportional
Einfache Zufallsstichproben
- aus vollständiger Liste
- Nach Zufallsprinzip
- Eine Anzahl von Objekten auswählen
- Auswahlwahrscheinlichkeiten aller Objekte gleich groß
- Nach Wahrscheinlichkeitsgesetz (um statistisch gesicherte Aussagen zu machen)
Reine Zufallsstichprobe (sechseitiger Würfel)
- Ausgangspunkt: GG mit Umfang N, eine Einheit auswählen
- Ziehung erfolgt durch Zufallsexperiment
- Wiederholungen: Ziehungsergebnisse haben alle die gleiche Wahrscheinlichkeit
- = uneingeschränkte Zufallsauswahl mit Zurücklegen
Systematische Zufallsstichprobe
- das erste Element wird per Zufall ermittelt
- Von diesem ausgehend werden die nächsten Elemente systematisch ausgewählt
- Damit ist jedes k-te Element ind er Stichprope
- K = Stichprobenintervall
Komplexe Zufallsstichproben
- wenn keine Auflistung der Auswahlgesamtheit vorliegt
- Geschichtete Stichproben, Klumpenstichprobe, mehrstufige Stichprobenverfahren
- Elemente werden in Schichten eingeteilt, daraus werden Zufallsstichproben gezogen
- Dann arithmetisches Mittel der ermittelten Stichprobenmittel
Geschichtete Zufallsstichproben
- Varianz
- Konfidenzintervall
- Je größer die Homogenität der Auswahlgesamtheit, desto kleiner Stichprobenfehler
- Proportional geschichtete Stichprobe:
- Größe der Stichprobe einer Schicht wird entsprechend ihres Anteils an der Auswahlgesamtheit ausgewählt
- Bsp. Anteil der Arbeiter einer Stichprobe entspricht dem Anteil der Auswahlgesamtheit - Disproportional geschichtete Stichprobe:
- Größe der Stichprobe einer Schicht wird überproportional zum Anteil an der GG ausgewählt
- Bsp. Anteil der Ostdeutschen in der Stichprobe ist höher als der Anteil der Westdeutschen
Klumpenstichprobe
- möglich, wenn GG in mehrere Teile (Klumpen) zerlegt werden kann
1) Aus allen Klumpen werden in einer uneingeschränkten Zufallsauswahl einzelne ausgewähl, Anzahl der ausgewählten Klumpen ist erster Stichprobenumfang
2) Sämtliche Einheiten (Personen) der ausgewählten Klumpen werden erfasst
3) Anzahl der ausgewählten Einheiten ist der zweite Stichprobneumfang, dieser ist der eigentlich Umfang der eigentliche Umfang einer Klumpenstichprobe
4) Auswahl bezieht sich nicht auf Untersuchungseinheiten, sondern auf Aggregate von Untersuchungseinheiten (= Klumpen)
Vorteile der Klumpenstichprobeq
- nur umfassende Auswahlgrundlage für Klumpen, nicht für Gesamtheit aller Untersuchungseinheiten erforderlich
- Bei organisatorischen und geographischen Abgrenzungen der Klumpen ist kostengünstige Erhebung der Einheiten möglich
- Idealfall: alle Klumpen gleich groß und geben Heterogenität der GG wider
Nachteile der Klumpenstichprobe
- je unterschiedlicher die Klumpen in Größe und je homogener in Bezug auf Untersuchungsmerkmal, desto größer ist der Schätzfehler, die ist der Klumpeneffekt
Quotenstichprobe (Sonderfall)
- Unterteilung der GG in Subpopulationen mittels Schichtungsmerkmalen
- Interviewer erhalten auf Einteilung der Population basierende Vorgaben (= Quoten) , wieviele Beobachtungen mit welchen bestimmten Merkmalskombinationen zu erheben sind
- Quoten werden so gewählt, dass Stichprobenanteile der Subpopulationen möglichst den Populationsanteilen entsprechen
- Interviewer entscheiden (nicht Zufallsmechanismus), wie diese Quoten erfüllt werden = subjektiv
- Kein probabilistisches Zufallsverfahren > keine inferenzstatistische Verfahren möglich
Problem: fehlende Werte
- Nonresponse: Problem von fehlenden Informationen auf Ebene der Beobachtungen
- Angaben fehlen = unvollständige Informatinen
- Unit-Nonresponse: Für eine bestimmte Beobachtung liegen überhaupt keine Informationen vor
- Item-Nonresponse: für bestimmte Beobachtung liegen für eines oder mehrere (aber nicht alle) Merkmale keine Informationen vor
- Warum keine Response? Grund zu finden ist schwer