VL18-20 Grundgesamtheit,Auswahl,Stichprobe,Vollerhebung,,Zufallstichproben Flashcards
Was ist die Grundgesamtheit
(Target Population)
Alle Elemente über die Aussagen getroffen werden sollen
z.B. wir wollen alle Menschen in NS per Telefon befragen
z.B. Alle Teilnehmer dieser Veranstaltung
Was ist die Auswahlgesamtheit
(Frame Population)
Menge der Elemente, die in Stichprobe kommen können/zugelassen werden
z.B. Grundgesamtheit: wir wollen alle Menschen in NS per Telefon befragen
ABER Auswahlgesamtheit: Es haben nicht alle Menschen in NS ein Telefon (Undercoverage)
z.B. nicht alle die in dieser Veranstaltung angemeldet sind (Liste) nehmen noch teil (Overcoverage)
Was zeichnet eine Vollerhebung aus ?
+ Untersuchung von sehr speziellen und relativ kleinen (Teil-)Populationen möglich
+ keine Stichprobenfehler
- Kosten- und zeitintensiv
- z.T. “Unmöglichkeit” von Vollerhebungen
- Fehlerhafte Erhebung nicht ausgeschlossen
Was zeichnet eine Stichprobenerhebung aus ?
+ Kosten- und zeiteffiziente Erhebung
+ Erfassung vieler Merkmale ohne allzu großen Aufwand
+ Oftmals bessere Messgenauigkeit
(durch z.B. gut geschulte Interviewer:innen und größeren Kontrollmöglichkeiten)
- Induktionsproblem: Stichprobenfehler
Welche Vorteile hat eine Totalerhebung gegenüber einer Stichprobe?
Es wird die Grundgesamtheit erhoben. Dadurch gibt es keine Stichprobenfehler, da alle Fälle gefunden werden. Wenn ich jeden gefragt habe, so habe ich auch das absolute Meinungsbild erhoben.
Mit dem Begriff Auswahlgesamtheit ist die Menge der Elemente gemeint, für die später eine
Aussage zulässig ist. (wahr/falsch) Begründen Sie Ihre Entscheidung.
Falsch.
Die Auswahlgesamtheit umfasst alle Elemente, die eine prinzipielle Chance haben, in eine
Stichprobe zu gelangen. Overcoverage (Elemente in der Auswahlgesamtheit, die nicht zur
Grundgesamtheit gehören) und Undercoverage (Elemente in der Grundgesamtheit, die in die
Auswahlgesamtheit gehören, dort aber fehlen) sorgen aber dafür, dass sich die Auswahlgrundlage
von der Grundgesamtheit unterscheiden kann.
Auswahlgrundlage ist immer die definierte Grundgesamtheit. (wahr/falsch)
Begründen Sie Ihre Entscheidung.
Wahr. Die
Grundgesamtheit bezeichnet die Menge derjenigen Objekte, über die mit Hilfe der
Wie entstehen Stichproben?
- Willkürliche Auswahl (convinience sample): Auswahl erfolgt ohne Regeln
(bzw. ohne transparente und nachvollziebare Regeln) - Bewusste Auswahl (judgement sample):
Auswahl erfolgt nach bestimmten Regeln, z.B. Schneeballverfahren oder Quotenauswahl - Zufallsauswahl (random sample):
Auswahl erfolgt nach statistischen Regeln: Jedes Element der Auswahlgesamtheit hat eine
berechenbare Chance ausgewählt zu werden. Die Erhebungspersonen haben
keinen Einfluss auf die Auswahl! (einzig gutes Verfahren)
Undercoverage
Overcoverage
› Undercoverage (Element gehört zur Grundgesamtheit, fehlt aber in der Auswahlgrundlage)
(z. B. Leute fehlen noch im Email-Verteiler)
(z. B. nicht alle haben ein Telefon in Niedersachen)
› Overcoverage (Element gehört nicht zur Grundgesamtheit, ist aber in der Auswahlgrundlage)
(z. B. Leute sind noch im Email-Verteiler, obwohl sie dort nicht mehr sein sollten)
(z. B. Telefonnummer aber Person wohnt nicht mehr in Niedersachen)
Was ist die Erhebungseinheit
gleichzusetzen mit Grundgesamtheit (Zielpopulation)
Analyseeinheit
Stichprobe
Nettostichprobe auf die sich die konkreten Aussagen tatsächlich beziehen
Stichprobe (survey Population)
Menge der Elemente, über die Aussagen zulässig sind
bzw. gemacht werden können, sollte möglichst nah an Zielpopulation sein (Verallgemeinerbarkeit)
Analyseeinheit: Die Einheit, die Teil der Nettostichprobe ist und auf die sich die konkreten Aussagen tatsächlich beziehen
Warum werden für repräsentative Erhebungen Zufallsstichproben bevorzugt?
- keine bewusste, sondern zufällige Auswahl von Befragten –> Repräsentativität
Ab welcher Stichprobengröße wird die Verteilung eines Merkmals in der Grundgesamtheit
angemessen abgebildet?
- abhängig von der Auftrittshäufigkeit eines Merkmals sowie der befragten Grundgesamtheit
Warum hat die Anzahl der betrachteten Merkmalsausprägungen etwas mit der Stichprobengröße
zu tun?
- seltene Phänomene werden mit steigender Stichprobengröße wahrscheinlicher abgedeckt, in
kleinen Stichproben eher weniger
einfache Zufallsauswahl
› alle denkbaren Stichproben und Elemente haben
dieselbe Chance ausgewählt zu werden
›Ziehung erfolgt in einem einstufigen Auswahlverfahren
›Stichprobenfehler= Standardfehler (SE) (je
kleiner der SE, umso genauer ist im Durchschnitt
die Schätzung einer Populationseigenschaft)
›Je größer die Stichprobe, desto kleiner die Standardfehler
›Mögliche Verfahren: Listenwahl (Telefonbuch), Lotterie,
–> Random-Route-Verfahren, Schwedenschlüssel
Random Walk
einfache Zufallsauswahl
- Unabhängigkeit der einzelnen Schritte.
Jeder Schritt des Walkers hängt nur von seiner aktuellen Position (Gegenwart) und nicht von den bereits besuchten Plätzen (Vergangenheit) ab. Jeder Teilschritt ist ein neuer Ursprung. Der Walker kann also vorher besetzte Pla ̈tze nochmals belegen (kei- ne Selbstvermeidung) und der Pfad des Walkers ist nicht kreuzungsfrei
Gründe für Nonresponse
nicht aufgefundene Adressen, Personen gehören nicht zur Grundgesamtheit, Interviewer:innenausfälle, Nichterreichbarkeit einer Kontaktperson
Abbruch während des Interviews Interviewer:innentäuschungen,Datenerfassungs- und aufbereitungsfehler
Zufällige Ausfälle bzw Ursachen für Nonresponse
Zufällige Ausfälle
› “Kein Anschluss unter dieser Nummer”
› Technische Störung
› Kein Privathaushalt (wenn GG nur Privathaushalte umfasst)
Systematische Ausfälle
Systematische Ausfälle › Verweigerung durch Kontaktperson › Verweigerung durch Zielperson › Teilnehmende unterscheiden sich systematisch hinsichtlich einer oder mehrerer Variablen
Arten von Ausfällen
› Missing completely at random (MCAR): vollkommen zufällige Ausfälle
- unverzerrte Schätzung (z.B. technische Störungen)
› Missing at random (MAR):
- steht zumindest teilweise im Zusammenhang mit einer anderen erhobenen Variablen
- verzerrte Schätzung
- kann unverzerrte Schätzung ermöglichen durch Nutzung der vorhandenen Informationen in
den anderen Variablen
- z.B. geringere Bildung -. seltenere Teilnahme
› Missing not at random (MNAR):
- Ausfälle bzw. Ausfallwahrscheinlichkeit kann nur durch Variable selbst oder durch andere
nicht-erhobene Variablen erklärt werden
- klare Regelmäßigkeiten des Ausfalls, eine Zufälligkeit ist vollkommen auszuschließen
- verzerrte Schätzung
- z.B.: Totalausfall in einer späteren Panelwelle-
MNAR
Missing not at random (MNAR):
- Ausfälle bzw. Ausfallwahrscheinlichkeit kann nur durch Variable selbst oder durch andere
nicht-erhobene Variablen erklärt werden
- klare Regelmäßigkeiten des Ausfalls, eine Zufälligkeit ist vollkommen auszuschließen
- verzerrte Schätzung
- z.B.: Totalausfall in einer späteren Panelwelle-
› Missing at random (MAR):
- steht zumindest teilweise im Zusammenhang mit einer anderen erhobenen Variablen
- verzerrte Schätzung
- kann unverzerrte Schätzung ermöglichen durch Nutzung der vorhandenen Informationen in
den anderen Variablen - z.B. geringere Bildung -. seltenere Teilnahme
geschichtete Zufallsauswahl
› Zerlegung der Gesamtpopulation in Teilgruppen
(z.B. Bundesländer), aus denen Elemente ausgewählt
werden
› Kann nur in einer sein
› Ziehung von Stichproben für die einzelnen Teilgruppen
(Bawü, Bayern, Berlin, … ,Sachsen
› unterschied!. Gruppengrößen)
› Auswahlwahrscheinlichkeit proportional zur
Gruppengröße gewährleistet eine unverzerrte
Schätzung des Populationsmittelwerts
–> Bei Berechnungen von Mittelwerten muss die
Schichtgröße berücksichtigt werden.
mehrstufige Zufallsauswahl/Klumpensitchprobe
mehrstufige Zufallsauswahl/Klumpensitchprobe
› zufällige Auswahl des Clusters oder Klumpen:
› Auswahl bezieht sich nicht auf die einzelnen Elemente,
sondern auf zusammengefasste Elemente
› sample points (lokale Befragungsorte)
Elemente eines sample points weisen oft höhere
Gemeinsamkeiten auf (z.B. Dialekt, Konfession,
Bildungsgrad)
› kann zu Verschlechterung der Standardfehler führen
› kann durch größere Stichproben ausgeglichen werden
› Beispiel Allbus