VL18-20 Grundgesamtheit,Auswahl,Stichprobe,Vollerhebung,,Zufallstichproben Flashcards

1
Q

Was ist die Grundgesamtheit

A

(Target Population)
Alle Elemente über die Aussagen getroffen werden sollen
z.B. wir wollen alle Menschen in NS per Telefon befragen
z.B. Alle Teilnehmer dieser Veranstaltung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Auswahlgesamtheit

A

(Frame Population)
Menge der Elemente, die in Stichprobe kommen können/zugelassen werden

z.B. Grundgesamtheit: wir wollen alle Menschen in NS per Telefon befragen
ABER Auswahlgesamtheit: Es haben nicht alle Menschen in NS ein Telefon (Undercoverage)

z.B. nicht alle die in dieser Veranstaltung angemeldet sind (Liste) nehmen noch teil (Overcoverage)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was zeichnet eine Vollerhebung aus ?

A

+ Untersuchung von sehr speziellen und relativ kleinen (Teil-)Populationen möglich
+ keine Stichprobenfehler
- Kosten- und zeitintensiv
- z.T. “Unmöglichkeit” von Vollerhebungen
- Fehlerhafte Erhebung nicht ausgeschlossen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was zeichnet eine Stichprobenerhebung aus ?

A

+ Kosten- und zeiteffiziente Erhebung
+ Erfassung vieler Merkmale ohne allzu großen Aufwand
+ Oftmals bessere Messgenauigkeit
(durch z.B. gut geschulte Interviewer:innen und größeren Kontrollmöglichkeiten)
- Induktionsproblem: Stichprobenfehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Vorteile hat eine Totalerhebung gegenüber einer Stichprobe?

A

Es wird die Grundgesamtheit erhoben. Dadurch gibt es keine Stichprobenfehler, da alle Fälle gefunden werden. Wenn ich jeden gefragt habe, so habe ich auch das absolute Meinungsbild erhoben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mit dem Begriff Auswahlgesamtheit ist die Menge der Elemente gemeint, für die später eine
Aussage zulässig ist. (wahr/falsch) Begründen Sie Ihre Entscheidung.

A

Falsch.
Die Auswahlgesamtheit umfasst alle Elemente, die eine prinzipielle Chance haben, in eine
Stichprobe zu gelangen. Overcoverage (Elemente in der Auswahlgesamtheit, die nicht zur
Grundgesamtheit gehören) und Undercoverage (Elemente in der Grundgesamtheit, die in die
Auswahlgesamtheit gehören, dort aber fehlen) sorgen aber dafür, dass sich die Auswahlgrundlage
von der Grundgesamtheit unterscheiden kann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Auswahlgrundlage ist immer die definierte Grundgesamtheit. (wahr/falsch)
Begründen Sie Ihre Entscheidung.

A

Wahr. Die

Grundgesamtheit bezeichnet die Menge derjenigen Objekte, über die mit Hilfe der

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie entstehen Stichproben?

A
  1. Willkürliche Auswahl (convinience sample): Auswahl erfolgt ohne Regeln
    (bzw. ohne transparente und nachvollziebare Regeln)
  2. Bewusste Auswahl (judgement sample):
    Auswahl erfolgt nach bestimmten Regeln, z.B. Schneeballverfahren oder Quotenauswahl
  3. Zufallsauswahl (random sample):
    Auswahl erfolgt nach statistischen Regeln: Jedes Element der Auswahlgesamtheit hat eine
    berechenbare Chance ausgewählt zu werden. Die Erhebungspersonen haben
    keinen Einfluss auf die Auswahl! (einzig gutes Verfahren)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Undercoverage

Overcoverage

A

› Undercoverage (Element gehört zur Grundgesamtheit, fehlt aber in der Auswahlgrundlage)

(z. B. Leute fehlen noch im Email-Verteiler)
(z. B. nicht alle haben ein Telefon in Niedersachen)

› Overcoverage (Element gehört nicht zur Grundgesamtheit, ist aber in der Auswahlgrundlage)

(z. B. Leute sind noch im Email-Verteiler, obwohl sie dort nicht mehr sein sollten)
(z. B. Telefonnummer aber Person wohnt nicht mehr in Niedersachen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist die Erhebungseinheit

A

gleichzusetzen mit Grundgesamtheit (Zielpopulation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Analyseeinheit

A

Stichprobe

Nettostichprobe auf die sich die konkreten Aussagen tatsächlich beziehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Stichprobe (survey Population)

A

Menge der Elemente, über die Aussagen zulässig sind
bzw. gemacht werden können, sollte möglichst nah an Zielpopulation sein (Verallgemeinerbarkeit)

Analyseeinheit: Die Einheit, die Teil der Nettostichprobe ist und auf die sich die konkreten Aussagen tatsächlich beziehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Warum werden für repräsentative Erhebungen Zufallsstichproben bevorzugt?

A
  • keine bewusste, sondern zufällige Auswahl von Befragten –> Repräsentativität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ab welcher Stichprobengröße wird die Verteilung eines Merkmals in der Grundgesamtheit
angemessen abgebildet?

A
  • abhängig von der Auftrittshäufigkeit eines Merkmals sowie der befragten Grundgesamtheit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Warum hat die Anzahl der betrachteten Merkmalsausprägungen etwas mit der Stichprobengröße
zu tun?

A
  • seltene Phänomene werden mit steigender Stichprobengröße wahrscheinlicher abgedeckt, in
    kleinen Stichproben eher weniger
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

einfache Zufallsauswahl

A

› alle denkbaren Stichproben und Elemente haben
dieselbe Chance ausgewählt zu werden

›Ziehung erfolgt in einem einstufigen Auswahlverfahren

›Stichprobenfehler= Standardfehler (SE) (je
kleiner der SE, umso genauer ist im Durchschnitt
die Schätzung einer Populationseigenschaft)

›Je größer die Stichprobe, desto kleiner die Standardfehler

›Mögliche Verfahren: Listenwahl (Telefonbuch), Lotterie,
–> Random-Route-Verfahren, Schwedenschlüssel

17
Q

Random Walk

A

einfache Zufallsauswahl
- Unabhängigkeit der einzelnen Schritte.
Jeder Schritt des Walkers hängt nur von seiner aktuellen Position (Gegenwart) und nicht von den bereits besuchten Plätzen (Vergangenheit) ab. Jeder Teilschritt ist ein neuer Ursprung. Der Walker kann also vorher besetzte Pla ̈tze nochmals belegen (kei- ne Selbstvermeidung) und der Pfad des Walkers ist nicht kreuzungsfrei

18
Q

Gründe für Nonresponse

A

nicht aufgefundene Adressen, Personen gehören nicht zur Grundgesamtheit, Interviewer:innenausfälle, Nichterreichbarkeit einer Kontaktperson
Abbruch während des Interviews Interviewer:innentäuschungen,Datenerfassungs- und aufbereitungsfehler

19
Q

Zufällige Ausfälle bzw Ursachen für Nonresponse

A

Zufällige Ausfälle
› “Kein Anschluss unter dieser Nummer”
› Technische Störung
› Kein Privathaushalt (wenn GG nur Privathaushalte umfasst)

20
Q

Systematische Ausfälle

A
Systematische Ausfälle
›	Verweigerung durch Kontaktperson
›	Verweigerung durch Zielperson
›	Teilnehmende unterscheiden sich
systematisch hinsichtlich einer oder 
mehrerer Variablen
21
Q

Arten von Ausfällen

A

› Missing completely at random (MCAR): vollkommen zufällige Ausfälle
- unverzerrte Schätzung (z.B. technische Störungen)

› Missing at random (MAR):
- steht zumindest teilweise im Zusammenhang mit einer anderen erhobenen Variablen
- verzerrte Schätzung
- kann unverzerrte Schätzung ermöglichen durch Nutzung der vorhandenen Informationen in
den anderen Variablen
- z.B. geringere Bildung -. seltenere Teilnahme

› Missing not at random (MNAR):
- Ausfälle bzw. Ausfallwahrscheinlichkeit kann nur durch Variable selbst oder durch andere
nicht-erhobene Variablen erklärt werden
- klare Regelmäßigkeiten des Ausfalls, eine Zufälligkeit ist vollkommen auszuschließen
- verzerrte Schätzung
- z.B.: Totalausfall in einer späteren Panelwelle-

22
Q

MNAR

A

Missing not at random (MNAR):
- Ausfälle bzw. Ausfallwahrscheinlichkeit kann nur durch Variable selbst oder durch andere
nicht-erhobene Variablen erklärt werden
- klare Regelmäßigkeiten des Ausfalls, eine Zufälligkeit ist vollkommen auszuschließen
- verzerrte Schätzung
- z.B.: Totalausfall in einer späteren Panelwelle-

23
Q

› Missing at random (MAR):

A
  • steht zumindest teilweise im Zusammenhang mit einer anderen erhobenen Variablen
  • verzerrte Schätzung
  • kann unverzerrte Schätzung ermöglichen durch Nutzung der vorhandenen Informationen in
    den anderen Variablen
  • z.B. geringere Bildung -. seltenere Teilnahme
24
Q

geschichtete Zufallsauswahl

A

› Zerlegung der Gesamtpopulation in Teilgruppen
(z.B. Bundesländer), aus denen Elemente ausgewählt
werden
› Kann nur in einer sein
› Ziehung von Stichproben für die einzelnen Teilgruppen
(Bawü, Bayern, Berlin, … ,Sachsen
› unterschied!. Gruppengrößen)
› Auswahlwahrscheinlichkeit proportional zur
Gruppengröße gewährleistet eine unverzerrte
Schätzung des Populationsmittelwerts
–> Bei Berechnungen von Mittelwerten muss die
Schichtgröße berücksichtigt werden.

25
Q

mehrstufige Zufallsauswahl/Klumpensitchprobe

A

mehrstufige Zufallsauswahl/Klumpensitchprobe
› zufällige Auswahl des Clusters oder Klumpen:
› Auswahl bezieht sich nicht auf die einzelnen Elemente,
sondern auf zusammengefasste Elemente
› sample points (lokale Befragungsorte)
Elemente eines sample points weisen oft höhere
Gemeinsamkeiten auf (z.B. Dialekt, Konfession,
Bildungsgrad)
› kann zu Verschlechterung der Standardfehler führen
› kann durch größere Stichproben ausgeglichen werden
› Beispiel Allbus