Auswahlverfahren Flashcards

1
Q

Welche Aussagen will empirische Sozialforschung machen?

Was ist dafür (oft) notwendig?

A

ESF will Aussagen über soziale Sachverhalte machen

  • Exploration
  • Deskription
  • Hypothesentest
  • Erklärung
  • Prognose

Notwendig: Präzisierung des Objektbereichs (Über welche Objekte sollen Aussagen gemacht werden?)
→ Definition der Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wodurch ist die Definition der Grundgesamtheit bestimmt?

A

Definition der Grundgesamtheit keine Frage der Praktikabilität, sondern durch Erkenntnisinteresse bestimmt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Defintion Grundgesamtheit Grundgesamtheit (auch: Population)

A

= Menge der Objekte, für welche

die Aussagen einer Studie gelten sollen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was erfolgt durch Definition der Grundgesamtheit?

A

• Festlegung der Erhebungseinheit = Elemente der Population, auf die
sich Aussagen beziehen sollen (Personen, Organisationen, Länder
etc.)
• raum-zeitliche Eingrenzung (z.B. Bevölkerung Deutschlands in
Privathaushalten im Jahr 2010)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Entscheidung wird nach der Definition der Grundgesamtheit getroffen?

A

Entscheidung darüber, ob alle oder nur ein Teil der Elemente der Grundgesamtheit untersucht werden sollen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vollerhebung:

A

Erhebung der Daten aller Elemente der

Grundgesamtheit (z.B. Volkszählung; sehr kleine Grundgesamtheit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Teilerhebung (Stichprobe):

A

Erhebung der Daten eines Teils der Elemente der Grundgesamtheit (z.B. Mikrozensus mit 1 Prozent Stichprobe der deutschen Wohnbevölkerung)
→ Auswahlverfahren (Stichprobendesigns)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Voll- versus Teilerhebung

A
Vollerhebung:
-vollständige Erhebung des
interessierenden Sachverhalts
-keine Verzerrung durch Fehler
des Stichprobendesigns

Teilerhebung (Stichprobe)
-schneller und kostengünstiger
-unter bestimmten Bedingungen ermöglichen
Stichproben Rückschluss auf Grundgesamtheit
innerhalb von gewissen Fehlermargen
(Aufgabe der Inferenzstatistik)
-unter Umständen weniger fehleranfällig
(Interviewereffekte, bessere Kontrolle und
Auswertung)
-unter Umständen Vollerhebung nicht möglich
(„destruktive Tests“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

im Falle von Stichproben zu unterscheiden:

welches Ziel dabei?

A
  • angestrebte Grundgesamtheit
  • Auswahlgesamtheit (faktische Grundgesamtheit)
  • Inferenzpopulation
  • overcoverage
  • undercoverage

Ziel: möglichst hohe Übereinstimmung von Inferenzpopulation mit
angestrebter Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

angestrebte Grundgesamtheit:

A

Menge aller Objekte, über die eine Aussage angestrebt wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Auswahlgesamtheit (faktische Grundgesamtheit):

A

alle Objekte mit der prinzipiellen Chance, ausgewählt zu werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Inferenzpopulation:

A

Grundgesamtheit, über die tatsächlich Aussagen
möglich sind (Menge von Objekten, über die anhand der vorliegenden
Stichprobe tatsächlich Aussagen möglich sind)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

overcoverage:

A

Einschluss von Elementen, die nicht zur
Grundgesamtheit gehören (z.B. möglich bei Auswahl aus nicht aktuellen
Einwohnermelderegistern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

undercoverage:

A

Auslassen von Elementen, die zur Grundgesamtheit
gehören (z.B. Personen ohne Telefonanschluss bei telefonischer
Befragung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

unterschiedliche Auswahlverfahren

A
  1. Zufallsauswahl
  2. bewusste Auswahl
  3. willkürliche Auswahl
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  1. Zufallsauswahl
A

Kennzeichen: jedes Element der Grundgesamtheit hat berechenbare,
von Null verschiedene Chance in die Stichprobe zu gelangen

Grundlegende Logik: Inferenz

Rückschluss von Verhältnissen in Stichprobe auf Verhältnisse in
Grundgesamtheit, jedoch unter (angebbarer) Unsicherheit
→ statistische Kennzahlen in der Stichprobe als Schätzer für Parameter
der Grundgesamtheit

Beispiel: in Stichprobe ermittelter durchschnittlicher Lohnunterschied
zwischen Männern und Frauen als Schätzer für „wahres“ gender-wagegap

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q
  1. Zufallsauswahl

unterschiedliche Zufallsauswahlverfahren

A

a) einfache Zufallsstichprobe
b) geschichtete Zufallsstichprobe
c) Klumpenstichprobe
d) mehrstufige Auswahlverfahren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q
  1. Zufallsauswahl

a) einfache Zufallsstichprobe

A

Kennzeichen:
• Auswahlwahrscheinlichkeit für alle Elemente identisch und größer Null
(equal probability selection method = EPSEM)
• Auswahl erfolgt in einem einstufigen Auswahlprozess

praktische Stichprobenziehung (in der Regel basierend auf Verwendung
von Listen):
• Lotterieverfahren (bei kleiner Grundgesamtheit)
• Erzeugung von Zufallszahlen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q
  1. Zufallsauswahl

b) geschichtete Zufallsstichprobe

A

Kennzeichen:
• Ziehung einfacher Zufallsstichproben innerhalb von Bevölkerungsgruppen
(Schichten), die entsprechend der Forschungsfrage definiert
werden

zu unterscheiden:
• proportionale Schichtung
• disproportionale Schichtung

20
Q

b) geschichtete Zufallsstichprobe

proportionale Schichtung:

A

Umfang der einfachen Zufallsstichproben entspricht Anteil der Schichten
in Grundgesamtheit
→ gleiche Ziehungswahrscheinlichkeit für alle Elemente (also EPSEMStichprobe)

21
Q

b) geschichtete Zufallsstichprobe

disproportionale Schichtung:

A

Umfang der einfachen Zufallsstichproben entspricht nicht dem Anteil der
Schichten in Grundgesamtheit
→ unterschiedliche Ziehungswahrscheinlichkeit für Elemente der
jeweiligen Schichten (keine EPSEM-Stichprobe)
→ spätere Rückgewichtung (Designgewicht, Inverse der Auswahlwahrscheinlichkeit)
vor allem geeignet bei Untersuchung relativ kleiner Gruppen der
Grundgesamtheit (z.B. MigrantInnen, Langzeitarbeitslose)

22
Q
  1. Zufallsauswahl
    b) geschichtete Zufallsstichprobe

Vor- und Nachteile

A
Vorteile
-präzisere Schätzung, wenn Einheiten
innerhalb von Schichten homogen sind,
interessierendes Merkmal sich aber
zwischen Schichten stark unterscheiden
(Schichtungseffekt)
-Schichten können jeweils als unabhängige
Stichproben verwendet werden
-disproportionale Schichtung zur Datenerhebung
bei relativ kleinen Teilpopulationen
Nachteile
-Schichtungsmerkmale müssen vor
eigentlicher Ziehung der Stichprobe
festgestellt werden
-Vorwissen über Merkmalsverteilung
notwendig (z.B. Einkommensverteilung)
23
Q
  1. Zufallsauswahl

c) Klumpenstichprobe

A

Kennzeichen:
• Ziehung einer (Zufalls-) Stichprobe von Makroeinheiten (Schulen,
Organisationen, Haushalten = cluster), innerhalb derer eine vollständige
Befragung aller Personen erfolgt

24
Q
  1. Zufallsauswahl
    c) Klumpenstichprobe

Vor- und Nachteile

A
Vorteil
Anwendung auch wenn keine Liste der
Grundgesamtheit, wohl aber eine Liste
übergeordneter Einheiten (cluster) erstellt
werden kann
Nachteil
„Klumpeneffekt“: Genauigkeitsverlust
der Schätzung im Vergleich zu einfacher
Zufallsstichprobe bei Homogenität
innerhalb der Cluster sowie bei hoher
Anzahl von Elementen in Cluster
25
1. Zufallsauswahl d) mehrstufige Auswahlverfahren Kennzeichen
Kennzeichen: • Reihe nacheinander durchgeführter Zufallsstichproben (Prinzip: Zufallsstichprobe aus Zufallsstichprobe ist wieder Zufallsstichprobe) Vorgehen: Hierarchische Einteilung der Grundgesamtheit 1. Ziehung von Elementen der Stufe 1 (primary sampling units = PSUs) 2. Ziehung von Elementen der Stufe 2 innerhalb der gezogenen Elemente der Stufe 1 3. Ziehung von Elementen der Stufe 3 innerhalb der gezogenen Elemente der Stufe 2 4. ...
26
1. Zufallsauswahl d) mehrstufige Auswahlverfahren wann notwendig, Vorteil, Unterschied zur Schichtung, Designeffekte
Einsatz oft notwendig • wenn kein zentrales aber ein dezentrales Register an Elementen der Grundgesamtheit vorhanden ist • bei komplexer Stichprobenziehung (z.B. Grundgesamtheit: allgemeine Bevölkerung) weiterer Vorteil: Kostenersparnis regionaler Klumpung bei Interviewereinsatz Unterschied zur Schichtung: nicht in jeder Gruppe auf Stufe 1 wird Stichprobe gezogen, sondern nur in Stichprobe von Gruppen der Stufe Designeffekte: verringerte Präzision der Schätzung aufgrund der größeren Homogenität innerhalb der PSUs (Klumpeneffekte)
27
d) mehrstufige Auswahlverfahren | Ziehungswahrscheinlichkeiten bei mehrstufiger Auswahl
I) gleiche Ziehungswahrscheinlichkeiten der Sekundäreinheiten gleiche Anzahl an Sekundäreinheiten in Primäreinheiten der Grundgesamtheit und gleiche Ziehungswahrscheinlichkeiten der Primäreinheiten und gleiche Anzahl an gezogenen Sekundäreinheiten in Primäreinheiten II) ungleiche Ziehungswahrscheinlichkeiten der Sekundäreinheiten ungleiche Anzahl an Sekundäreinheiten in Primäreinheiten der Grundgesamtheit und gleiche Ziehungswahrscheinlichkeit der Primäreinheiten und gleiche Anzahl an gezogenen Sekundäreinheiten in Primäreinheiten ungleiche Ziehungswahrscheinlichkeiten → gleiche Ziehungswahrscheinlichkeiten • Berücksichtigung des Wissens um Größe der Primäreinheiten bei Bestimmung der Ziehungswahrscheinlichkeiten der Primäreinheiten: - Auswahl der Primäreinheiten proportional zu ihrer Größe (probability proportional to size = PPS) oder - Nutzung von Designgewichten für spätere Rückgewichtung • analog bei tiefer gestuften Auswahlen, z.B. 2. Stufe Haushaltsebene und 3. Stufe Personenauswahl innerhalb verschieden großer Haushalte
28
d) mehrstufige Auswahlverfahren | Beispiel I: ADM-Design für persönliche Interviews (face-to-face)
1. Schritt: Flächenstichprobe: Auswahl von Sampling-Points 64000 originäre oder synthetische Stimmbezirke (=Fläche, Sampling-Points) mit jeweils mehr als 400 Wahlberechtigten; Ziehung von jeweils 210 bzw. 48 Sampling-Points in West- bzw. Ostdeutschland (PPS-Design) = Netz; insgesamt 128 Netze, meist Auswahl mehrerer Netze 2. Schritt: Auswahl von Haushalten zufällig ausgewählte Startadressen mit Begehungsanordnung (Random-Route) 3. Schritt: Auswahl von zu interviewender Person innerhalb der Haushalten Kish-Selection-Grid (Schwedenschlüssel) Begehungsanweisung Ermittlung der zu interviewenden Person im Haushalt alles akribisch vorgeschrieben
29
d) mehrstufige Auswahlverfahren | Beispiel II: Auswahldesigns für telefonische Interviews
1. Schritt: Auswahl von Telefonnummern • Auswahl aus Telefonverzeichnissen (Problem mit Coverage) • Auswahl mit zufällig generierten Telefonnummern 2. Schritt: Auswahl von zu interviewenden Person innerhalb des Haushalts • Personenauswahl mit einer Zufallszahlenreihe (Schwedenschlüssel) oder mittels Geburtstagsverfahren 1. Schritt: Auswahl von Telefonnummern a) Random Digital Dialing (RDD) (Ursprung USA) 10 Ziffern pro Telefonnummer, die ersten 6 folgen regionalem Schlüssel zweistufige Ziehung der Region (erste 6 Ziffern) und des Anschlusses (letzte 4 Ziffern) • jedoch: viele Anschluss-Nummern nicht vergeben; Hilfe durch computergestütztes Verfahren des Wählens Deutschland hat keine einheitliche Systematik bei Nummernvergabe, die ersten 3-? Ziffern geben Region an; Anschluss kann 3-? Ziffern haben zusätzlich: große „Lücken“ bei Nummernvergabe, nicht alle „Blöcke“ von Nummer besetzt b) modifiziertes Random Digital Dialing Zufallswahl der letzten 2 Stellen (Randomized Last Digits = RLD) Problem bei Verwendung von Telefon-CD als Basis für RLD: ungleiche Auswahlwahrscheinlichkeiten („Blöcke“ mit vielen eingetragen Nummern haben höhere Ziehungswahrscheinlichkeit) Vorgehen daher (Gabler-Häder-Verfahren): 1. Bildung von Intervallen theoretisch möglicher Telefonnummern innerhalb eines Ortsnetzes 2. Prüfung, mit Hilfe eines Telefonnummernverzeichnisses, ob Intervalle mindestens eine gültige Telefonnummer enthalten 3. Ziehung aus denjenigen Intervalle, für die diese Prüfung positiv ausfällt 2. Schritt: Auswahl von zu interviewenden Person innerhalb des Haushalts • Personenauswahl mit einer Zufallszahlenreihe (Schwedenschlüssel) oder mittels Geburtstagsverfahren • Achtung: Überdurchschnittliche Ziehungswahrscheinlichkeit für kleine Haushalte → Gewichtung notwendig
30
2. bewusste Auswahl | Kennzeichen:
Auswahl erfolgt nach angebbaren und überprüfbaren Kriterien; allerdings keine Zufallsauswahl, daher keine Möglichkeit der statistischen Inferenz
31
2. bewusste Auswahl | verschiedene Auswahlverfahren:
a) Auswahl extremer Fälle b) Auswahl typischer Fälle c) Auswahl nach Konzentrationsprinzip d) Auswahl mittels Schneeball-Verfahren e) Auswahl mittels Quota-Verfahren
32
2. bewusste Auswahl verschiedene Auswahlverfahren: a) Auswahl extremer Fälle
Problem: Umdefinition der Grundgesamtheit Anwendungsmöglichkeit: spezielle (kleine) Populationen (z.B. Elitenforschung)
33
2. bewusste Auswahl verschiedene Auswahlverfahren: b) Auswahl typischer Fälle
Problem: erfordert Vorwissen bzw. bestimmt Ergebnis
34
2. bewusste Auswahl verschiedene Auswahlverfahren: c) Auswahl nach Konzentrationsprinzip
• Auswahl von Fällen, die dominant für die Verteilung des interessierenden Merkmals sind • nur geeignet bei speziellen Fragestellungen • erfordert Vorwissen
35
2. bewusste Auswahl verschiedene Auswahlverfahren: d) Auswahl mittels Schneeball-Verfahren
Grundidee: Fragebögen werden an einige Untersuchungspersonen verteilt, welche die Fragebögen ihrerseits an weitere Untersuchungspersonen verteilen Problem: oftmals keine Zufallsstichprobe Erweiterung von Schneeballtechnik durch Netzwerkanalyse erlaubt Berechnung von Ziehungswahrscheinlichkeiten (Respondent Driven Sampling) notwendige Bedingungen: • 1. hohe Interaktionsdichte zwischen Elementen der Grundgesamtheit (soziales Kollektiv) • 2. Erhebung der Netzwerkstruktur bei Stichprobenziehung
36
2. bewusste Auswahl verschiedene Auswahlverfahren: e) Auswahl mittels Quota-Verfahren Grundidee
Grundidee: Quota-Auswahl als Abbild der Grundgesamtheit • Auswahl von Beobachtungseinheiten so, dass bestimmte Merkmale in der Stichprobe denselben Anteil („quota“) aufweisen, wie in der Grundgesamtheit • angestrebte Stichprobe soll hinsichtlich der ausgewählten Merkmale der Grundgesamtheit entsprechen
37
2. bewusste Auswahl verschiedene Auswahlverfahren: e) Auswahl mittels Quota-Verfahren Voraussetzungen
Voraussetzungen: 1. bekannte Verteilung in Grundgesamtheit 2. Korrelation mit inhaltlich interessierenden Variablen 3. Erkennbarkeit des Quotenmerkmals bei Personen vor Befragung
38
2. bewusste Auswahl verschiedene Auswahlverfahren: e) Auswahl mittels Quota-Verfahren Pro
-kostengünstige Stichprobenziehung -Quotenmerkmale korrelieren mit anderen relevanten Merkmalen (= repräsentativ für nicht quotierte Merkmale) -Quotenvorgabe nähert Zufallsauswahl an, da Ermessenspielraum des Interviewers eingeschränkt -Design entspricht in der Praxis einer proportional geschichteten Zufallsstichprobe, Schichten sind weitgehend homogen
39
2. bewusste Auswahl verschiedene Auswahlverfahren: e) Auswahl mittels Quota-Verfahren Contra
-keine Anwendung der Inferenzstatistik -Korrelation mit den verwendeten Globalvariablen ist typischerweise niedrig -Interviewer ist frei, sich Netzwerke von interviewbereiten Personen zu schaffen (führt zu systematischer Verzerrung) -Annahme homogener Schichten würde sehr starke Prädiktoren erfordern, die die Quotenvariablen i.d.R. nicht sind
40
3. willkürliche Auswahl | Kennzeichen; Problem
Kennzeichen: Auswahl erfolgt lediglich nach Ermessen des Auswählenden; daher keine Zufallsauswahl und keine Möglichkeit der statistischen Inferenz Problem: für wissenschaftliche Zwecke nicht sinnvoll einsetzbar
41
Auswahlverfahren und Repräsentativität | Grundidee der Repräsentativität:
Stichprobe als verkleinertes Abbild der Grundgesamtheit Repräsentationsnachweis durch Vergleich von Stichprobenverteilungen mit Verteilungen der Grundgesamtheit sind jedoch problematisch, da sie in der Regel auf bekannte Standardmerkmale (Alter, Geschlecht...) beschränkt sind Kriterium stattdessen: angemessener Auswahlmechanismus (d.h. in der Regel Zufallsstichprobe)
42
Nonresponse
Total survey error setzt sich zusammen aus: • Zufallsfehler der Stichprobe (sampling error) • systematischen Verzerrungen aufgrund des Verfahrens der Stichprobenauswahl (z.B. Probleme mit Random Route) • nonsampling bias: systematische Verzerrungen aufgrund von a) Messfehlern b) Fehlerquellen im Interview c) Diskrepanz zwischen Ziel- und Surveypopulation (coverage) d) Befragungsausfall (nonresponse)
43
zwei Typen von nonresponse zu unterscheiden:
1. unit nonresponse (keine Daten für gesamte Untersuchungseinheit) 2. item nonresponse (fehlende Daten für einzelne Variablen der Untersuchungseinheit)
44
Typen von unit nonresponse:
1. Nicht-Befragbare → eher kleine Gruppe 2. Schwer Erreichbare → Abhilfe: callbacks, Erinnerung 3. Verweigerer → Abhilfe: Verweis auf Bedeutung, Anonymität, Anreize
45
unit nonresponse und Ausschöpfungsquote
Ausschöpfungsquote= realisierte Interviews / (Bruttostichprobe-stichprobenneutrale Ausfälle) Ausschöpfungsquote liegt in der Regel nur zwischen 40 bis 60 Prozent, teilweise sogar deutlich darunter für Liste von Ausfallursachen siehe American Association for Public Opinion Research, AAPOR, www.aapor.org