Stichprobentheorie Flashcards

1
Q

Grundgesamtheit

A

(= target population)

  • Menge der Individuen, über die eine Aussage gemacht werden soll
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Auswahlgesamtheit

A

(= frame population)

  • Menge der Elemente, die eine Chance ungleich Null haben, in die Stichprobe zu gelangen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Inferenzpopulation

A

(= inference population)

  • Menge der Elemente, über die auf Grundlage der Untersuchung eine Aussage gemacht werden kann

⇒ Auswahlgesamtheit & Inferenzpopulation sollten idealerweise identisch sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

undercoverage

A

Elemente der Grundgesamtheit sind nicht in Auswahlgesamtheit (Wahlrecht aber kein Festnetz) → problematisch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

overcoverage

A

Elemente, die kein Teil der Grund- aber trotzdem der Auswahlgesamtheit sind (Festnetz aber kein Wahlrecht) → weniger problematisch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Auswahleinheiten

A

bezieht sich auf Auswahlplan (Telefonnummern)

Problem: eine Festnetznummer, mehrere Menschen im Haushalt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Erhebungseinheiten

A

Elemente, bei denen Informationen erhoben werden sollen (Menschen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Untersuchungseinheiten

A

Elemente, an denen relevante Messung vorgenommen wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Repräsentativität: Definition

A

> kein “geschützter” Begriff

  1. “Gütesiegel” (vertrauenswürdige Quelle) → für Sozialwissenschaften nicht hilfreich
  2. als Strukturkonzept: Sample ist strukturtreues Abbild der GG → hohe Suggestivwirkung, aber nicht immer sinnvoll
  3. nicht Struktur / Zusammensetzung der Stichprobe, sondern Ziehung / Auswahlprozess
    • nur durch Zufallsstichproben erreichbar
    • am besten für Sozialwissenschaften geeignet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Zufalls-basierte Auswahlverfahren

A

Normalformen

  • Auslosen
  • Würfeln
  • Schlussziffern-Verfahren

Sonderformen

  • Schichtung
  • disproportionale Stichprobe
  • Klumpen

→ Nur Zufallsstichproben sind für Induktionsschluss geeignet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

nicht auf Zufall basierende Auswahlverfahren

A

bewusste Auswahl

  • typische Fälle
  • extreme Fälle
  • Quotenauswahl
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

nicht auf Zufall basierende Auswahlverfahren

A

bewusste Auswahl

  • typische Fälle
  • extreme Fälle
  • Quotenauswahl

willkürliche Auswahl

  • Straßenumfragen
  • online-Umfragen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Unterschied Quotenauswahl vs. Schichten

A
  • Quote wird vorgegeben, die erfüllt werden muss
  • Unterschied zu Schichten: keine Zufallsauswahl innerhalb der Schichten, sondern Auswahl durch den Interviewer

→ daher nicht zufallsgesteuert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Einfache Zufallsauswahl

A

> proportional: jedes n hat gleiche Wahrscheinlichkeit (> 0) in Sample zu gelangen

Probleme

  • oft keine vollständige Liste der AG vorliegend oder Erhebung zu teuer
  • Schätzung könnte durch Schichtung verbessert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Komplexe Zufallsauswahlen

A

> disproportional: jedes n hat unterschiedliche Chance in Sample zu gelangen (> 0)
ABER: ist berechenbar und kann daher gewichtet werden

Aspekte der Realisierung

  • bietet sich an, wenn Gruppen in GG nur gering vertreten sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

geschichtete Stichprobe:

A
  • Schichten sollen in sich möglichst homogen sein
  • Schichte sollen sich aber in Hinblick auf interessierende Variable möglichst unterschiedlich sein
17
Q

proportionale Schichtung:

A

stellt sicher, dass Häufikeitsanteile der Subpopulationen den Anteile in der Population exakt entsprechen

18
Q

disproportionale Schichtung:

A

wenn man an Subpopulationen interessiert ist, deren Anteil in Gesamtpopulation sehr gering ist

19
Q

Voraussetzungen für Schichtung:

A

Grundinformationen über AG, damit sinnvoll in Schichten unterteilt werden kann

20
Q

Vorteil Schichtungen

A

haben geringeren Standardfehler

21
Q

Klumpen- und Flächenstichproben (cluster)

A
  • Klumpen sollen möglichst heterogen sein
  • natürlich auftretende Gruppen (Schulen, Unternehmen…)
  • Flächen = geographische Einheiten (Gemeinden, Kantone…)
  • in Praxis häufig angewendet
22
Q

Klumpen-Stichproben: Vorgehen

A
  1. Klumpen werden mit einfacher Zufallsauswahl aus Liste gezogen
  2. Vollerhebung einzelner Klumpen
23
Q

Klumpen-Stichprobe: Problem

A
  • Klumpen, z.B. Schulklassen, sind oft ziemlich homogen
    • ungenau, hoher Standardfehler
    → “Klumpeneffekt”
24
Q

Zufallsauswahl Pro/ Contra

A
  • immer zu präferieren
  • Pro: nur hier inferenzstatistische Verfahren möglich
  • Contra: Praktikabilität, da Liste der GG i.d.R. fehlt
25
Q

Quotenauswahl Pro/Contra

A
  • setzt Vorwissen über GG voraus
  • Quotenmerkmale korrelieren oft mit anderen interessierenden Merkmalen
  • Quotierung kann (aber muss nicht) zu höherer Strukturgleichheit führen
  • sorgfältiger Quotenplan → geringer Schätzfehler
  • Problem: Verletzung von Quotenanweisungen kaum kontrollierbar
26
Q

geschichtete Zufallsauswahl Pro/Contra

A
  • Verringerung des Fehlerintervalls der Schätzung
  • setzt Vorwissen über GG voraus
  • setzt hohe Heterogenität eines Merkmals in GG voraus
27
Q

Klumpenauswahl Pro/ Contra

A
  • empfehlenswert, wenn eine Liste der GG aber Liste der Klumpen verfügbar
  • Schätzfehler größer als bei einfachen Zufallsstichproben (wenn Klumpen zu homogen)
28
Q

Zufallsfehler der Stichprobe

A
  • sampling error
  • ist allerdings berechenbar
29
Q
  • non sampling error
A
  • coverage error: systematische Fehler aufgrund des Auswahlverfahrens
    • item/unit non response: Verweigerung
    • measurement error: Messfehler, z.B. over reporting bei Angabe der Wahlteilnahme
    • processing error: Gewichtung und Datenaufbereitung
30
Q

coverage error:

A
  • systematische Fehler aufgrund des Auswahlverfahrens
31
Q

item/unit non response:

A

Verweigerung

32
Q

measurement error:

A

Messfehler, z.B. over reporting bei Angabe der Wahlteilnahme

33
Q

processing error:

A

Gewichtung und Datenaufbereitung

34
Q

Telefonbefragungen Fehlerquellen

A
  • trotz Beimischung von RDD ist Telefonliste nie vollständige Liste der GG → kaum eine Schweizer Befragung kann als repräsentativ bezeichnet werden
    • immer weniger land lines
    • Interviewverweigerung (KEIN Problem der Ziehung): geringe Ausschöpfungsquote
    • Bekennereffekt: Verlierer verweigern eher Interview als Gewinner
35
Q

Bekennereffekt

A

Verlierer verweigern eher Interview als Gewinner