Stichprobentheorie Flashcards
Grundgesamtheit
(= target population)
- Menge der Individuen, über die eine Aussage gemacht werden soll
Auswahlgesamtheit
(= frame population)
- Menge der Elemente, die eine Chance ungleich Null haben, in die Stichprobe zu gelangen
Inferenzpopulation
(= inference population)
- Menge der Elemente, über die auf Grundlage der Untersuchung eine Aussage gemacht werden kann
⇒ Auswahlgesamtheit & Inferenzpopulation sollten idealerweise identisch sein
undercoverage
Elemente der Grundgesamtheit sind nicht in Auswahlgesamtheit (Wahlrecht aber kein Festnetz) → problematisch
overcoverage
Elemente, die kein Teil der Grund- aber trotzdem der Auswahlgesamtheit sind (Festnetz aber kein Wahlrecht) → weniger problematisch
Auswahleinheiten
bezieht sich auf Auswahlplan (Telefonnummern)
Problem: eine Festnetznummer, mehrere Menschen im Haushalt
Erhebungseinheiten
Elemente, bei denen Informationen erhoben werden sollen (Menschen)
Untersuchungseinheiten
Elemente, an denen relevante Messung vorgenommen wird
Repräsentativität: Definition
> kein “geschützter” Begriff
- “Gütesiegel” (vertrauenswürdige Quelle) → für Sozialwissenschaften nicht hilfreich
- als Strukturkonzept: Sample ist strukturtreues Abbild der GG → hohe Suggestivwirkung, aber nicht immer sinnvoll
- nicht Struktur / Zusammensetzung der Stichprobe, sondern Ziehung / Auswahlprozess
- nur durch Zufallsstichproben erreichbar
- am besten für Sozialwissenschaften geeignet
Zufalls-basierte Auswahlverfahren
Normalformen
- Auslosen
- Würfeln
- Schlussziffern-Verfahren
Sonderformen
- Schichtung
- disproportionale Stichprobe
- Klumpen
→ Nur Zufallsstichproben sind für Induktionsschluss geeignet
nicht auf Zufall basierende Auswahlverfahren
bewusste Auswahl
- typische Fälle
- extreme Fälle
- Quotenauswahl
nicht auf Zufall basierende Auswahlverfahren
bewusste Auswahl
- typische Fälle
- extreme Fälle
- Quotenauswahl
willkürliche Auswahl
- Straßenumfragen
- online-Umfragen
Unterschied Quotenauswahl vs. Schichten
- Quote wird vorgegeben, die erfüllt werden muss
- Unterschied zu Schichten: keine Zufallsauswahl innerhalb der Schichten, sondern Auswahl durch den Interviewer
→ daher nicht zufallsgesteuert
Einfache Zufallsauswahl
> proportional: jedes n hat gleiche Wahrscheinlichkeit (> 0) in Sample zu gelangen
Probleme
- oft keine vollständige Liste der AG vorliegend oder Erhebung zu teuer
- Schätzung könnte durch Schichtung verbessert werden
Komplexe Zufallsauswahlen
> disproportional: jedes n hat unterschiedliche Chance in Sample zu gelangen (> 0)
ABER: ist berechenbar und kann daher gewichtet werden
Aspekte der Realisierung
- bietet sich an, wenn Gruppen in GG nur gering vertreten sind
geschichtete Stichprobe:
- Schichten sollen in sich möglichst homogen sein
- Schichte sollen sich aber in Hinblick auf interessierende Variable möglichst unterschiedlich sein
proportionale Schichtung:
stellt sicher, dass Häufikeitsanteile der Subpopulationen den Anteile in der Population exakt entsprechen
disproportionale Schichtung:
wenn man an Subpopulationen interessiert ist, deren Anteil in Gesamtpopulation sehr gering ist
Voraussetzungen für Schichtung:
Grundinformationen über AG, damit sinnvoll in Schichten unterteilt werden kann
Vorteil Schichtungen
haben geringeren Standardfehler
Klumpen- und Flächenstichproben (cluster)
- Klumpen sollen möglichst heterogen sein
- natürlich auftretende Gruppen (Schulen, Unternehmen…)
- Flächen = geographische Einheiten (Gemeinden, Kantone…)
- in Praxis häufig angewendet
Klumpen-Stichproben: Vorgehen
- Klumpen werden mit einfacher Zufallsauswahl aus Liste gezogen
- Vollerhebung einzelner Klumpen
Klumpen-Stichprobe: Problem
- Klumpen, z.B. Schulklassen, sind oft ziemlich homogen
- ungenau, hoher Standardfehler
Zufallsauswahl Pro/ Contra
- immer zu präferieren
- Pro: nur hier inferenzstatistische Verfahren möglich
- Contra: Praktikabilität, da Liste der GG i.d.R. fehlt
Quotenauswahl Pro/Contra
- setzt Vorwissen über GG voraus
- Quotenmerkmale korrelieren oft mit anderen interessierenden Merkmalen
- Quotierung kann (aber muss nicht) zu höherer Strukturgleichheit führen
- sorgfältiger Quotenplan → geringer Schätzfehler
- Problem: Verletzung von Quotenanweisungen kaum kontrollierbar
geschichtete Zufallsauswahl Pro/Contra
- Verringerung des Fehlerintervalls der Schätzung
- setzt Vorwissen über GG voraus
- setzt hohe Heterogenität eines Merkmals in GG voraus
Klumpenauswahl Pro/ Contra
- empfehlenswert, wenn eine Liste der GG aber Liste der Klumpen verfügbar
- Schätzfehler größer als bei einfachen Zufallsstichproben (wenn Klumpen zu homogen)
Zufallsfehler der Stichprobe
- sampling error
- ist allerdings berechenbar
- non sampling error
- coverage error: systematische Fehler aufgrund des Auswahlverfahrens
- item/unit non response: Verweigerung
- measurement error: Messfehler, z.B. over reporting bei Angabe der Wahlteilnahme
- processing error: Gewichtung und Datenaufbereitung
coverage error:
- systematische Fehler aufgrund des Auswahlverfahrens
item/unit non response:
Verweigerung
measurement error:
Messfehler, z.B. over reporting bei Angabe der Wahlteilnahme
processing error:
Gewichtung und Datenaufbereitung
Telefonbefragungen Fehlerquellen
- trotz Beimischung von RDD ist Telefonliste nie vollständige Liste der GG → kaum eine Schweizer Befragung kann als repräsentativ bezeichnet werden
- immer weniger land lines
- Interviewverweigerung (KEIN Problem der Ziehung): geringe Ausschöpfungsquote
- Bekennereffekt: Verlierer verweigern eher Interview als Gewinner
Bekennereffekt
Verlierer verweigern eher Interview als Gewinner