6. Populationsbeschreibende Untersuchungsformen Flashcards
Merkmalsträger - Stichprobe und Population
Personen, Firmen, Objekte
Grundgesamtheit, Populationen - Stichprobe und Population
Mengen im mathematischen Sinn
sind nur als solche Definiert, wenn sie räumlich, zeitlich und sachlich abgegerenzt sind
Definition und Abgrenzung sind vom Verwertungs- Erkenntnisinteresse der empirischen Untersuchung abhängig, ist das deutlich werden Merkmalsträger festgelegt
Populationsbeschreibende Untersuchungen - Stichprobe und Population
dienen der Deskription einer Gesamtmenge ausgewählter Untersuchungsobjekte auf der Grundlage von Stichprobenergebnissen
Target population - Stichprobe und Population
angestrebte Grundgesamtheit
hierfür sollen die Aussagen der Untersuchung gelten
Frame population - Stichprobe und Population
Erhebungsgrundgesamtheit
diejenige Grundgesamtheit, die faktisch erhoben wird
Auswahlgrundgesamtheit - Stichprobe und Population
Erhebungsgrundgesamtheit (frame population, diejenige GG die faktisch erhoben wird) bei Teilerhebungen
Vollerhebung - Stichprobe und Population
alle Merkmalsträger einer GG werden einbezogen
Teilerhebung - Stichprobe und Population
auch Stichprobenerhebung bezieht sich nur auf eine Auswahl
im Grenzfall (extrem homogene Stichprobe) umfasst eine Teilerhebung nur einen Merkmalsträger (Einzelfallstudie)
sind große Stichproben grundsätzlich “gut”? - Stichprobe und Population
Nein, müssen…
…konstante Ziehungsbedingungen (kein Over- oder Undersampling, kein Nonresponse)
…ihre konstante Größe halten (ohne Dropout)
…dürfen nicht dazu dienen, mangelnde Reliabilität des Messinstrumentes zu kompensieren
exploratorische Faktorenanalyse:
Itemzahl pro faktor 3-5
Itemqualität (Kommunalität <.60 n=60) (Kommunalität = .50 n=100-200) (Kommunalität <.50 n<300) (min. Kommunalität n=500 bis 1000)
Itemverteilungen (schiefe einzelner Items, multimodale Verteilungen, Ausreißer, Extremwerte)
Große Stichproben sind nötig bei… - Stichprobe und Population
…heterogenen Merkmale
…kleinen Effekten
…differenzierter Merkmalsbetrachtung in Abhängigkeit von Moderatoren, Kovariaten
…geforderter Repräsentativität (echte Zufallsstichprobe)
…Verwendung bestimmter verteilungsgebundender Verfahren
kleine Stichproben ausreichend bei… - Stichprobe und Population
…homogenen Merkmalen
großen Effekten
…einheitlicher Merkmalsbetrachtung
…Aussagen über wohl definierte Teilstichproben
…Verwendung verteilungsfreier (nicht-parametrischer) oder verteilungssimulierender Verfahren (Bootstrapping)
Probabilistische Stichproben - Stichprobenarten
zufallsgesteuerte Auswahlverfahren (selten perfekt erfüllt, Dropout):
Einfache Zufallsstichprobe
Monte-Carlo-Verfahren
Systematische Zufallsauswahl
Geschichtete Zufallsstichprobe
Mehrstufige Zufallsstichprobe
Klumpenstichprobe
Nicht-probabilistische Stichproben - Stichprobenarten
Ad-Hoc-Stichprobe (willkürliche Auswahl
Theoretische Stichprobe (bewusste Auswahl): Auswahl typischer Fälle, Auswahl nach dem Konzentrationsprinzip
Quotenstichprobe
Repräsentativität - Zufallsstichprobe und Konzept der Repräsentativität
merkmalsspezifisch räpresentative Stichprobe: gezogenen Elemente gleichen in vielen Merkmalen bzw. Merkmalskombinationen der GG (kovariierende Merkmale können noch reinspielen z.B. in Omnibusuntersuchungen)
globale Repräsentativität: Stichprobe entspricht in allen MErkmalen der GG
lokale Repräsentativität: Stichprobe entspricht nur spezifischen Merkmalen
genaue Abbildung der GG ist auch in Zufallsstichprobe nicht möglich. Noch wenige bei Verkleinerung der n. Toleranzgrenze nicht definiert.
Nur Zufallsstichproben erlauben aber schätzungen mit Fehlergrenzen, Parametern, Verteilungen
Einfache Zufallsstichprobe, simple random sample
für jedes Element der GG ist die Wahrscheinlichkeit bekannt in die Auswahl zu kommen
diese Wahrscheinlichkeit hier 1/N
Stichprobenraum: Sollen n Objekte in der Stichprobe sein, lassen sich C verschiedene Stichproben ziehen
Nicht immer empfehlenswert:
Elemente der GG sind nicht identifizierbar
Elemente geographisch weiträumig verteilt gestreut
komplexe Stichproben präziser
Intressante Untergruppen
Zufallsstichprobe und Inferenzstatistik
Inferenzverfahren lassen sich auch bei nicht zufälligen Stichproben durchführen:
an Fragen der Ergebnisinterpretation (bezüglich der Rekonstruktion einer Population) gekoppelt
theoretisch kann man sich eine Population aufgrund der Stichprobe ausdenken
populationsbeschreibende Untersuchung nur sinnvoll, wenn Merkmale der Poupulation vorher definiert wurden und dann sTichprobe gezogen wird
Punktschätzer - Punkt- und Intervallschätzung
Mittelwert, Standardfehler
Intervallschätzer - Punkt- und Intervallschätzer
Konfidenzintervall
Likelihood - Punkt- und Intervallschätzer
es wird induktiv von einem Stichprobenergebnis auf die Plausibilität verschiedener Populationsparameter geschlossen
Summe der Likelihoods kann Werte über 1 ergeben
Wahrscheinlichkeit - Punkt- und Intervallschätzungen
wird deduktiv aus einer Population das Auftreten einander ausschließender Stichprobenergebnisse bestimmt
Die Summe der Wahrscheinlichkeiten beträgt 1
optimaler Stichprobenumfang
wichtig in populationsbeschreibenden Untersuchungen, kann nur mit Zusatzinformationen bestimmt werden
höheres n (unter konstanten Bedingungen) genauere Parameterschätzungen. Zugewinn nimmt proportional ab.
Optimal, wänn parameterschätzungen präzise sind
Probabilistische Stichprobentechniken
Wenn Informationen über zusätzliche Merkmale vorliegen und deren Verteilung bekannt ist
merkmalsspezifische Repräsentativität lässt sich steigern
Geschichtete Stichprobe (stratified sample)
Klumpenstichprobe (Clustre sample)
Mehrfach geschichtete/gestufte Stichprobe (multi-stage sample)
Geschichtete Stichprobe (stratified sample)
Unterteilung in Schichtungsmerkmale (biographisch, soziodemographisch von Personen)
daraus werden Zufallsstichproben genommen
realtive Größe der Schicht zur Population wird gewichtet
Größe der Subpopulation muss bekannt sein, wenn nicht geschätzt (ex post-facto- Stratifizierung)
Vorteil: wenn Teilstichproben homogener als Gesamtstichprobe
Im Gegensatz zu Clusterstichprobe: einzelne Schichten homogen aber untereinander unterschiedlich
Klumpenstichprobe (cluster sample)
Teilpopulationen (Cluster) in Population bekannt, zufällige Auswahl von Gruppen vollständig erhoben
Auswahlsatz: Steigerung der Präzision der Parameterschätzung = Wahrscheinlichkeit mit der ein Cluster der Population in der Stichprobe ist
Nur, wenn Cluster gleich groß: Cluster ähnlich, vom Merkmal aber heterogen (im Gegensatz zu geschichteten)
darum möglichst viele kleine Cluster sonst großer standardfehler
Variationskoeffizent (V<0.2)
Mehrstufige Stichprobe (multi-stage sample)
Nach Clustered sample, wenn Cluster sich nicht vollständig erheben lassen
Zweistufig: erste Ziehungsstufe per Zufall die Cluster, zweite Ziehungsstufe Personen innerhalb der Cluster
viele Cluster besser siehe Cluster sample
Cluster- und geschichtete Stichproben sind Spezialfälle innerhalb der mehrstufigen Modelle
Mehrstufige Stichproben ziehen Zufallsstichproben aus Primär-, Sekundär-, etc. Einheiten und auf der letzten Ebene die Objekte
Wiederholte Stichprobenuntersuchungen
Panel-Stichproben: Parameterschätzungen lassen sich präzisieren
Wiederholte Befragen zu gleichen oder anderen Themen
Nachteil von Panels: Paneleffekte (zunehmende Sicherheit und Routine) können durch Austausch und Rotationspläne oder Panelkontrollstudien (Vergleich alter gegen neue Panelmitglieder) kontrolliert werden
kombinierte Stichprobenpläne
alle Arten der Stichproben lassen sich kombinieren
Konsequenzen hinsichtlich einer Anpassung ei der Parameterschätzung
Zufällige Auswahl- Nicht-probabilistische Auswahlverfahren
nicht gleich willkürlicher Auswahl
a. GG aus der die auswahl erfolgt ist definiert
b. welcher Merkmalsträger reinkommt ist nicht vom Forscher abhängig sonder zufällig
c. Wahrscheinlichkeiten in Auswahl zu gelangen für Merkmalsträger bekannt
Gelegenheitsstichprobe - nicht-probabilistsche Verfahren
willkürliche Auswahl
für wissenschaftliche Zwecke unbrauchbar
bewusste Auswahl - nicht-probabilistische Verfahren
gezielt vorgenommenne Auswahl anhand der vorgegebenen Kriterien
GG und Verfahren angebbar und kontrollierbar
Spezialfall: typische Fälle
Wissen wie die typischen Fälle mit den Merkmalen in der Population verteilt sind
Merkmalsausprägungen müssen bei den Merkmalsträgern festzustellen sein, sonst kann keine gezielte Auswahl vorgenommen werden
Auswahl nach dem Konzentrationsprinzip (cut-off sampling) - nicht-probabilistische Verfahren
Merkmalsträger die die Verteilung dominieren werden konzentriert beobachtet
Grenzmerkmal muss festgelegt sein
Quoten-Auswahl (quota-sampling) nicht-probabilistische Verfahren
entspricht Schichtung nur willkürlich
Auswahl nach Quotenmerkmalen (leicht erkenn- und erfragbar und eng mit Erhebungsmerkmalen korreliert).
Verteilung der GG muss bekannt sein
Alter, Geschlecht, Familienstand, Konfession, Wohnort, Berufstätigkeit
Quotenstichprobe verkleinertes Abbild der GG. Nur für Quotenmerkmale
einfache Quotenstichproben: Quoten unabhängig voneinander vorgegeben
kombinierte Quotenstichproben: verwenden mehrdimensionale Verteilungen von Merkmalskombinationen (kritisch: Inferenzschlüsse unzulässig, weil nicht zufällig, Erhebungsgrundgesamtheit kann kleiner als GG sein, Daten der Quoten nicht aktuell)