Vorlesung 5: Stichprobe Flashcards
Nenne die Grundidee der Stichprobe
Was ist eine Population?
Grundidee: Ein Ausschnitt soll die Gesamtheit in wesentlichen Merkmalen widerspiegeln (N=Bezugspopulation, n= Stichprobe) Population: Gesamtmenge aller Beobachtungseinheiten, über die eine Aussage gemacht werden soll wichtig ist die zielgerichtete Selektion -> Gallup vs Literary Digest
Wieso keine Vollerhebung?
Warum keine Vollerhebung?
1 Merkmalsvariabilität/ Population unbegrenzt
2 Populationsmerkmale nicht bekannt
3 Einfluss der Untersuchung Heisenbergsche Unschärferelation) -> wenn gesamte Population untersucht wird, weiss jeder was untersucht wird zb- Volkszählung. Einfluss der Untersuchung wird durch die Stichprobe gering gehalten
4 Population ist zu gross
5 Merkmal zeitlich fluktuiert (History!!! Maturation!!!!-> wenn man ganze Population erfasst, braucht man zeitlich viel länger und dann verändert sich Merkmal auch, dann wird so Population dramatisch verändert. Bei Stichprobe kann ich da viel schneller reagieren (zeitliche Fluktuation
Vergleiche die Stichprobe mit der Vollerhebung?
Stichprobe statt Vollerhebung
1.Verringerter Aufwand gegenüber Vollerhebung
2.Weniger Befragte erlauben mehr Fragen möglicherweise
mehr Antworten
3.Schnell durchführbar, für aktuelle Fragestellungen geeignet
4.Ausführlichere Fragen
Was gilt für Aussagen auf Basis einer Stichprobe?
- Qualität einer Aussage ist Funktion der Qualität der Stichprobe i.S.v. ähnelt der Population in wesentlichen Merkmalen.
- Im Ideal hohe Korrelation
Merkmale(Stichprobe) mit Merkmale(Population) - Beziehen sich in einem begrenzten Zeitraum auf eine reale Population und sind darüber hinaus nicht generalisierbar
Achtung: Kleine Population und heterogenes Merkmal
Stichprobenziehung hat mehr Nachteile als Vorteile
Variabilität des Merkmals als Grundbedingung, bei kleiner Population ist Vollerhebung vorausgesetzt, sonst Verzerrungen
Erkläre die Grundbegriffe Target Population, Frame Population und Survey Population
Target Population interessierende Stichprobe zb Studenten
Frame Population= Population die mir zugänglich ist
Survey Population= die tatsächlich untersuchte Stichprobe
mit jedem Auswahlprozess verändere ich was schlussendlich in meiner Stichprobe ist
Grundidee: Rückschluss von der Stichprobe auf die Population
Populationskennwerte (-parameter) werden in ihrer
Ausprägung durch Stichprobenkennwerte geschätzt
Was ist overcoverage?
Overcoverage: Bestimmte Teilelemente einer Population, die nicht in die Stichprobe gehören Relativ leicht zu identifizieren Zuviel Republikaner Zu viele Zielelemente
Was ist undercoverage?
Undercoverage: Elemente der Framepopulation, die nicht erfasst werden. Schwierig zu identifizieren Zuwenig Demokraten -Zuwenig Zielelemente -> Leute die nicht erfasst werden, man das merkt nicht, zb Google Suche
Was sind Stichprobenrelevante Fragestellungen?
Stichprobe Population
Sorgfältige, meist zufällige Stichprobenauswahl
Tests, die eine Aussage über eine Grundgesamtheit machen
Stichprobe Stichprobe
Hypothesenprüfung i.S. von Poppers Falsifizierung:
Vergleich zweier identischer (ideal) Gruppen
Mit einem oder mehreren spezifischen Unterschieden
(2 Stichproben miteinander vergleichen, lokale Untersuchung wo man sich nur für diese Veränderung (Intervention) interessiert
Nenne die Methoden der Auswahl einer Stichprobe
1.Wahrscheinlichkeitsauswahl (Probabilitysample)
→ Zufallsstichprobe
2. Zielgerichtete Auswahl (JudgementSample)
→ Orientiert an Merkmalen der Population, nicht zufällig
3. Willkürliche Auswahl (Convenience Sample)
→ Entsprechend „gefährliche“ Zusammensetzung der Stichprobe (nur Psychologiestudenten) -> Willkürliche Auswahl extrem anfällig auf unde- und overcoverage
Nenne das Konzept der Repräsentativität und deren Grundanspruch
Grundanspruch:
Stichprobe entspricht in so vielen und/oder relevanten Merkmalen der Zielpopulation wie nötig und/oder möglich
Selektionskriterium:
Ein Merkmal, das Stichprobe und Population verbindet
Merkmal für Population und Stichprobe wichtig
→ Schulbildung ist für die Modepräferenz nicht entscheidend (?)
Abwägung: Beliebige (willkürliche Stichprobe) ist effizienter als eine aufwendige repräsentative Stichprobe
-> willkürliche Stichprobe: weniger Verzerrung, Zufallsstichprobe
Nenne den Unterschied einer globalen und selektiven Stichprobe
Global repräsentative Stichprobe
Verwendung: -neuartigen, unbekannten Phänomenen
-bei Studien bei denen viele, unterschiedliche Merkmale
erfasst werden sollen,
-bei unbekannten Merkmalszusammenhänge
→ Möglichst hohe Übereinstimmung Stichprobe –Population
versuche Population möglichst umfassend zu erfassen und man möglichst auf viele Aspekte in Population zurückgreifen kann
Spezifisch repräsentative Stichprobe
Begründete Annahme eines Zusammenhangs von Merkmalen:
z.B. Mathematisches Vorwissen (Stichprobenselektion)
→ Erfolg im Psychologiestudium (Grundgesamtheit)
→ Die Stichprobe sollte vor allem bei den relevanten Merkmalen repräsentativ sein
Nenne wichtige Punkte bzgl. des Vorwissens!
Vorwissen über
-das untersuchte Merkmal:
Art der Verteilung, Streuung, Vorstellungen über die Gesamtpopulation
-mit dem relevanten Merkmal zusammenhängende Merkmale
(Hinweise auf mögliche Schichtungsmerkmale)
-Besonderheiten der Population:
(existieren Klumpen?)
-Vorinformationen
Sind schon andere Stichproben erhoben worden
Vorwissen erleichtert und verbessert unter allen Umständen den Verlauf der Datenerhebung
Nenne 2 Arten von Stichproben
Probabilistische Stichproben Alle Elemente haben die gleiche Wahrscheinlichkeit gezogen zu Werden -einfache Zufallstichprobe -Geschichte Stichprobe -Klumpenstichprobe
Nichtprobabilistische Stichproben Die Auswahlwahrscheinlichkeit ist unbekannt -Mehrstufige Stichprobe -Ad-hoc-Stichprobe -Theoretische Stichprobe -Quotenstichprobe (auf Basis von Theorie Stichprobe erstellen)
Beschreibe die Zufallsstichprobe
Nur bei unverzerrter Auswahl ist eine Vergrösserung der Stichprobe gewinnbringend, ansonsten auch Fehlervergrösserung
Wichtigstes Merkmal:
a.) Alle Elemente der Population haben die gleiche Chance (p>0) in die Stichprobe zu gelangen, und
b.) es wird nur einmal aus dem Gesamtpool „gezogen“ (ohne
zurücklegen)
nur a = equal probability selection method (epsm)
a + b = simple random sampling (srs)
Nur bei echten Zufallsstichprobe ist der induktive Schluss auf die Grundgesamtheit zulässig
Beschreibe die Klumpenstichprobe
Optimierung der Parameterschätzung, wenn die Stichprobe aus Teilstichproben zusammengesetzt wird, welche die Ausprägung eines mit dem interessierenden Merkmal hoch korrelierenden Schichtungsmerkmal repräsentieren.
Beispiel: Bewertung der Fussball-stadiender Schweiz
Population: Zuschauer
Klumpen: Alle Stadien
Auswahl: per Zufall
Vorteil: Nur eine Liste aller Klumpen
in der Population wird benötigt, nicht aller Elemente
Bedingung: Untersuchung aller Elemente in den Klumpen
Was sind PPS-Samples (probability proportional to size)
(zweistufige Zufallsstichprobe)
Auswahlwahrscheinlichkeit ~ Grösse der Auswahleinheiten
z.B: unterschiedlich grosse Universitäten werden mit dem entsprechenden Anteil ausgewählt
Beschreibe geschichtete Stichproben
Problem: Hohe Heterogenität des Merkmals in der Population
Ziel: Mess/Zufallsfehler verringern.
Lösung: Schichtung
Bedingung: Vorwissen
Voraussetzung:
1. Die Verteilung des Merkmals in der Population muss bekannt sein
2. Die Separation der Einzelelemente muss möglich sein,
d.h. die Schichtzugehörigkeit muss bekannt sein.
z.B. Geschlecht (2 Stufen) und Einkommen (3 Stufen) = 6 Schichten
Proportionale und disproportionale Schichten
Vergleiche Klumpen versus Schichten
-Idee der Einheitlichkeit Repräsentanz des einzelnen Klumpens für die Gesamtmenge der Klumpen
Je heterogener die Klumpen, umso besser für den Schluss
Bedingung: Wenn eine echte Zufallsauswahl nicht möglich ist
Idee der Unterschiedlichkeit der
Schichten in der Gesamtpopulation
Je homogener die Schichten umso besser für den Schluss
Idealfall: Binnenvarianz = 0, alle sind gleich intelligent
Eine einziges Element ist repräsentativ für die Schicht
Wenn Optimierung angestrebt und Informationen vorliegen
Beschreibe Quotenstichproben
Festlegung von Anteile (Quoten) a priori
(10% Psychologen, 25% Ethologen, 30%Theologen, 35% Ethnologen)
Bedingung (i.d.R): Sinnvoller Quotenvorgabe
Vorteil: Sehr wirtschaftlich
entspricht einer proportionalen, geschichteten Stichprobe
Nachteile
-Mehr oder weniger willkürliche Vorauswahl
-keine zufällige Endauswahl
-Unsicherheit der Vorannahmen über die Population
-Hauptfehlerquelle ist der Interviewer
Wichtiger Nachteil: Da nicht zufällig, kann auch die theoretisch gut fundierte Stichprobentheorie nicht angewendet werden
Beschreibe Panelbeschreibungen
Bei der Kontrolle von Interventionen, Vorher-Nachher, Verlauf
ist eine wiederholte Messung der Stichprobe sinnvoll, billig, effektiv
Ein Panel ist eine wiederholt untersuchte Stichprobe
Vorteile:
-Ein erfahrener Proband: Schneller, sicherer, vertauensvoller
Nachteile:
-Natürlich Wiederholungseffekte, keine naive Probanden mehr
Durch Etablierung komplexer Austausch und Rotationsplänen der Probanden
sollen diese Fehler minimiert werden.
Kontrolle der Kontrolle durch sog. Panelkontrollstudien: Hat sich das Verhalten erfahrener gegenüber unerfahrenen Probanden verändert
Sonderfälle von Stichproben: Capture - Recapture
Zur Abschätzung von Populationsgrössen aus der Populationsbiologie
1. Schritt.
a. Auswahl einer bestimmten Stichprobengrösse u
b. Markierung/Registrierung der gewählten Elemente
Beispiel: Registrierung straffälliger Fussballfan
2. Schritt
a. Nach einem bestimmten zeitlichen Intervall erneute Stichprobenziehung v
b. Feststellen des Anteils aus der 1. Stichprobe w
Notorische Rowdies in der Population x= (u * v)/w
Probleme: -„Markierung“ der VP
-Unabhängige Stichproben
-konstante Populationen
Sonderform von Stichproben: Schneeballverfahren und Nominationstechnik
Schneeballverfahren
Bei „delikaten“ Themen, relativ abgeschlossenen Populationen,
ohne der Möglichkeit der Zufallsauswahl
Dannecker M., Reiche R. Der gewöhnliche Homosexuelle (1974) Suhrkamp, Frankfurt ;
Methode: Verteilung von Fragebögen an persönliche Bekannte, die dann wiederum innerhalb der homosexuellen Subpopulation weitergeben wurden.
Nominationstechnik
Von der Befragten Person werden weitere Personen angegeben,
die dann befragt werden
Probleme der Stichprobenselektion
Unsystematische Fehler bei Stichprobenziehung: Mittelung
Problem: Systematische Fehler
Wichtige Lösung: Die Zufallsstichprobe
Beispiele:
Befragung von Passanten: Wer ist morgens/mittags unterwegs?
Wer verweigert die Antwort?
Asylantenkriminalität (D?!):
Es gibt Straftaten, -die Einheimische gar nicht begehen können
-die moralisch kein Verbrechen darstellen
Stichprobengrösse
Hängt ab von
-statistischen Vorgaben (Angestrebte Effektgrösse)
-pragmatischen Vorgaben (Geld und Zeit)
Grundsätzlich: Je grössere Stichprobe
umso kleinere Konfidenzintervalle umso sichere Schätzung
Aber: Asymptotisch, irgendwann nur noch geringer Gewinn
bei vielfachem Aufwand
Bedenken Sie Ihre Statistik-Vorlesung