Vorlesung 5: Stichprobe Flashcards
Nenne die Grundidee der Stichprobe
Was ist eine Population?
Grundidee: Ein Ausschnitt soll die Gesamtheit in wesentlichen Merkmalen widerspiegeln (N=Bezugspopulation, n= Stichprobe) Population: Gesamtmenge aller Beobachtungseinheiten, über die eine Aussage gemacht werden soll wichtig ist die zielgerichtete Selektion -> Gallup vs Literary Digest
Wieso keine Vollerhebung?
Warum keine Vollerhebung?
1 Merkmalsvariabilität/ Population unbegrenzt
2 Populationsmerkmale nicht bekannt
3 Einfluss der Untersuchung Heisenbergsche Unschärferelation) -> wenn gesamte Population untersucht wird, weiss jeder was untersucht wird zb- Volkszählung. Einfluss der Untersuchung wird durch die Stichprobe gering gehalten
4 Population ist zu gross
5 Merkmal zeitlich fluktuiert (History!!! Maturation!!!!-> wenn man ganze Population erfasst, braucht man zeitlich viel länger und dann verändert sich Merkmal auch, dann wird so Population dramatisch verändert. Bei Stichprobe kann ich da viel schneller reagieren (zeitliche Fluktuation
Vergleiche die Stichprobe mit der Vollerhebung?
Stichprobe statt Vollerhebung
1.Verringerter Aufwand gegenüber Vollerhebung
2.Weniger Befragte erlauben mehr Fragen möglicherweise
mehr Antworten
3.Schnell durchführbar, für aktuelle Fragestellungen geeignet
4.Ausführlichere Fragen
Was gilt für Aussagen auf Basis einer Stichprobe?
- Qualität einer Aussage ist Funktion der Qualität der Stichprobe i.S.v. ähnelt der Population in wesentlichen Merkmalen.
- Im Ideal hohe Korrelation
Merkmale(Stichprobe) mit Merkmale(Population) - Beziehen sich in einem begrenzten Zeitraum auf eine reale Population und sind darüber hinaus nicht generalisierbar
Achtung: Kleine Population und heterogenes Merkmal
Stichprobenziehung hat mehr Nachteile als Vorteile
Variabilität des Merkmals als Grundbedingung, bei kleiner Population ist Vollerhebung vorausgesetzt, sonst Verzerrungen
Erkläre die Grundbegriffe Target Population, Frame Population und Survey Population
Target Population interessierende Stichprobe zb Studenten
Frame Population= Population die mir zugänglich ist
Survey Population= die tatsächlich untersuchte Stichprobe
mit jedem Auswahlprozess verändere ich was schlussendlich in meiner Stichprobe ist
Grundidee: Rückschluss von der Stichprobe auf die Population
Populationskennwerte (-parameter) werden in ihrer
Ausprägung durch Stichprobenkennwerte geschätzt
Was ist overcoverage?
Overcoverage: Bestimmte Teilelemente einer Population, die nicht in die Stichprobe gehören Relativ leicht zu identifizieren Zuviel Republikaner Zu viele Zielelemente
Was ist undercoverage?
Undercoverage: Elemente der Framepopulation, die nicht erfasst werden. Schwierig zu identifizieren Zuwenig Demokraten -Zuwenig Zielelemente -> Leute die nicht erfasst werden, man das merkt nicht, zb Google Suche
Was sind Stichprobenrelevante Fragestellungen?
Stichprobe Population
Sorgfältige, meist zufällige Stichprobenauswahl
Tests, die eine Aussage über eine Grundgesamtheit machen
Stichprobe Stichprobe
Hypothesenprüfung i.S. von Poppers Falsifizierung:
Vergleich zweier identischer (ideal) Gruppen
Mit einem oder mehreren spezifischen Unterschieden
(2 Stichproben miteinander vergleichen, lokale Untersuchung wo man sich nur für diese Veränderung (Intervention) interessiert
Nenne die Methoden der Auswahl einer Stichprobe
1.Wahrscheinlichkeitsauswahl (Probabilitysample)
→ Zufallsstichprobe
2. Zielgerichtete Auswahl (JudgementSample)
→ Orientiert an Merkmalen der Population, nicht zufällig
3. Willkürliche Auswahl (Convenience Sample)
→ Entsprechend „gefährliche“ Zusammensetzung der Stichprobe (nur Psychologiestudenten) -> Willkürliche Auswahl extrem anfällig auf unde- und overcoverage
Nenne das Konzept der Repräsentativität und deren Grundanspruch
Grundanspruch:
Stichprobe entspricht in so vielen und/oder relevanten Merkmalen der Zielpopulation wie nötig und/oder möglich
Selektionskriterium:
Ein Merkmal, das Stichprobe und Population verbindet
Merkmal für Population und Stichprobe wichtig
→ Schulbildung ist für die Modepräferenz nicht entscheidend (?)
Abwägung: Beliebige (willkürliche Stichprobe) ist effizienter als eine aufwendige repräsentative Stichprobe
-> willkürliche Stichprobe: weniger Verzerrung, Zufallsstichprobe
Nenne den Unterschied einer globalen und selektiven Stichprobe
Global repräsentative Stichprobe
Verwendung: -neuartigen, unbekannten Phänomenen
-bei Studien bei denen viele, unterschiedliche Merkmale
erfasst werden sollen,
-bei unbekannten Merkmalszusammenhänge
→ Möglichst hohe Übereinstimmung Stichprobe –Population
versuche Population möglichst umfassend zu erfassen und man möglichst auf viele Aspekte in Population zurückgreifen kann
Spezifisch repräsentative Stichprobe
Begründete Annahme eines Zusammenhangs von Merkmalen:
z.B. Mathematisches Vorwissen (Stichprobenselektion)
→ Erfolg im Psychologiestudium (Grundgesamtheit)
→ Die Stichprobe sollte vor allem bei den relevanten Merkmalen repräsentativ sein
Nenne wichtige Punkte bzgl. des Vorwissens!
Vorwissen über
-das untersuchte Merkmal:
Art der Verteilung, Streuung, Vorstellungen über die Gesamtpopulation
-mit dem relevanten Merkmal zusammenhängende Merkmale
(Hinweise auf mögliche Schichtungsmerkmale)
-Besonderheiten der Population:
(existieren Klumpen?)
-Vorinformationen
Sind schon andere Stichproben erhoben worden
Vorwissen erleichtert und verbessert unter allen Umständen den Verlauf der Datenerhebung
Nenne 2 Arten von Stichproben
Probabilistische Stichproben Alle Elemente haben die gleiche Wahrscheinlichkeit gezogen zu Werden -einfache Zufallstichprobe -Geschichte Stichprobe -Klumpenstichprobe
Nichtprobabilistische Stichproben Die Auswahlwahrscheinlichkeit ist unbekannt -Mehrstufige Stichprobe -Ad-hoc-Stichprobe -Theoretische Stichprobe -Quotenstichprobe (auf Basis von Theorie Stichprobe erstellen)
Beschreibe die Zufallsstichprobe
Nur bei unverzerrter Auswahl ist eine Vergrösserung der Stichprobe gewinnbringend, ansonsten auch Fehlervergrösserung
Wichtigstes Merkmal:
a.) Alle Elemente der Population haben die gleiche Chance (p>0) in die Stichprobe zu gelangen, und
b.) es wird nur einmal aus dem Gesamtpool „gezogen“ (ohne
zurücklegen)
nur a = equal probability selection method (epsm)
a + b = simple random sampling (srs)
Nur bei echten Zufallsstichprobe ist der induktive Schluss auf die Grundgesamtheit zulässig
Beschreibe die Klumpenstichprobe
Optimierung der Parameterschätzung, wenn die Stichprobe aus Teilstichproben zusammengesetzt wird, welche die Ausprägung eines mit dem interessierenden Merkmal hoch korrelierenden Schichtungsmerkmal repräsentieren.
Beispiel: Bewertung der Fussball-stadiender Schweiz
Population: Zuschauer
Klumpen: Alle Stadien
Auswahl: per Zufall
Vorteil: Nur eine Liste aller Klumpen
in der Population wird benötigt, nicht aller Elemente
Bedingung: Untersuchung aller Elemente in den Klumpen