Verfälschte Stichproben Flashcards
Welche Arten verfälschter Stichproben haben wir besprochen?
- Selektive Stichproben
- Nonsampling Errors
- Stichprobenziehen nach Ergebnis
Was ist das Problem bei selektiven Stichproben?
Trotz geeigneter Datenerhebung ist die Stichprobe nicht repräsentativ für die Population weil Subgruppen fehlen oder unterrepräsentiert sind.
Bsp.: Nichtrepräsentative Rücklaufquoten bei Fragebögen
Bestimmte Altersgruppen beeinflussen den MW z.B. mehr oder weniger.
Selektive Stichproben
Welche Lösungen gibt es für das Problem?
- Aussagen nur für Subgruppen treffen
- gewichtete Mittelwerte
Aussagen für Subgruppen: meist am besten, kann man auch vorher schon mit geschichteten SP
Gewichtete MW: man hat den MW einzelner Subgruppen, möchte aber MW für Population angeben –> Gewicht abhängig von Anteil in Population, nicht wie man sie gefunden hat
Selektive Stichproben
Was ist ein schwieriger zu erkennendes Problem als fehlende Subgruppen?
Vergleich von überlappenden aber nicht identischen Datensätzen
z.B. Tierkreiszichen und Interesse am Bauen
Was ist der Nonsampling Error?
Systematisches Auslassen der Datenerhebung an Subgruppen.
z.B. Lebenszeit in verschiedenen Berufen
Man begeht einen Fehler, weil man irgendwas nicht mit einbezieht –> falsche Schlussfolgerungen möglich, da bestimmte Personen weggelassen werden, z.B. wenn keine Zufallsziehung, sondern nur “Problemgruppen”/Daten die anfallen.
Was ist Stichprobenziehen nach “Ergebnis”?
Stichproben werden nach einem zu untersuchenden Merkmal/der AV mit gleichen Anteilen zusammengestellt (obwohl das Merkmal in der Population nicht gleichverteilt vorkommt).
Bsp.: Zusammenhang Rauchen und Lungenkrebs
Selektive Zufallsstichproben nach UV ist nicht so Problematisch wie nach Ergebnis.