7 Stichprobenziehung Flashcards
ideal: zufällige Ziehung aus Zielpopulation (3)
- generelle Repräsentativität garantiert wenn zufällig gezogen
- Stichprobe und Zielpopulation dürfen sich in interessierenden Parametern nicht systematisch unterscheiden
- Repräsentativität nicht für alle Variablen notwendig
Ziehung aus Allgemeinbevölkerung (2)
- Einwohnermeldeämter (Zugriff bei öffentlich geförderten Studien)
- Registerdaten (je nach Land, aber Messfehler?)
Ziehung aus klinischer Stichprobe
(Name, Unklarheit + Lösungsansatz, 4 Probleme falls Ziel = Allgemeinbev.)
- spezielle Gelegenheitsstichprobe
> meist unklar: welche Zielpopulation?
> Lösungsansatz: ähnliche größere Population denken, aber existiert die überhaupt?
falls Zielpopulation = Allgemeinpopulation:
- oft Selektionsbias
- für Prävalenz/Inzidenzschätzung ungeeignet
- oft Komorbidität (erhöht Behandlungssuche) -> oft Überschätzung der Komorbidität
- schwere, vorbehandelte, therapieresistente Fälle und mit familiärer Vorbelastung überrepräsentiert
conditioning on a collider
(2 Def + Grund, Bsp, 1)
2 Variablen hängen nur in klinischer Population zusammen
2 Variablen mit vorhandenem Zusammenhang, aber dieser ist in Stichprobe verzerrt (Richtung der Verzerrung hängt von Richtung des Effekts auf X und Y ab)
Grund: Zusammenhang nicht in Allgemeinbevölkerung untersucht, sondern bedingt auf eine gemeinsame Folge von X und Y (oder damit assoziierte Variable), Bsp. Behandlung/Hilfesuche
(Bedingen in Stichprobenziehung ist statistisch ähnlich zu adjustieren)
Auswertung (Software, andere, Methode)
Statistiksoftware geht von einfacher Zufallsstichprobe aus (jede Stichprobe von gleichem Umfang N gleichwahrscheinlich)
bei anderer Stichprobenziehung (gewichtet, geclustert): statistische Inferenz anpassen -> z.B. Standardfehler Anpassung
Sandwich-Methode zur Bestimmung der Standardfehler einer Schätzung
Erhöhung der Teilnehmerrate (Ziel, 6 Mögl., Belohnung?)
Ziel: geringerer Selektionsbias durch weniger drop-out
- angenehmes Kontaktverhalten
- kleine Aufmerksamkeiten (xmas card bei Längsschnitt)
- ansprechende Anschreiben / Unterlagen
- Studie unterstützt von öffentlicher/angesehener Institution
- kurze Untersuchungsdauer
- wiederholte Kontaktierung, Probanden nachverfolgen (heute eingeschränkt, Datenschutz!)
!!! Wirksamkeit von Belohnungen umstritten -> evtl. nur untypische Verweigerer -> weniger repräsentativ
Verweigerungsuntersuchung (3)
- nur bei “Teilnehmern”: wann nimmt jmd. teil?
- bei Verweigerern paar wichtige Variablen (v.a. Outcome Y) erheben (Bsp. Drogenkonsum beendet?)
- Teilnehmer & Verweigerer in Variablen untersuchen: Selektionsbias?
Selektionsbias nach Datensammlung verringern (3)
- statistisch gewichten
- Bsp. 2:1 Frauen:Männer -> Männer doppelt gewichten
- praktisch: muss wichtigste Determinanten für Teilnahme & Verteilung in Population kennen
Berechnung der Stichprobengröße
(3 praktische Überlegungen, zu groß/klein, Effektstärkeformel und dropout, 2 cases mit benötigter größerer Stichprobe)
- auf Haupthypothese basieren (bei mehreren: für alle ausrechnen, max. verwenden)
- statistische Power absichern: Teststärke = 1 - beta-Fehler (beta-Fehler = Wahrscheinlichkeit, tatsächlich vorhandener Unterschied nicht zu finden)
- in Praxis meist Standardtestformeln verwendet (auch wenn gleiche Varianz unwahrscheinlich)
- Stichprobe zu klein: kann Hypothese nicht nachweisen & Ressourcenverschwendung
- Stichprobe zu groß: Ressourcenverschwendung
- Effektstärke = (m2 - m1) / SD (Cohen’s d)
- Dropout einkalkulieren, aufrunden!
- je kleiner die Effektstärke, umso größer die nötige Stichprobe
- Stichprobengröße hängt von Basisrate (mean in nicht-Interventions-Gruppe) ab -> wenn Basisrate größer, dann höheres N nötig in Stichprobe (Grund: Bernoulli-Verteilung)
Allgemeines Phänomen (3, + 4 Gründe fürs Kategorisieren)
- für binäre (kateg.) Y braucht es viel größere Stichprobe als für ein intervallskaliertes Y
- Grund: geringere Variation in Y -> Gruppen statistisch schwerer zu unterscheiden
-> daher Y nicht unnötig kategorisieren
Gründe für Kategorisieren:
- valide Falldefinition (Y > Wert h -> Fall) durch Dichotomisierung
- Unterschied nur präsent über Schwellwert (selten)
- extrem schiefe Verteilung
- in Praxis oft unsinnige Dichotomisierung, Bsp. 50% Symptomreduktion bei PANAS -> keine Verhältnisskala (range 10-50)!!!