Wissenschaftliche Arbeismethoden 10.12 Flashcards
Was ist Verzerrung und welche verschiedenen Arten unterscheiden wir?
Verzerrung = Bias= systematischer Fehler • Fehler in der Datenerhebung • Führt zu fehlerhaften Ergebnissen • Verschiedene Arten von Verzerrung • Selektionsbias • Informationsbias • Confounder • Etc…
Was ist die Grundgesamtheit/ Zielpopulation?
Was ist die Stichproben-/Studienpopulation?
Grundgesamtheit / Zielpopulation
= Gesamtmenge der statistischen Einheiten, für
die das Ergebnis der Erhebung gültig sein soll
Stichproben- / Studienpopulation
= Teilpopulation der Grundgesamtheit, welche
in der Verteilung der untersuchungsrelevanten
Merkmale mit der Grundgesamtheit
übereinstimmen soll und an der die
Untersuchung durchgeführt wird.
Was hat es mit der Repräsentativität und Verzerrung der Studienpopulation auf sich?
Repräsentativität und Verzerrung
• Studienpopulation muss repräsentativ für die Zielpopulation sein
• Repräsentativität bezieht sich immer auf bestimmte, meist allgemeine Merkmale
wie Geschlecht, Alter(sgruppe), Bundesland etc.
• Es gibt keine pauschale Repräsentativität
• Ist die Studienpopulation nicht repräsentativ, ist Verzerrung die Folge
Was ist Validität? Wie spielt die systematische Verzerrung dort hinein, wann tritt sie auf?
Validität und systematische Verzerrung
• Validität beschreibt die Gültigkeit eines Ergebnisses
• Systematische Verzerrung beeinträchtigt die Validität von Studienergebnissen
• Interne Validität: beschreibt, ob von der Studienpopulation unverzerrt Rückschlüsse auf
die Auswahlpopulation gezogen werden können
• Externe Validität: beschreibt, ob auch unverzerrte Rückschlüsse auf andere Populationen
(Zielpopulation, ganz andere Population) gezogen werden können
• Interne Validität ist wichtiger!
• Systematische Verzerrung tritt auf, wenn sich die Werte in der Studienpopulation aufgrund eines Stichprobenfehlers von der Auswahl- oder
Zielpopulation systematisch unterscheiden.
Variation oder Verzerrung?
• Echte biologische Variation
• Zufällige Variation (aufgrund der Stichprobengröße)
• Nicht-zufällige Abweichungen = Verzerrung = systematische Abweichung von
der Wahrheit:
• Selektionsbias: Faktoren, die die Selektion bzw. die Aufnahme von Tieren / Patienten in
die Studie betreffen
• Informationsbias: Faktoren, die die akkurate Messung von Einfluss- und Zielvariablen
betreffen
• Störgrößen = Confounder: Faktoren, die sowohl die Einfluss- als auch die Zielvariablen
beeinflussen
Was ist der Selektionsbias?
• Tritt üblicherweise vor Beginn der Studie auf
• Verursacht durch die Art der Auswahl der Studienteilnehmenden und/oder Faktoren, die die
Studienteilnahme beeinflussen
• Die Beziehung zwischen Exposition und Krankheit
unterscheidet sich zwischen den Personen die
teilnehmen und denen, die nicht teilnehmen
Gründe für Selektionsbias
• (Non-)Response Bias
• Teilnehmer unterscheiden sich von Nichtteilnehmern
• Migration Bias
• z.B. Kranke, die ihren ungesunden Lebensstil verändern
• Healthy Worker Effekt
• z.B. Landwirte haben wenig Allergien -> Personen mit Allergien werden keine Landwirte.
• Follow-up Bias
• Bei Langzeitstudien machen Kranke länger mit als gesunde Kontrollgruppen.
• Bias aufgrund unterschiedlicher Überlebenszeiten
• Exposition wird unterschätzt, weil die Leute, die von der Exposition krank wurden, schon tot sind
• Detection Bias:
• Krankheit erhöht die Aufmerksamkeit für Exposition oder anders herum.
Was ist der Informationsbias?
Informationsbias • Typen des Informationsbias • Fehlklassifikation: bei kategorialen Daten • Messfehler: bei stetigen Daten • Was kann fehlklassifiziert werden? • Krankheit / Zielvariable • Exposition / Einflussvariable • Confounder / Störgröße
Was ist ein Confounder?
Confounder („Störgröße“)
• Können sowohl die Exposition als auch die Zielgröße beeinflussen
• Wirkung ist nicht nur durch Exposition gegeben, sondern durch Confounder
mitbeeinflusst
• Risikofaktor, der nicht in der Kausalkette zwischen Exposition und Endpunkt steht
Wozu nutzt man den Median?
Median: formale Definition
▪ Ordnet man die Daten der Größe nach, so ist der Median (auch Zentralwert, mittlerer Wert), derjenige, für den (mindestens) 50 % der Beobachtungen größer oder gleich diesem Wert und (mindestens) 50 % der Beobachtungen kleiner oder gleich diesem Wert sind, d.h. (Aufzeichnungen Gleichung)
Nenne die Eigenschaften des Medians
Median: Eigenschaften
▪ Kann leicht durch Abzählen bestimmt werden
▪ Kann sowohl bei metrischen wie auch bei ordinalen (semi-quantitativen) Skalen
eingesetzt werden
▪ Ist robust gegenüber Extremwerten
Was macht ein Quantil?
Quantile
▪ Häufig ist man auch daran interessiert, einen bestimmten Prozentsatz der Daten zu charakterisieren
Nenne gängige Quantile
Median ▪ 0.5 Quantil ▪ Quartil (lateinisch „Viertelwerte“) ▪ 0.25, 0.5, 0.75 Quantil ▪ Perzentil (lateinisch „Hundertstelwerte“) ▪ 0.01, 0.02, 0.03 … 0.99 Quantil
Was ist der Modus/Modalwert?
Modus oder Modalwert
Der Modus oder Modalwert ist:
▪ der am häufigsten vorkommende Messwert
▪ bei einer diskreten Variable die Ausprägung mit der größten Wahrscheinlichkeit
▪ bei einer stetigen Variable die Maximumstelle der Dichtefunktion
Was beschreibt die Varianz?
Die mittlere quadratische Abweichung aller Einzel-Messwerte vom arithmetischen Mittelwert
heißt Varianz.
Es gilt (siehe Rechenregeln für S):
(Gleichungen Heft)
Nenne die Definition der Standardabweichung
Die Dimension der Varianz ist quadratisch (z.B.cm2,° C2, etc.). Da dies schwierig zu interpretieren ist, betrachtet man oft
und bezeichnet diese Größe als Standardabweichung.
Diese ist in der gleichen Dimension angesiedelt wie die Messwerte und der arithmetische Mittelwert.
(Gleichung Heft)