Wissenschaftliche Arbeismethoden 10.12 Flashcards

1
Q

Was ist Verzerrung und welche verschiedenen Arten unterscheiden wir?

A
Verzerrung = Bias= systematischer Fehler
• Fehler in der Datenerhebung
• Führt zu fehlerhaften Ergebnissen
• Verschiedene Arten von Verzerrung
• Selektionsbias
• Informationsbias
• Confounder
• Etc…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Grundgesamtheit/ Zielpopulation?

Was ist die Stichproben-/Studienpopulation?

A

Grundgesamtheit / Zielpopulation
= Gesamtmenge der statistischen Einheiten, für
die das Ergebnis der Erhebung gültig sein soll
Stichproben- / Studienpopulation
= Teilpopulation der Grundgesamtheit, welche
in der Verteilung der untersuchungsrelevanten
Merkmale mit der Grundgesamtheit
übereinstimmen soll und an der die
Untersuchung durchgeführt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was hat es mit der Repräsentativität und Verzerrung der Studienpopulation auf sich?

A

Repräsentativität und Verzerrung
• Studienpopulation muss repräsentativ für die Zielpopulation sein
• Repräsentativität bezieht sich immer auf bestimmte, meist allgemeine Merkmale
wie Geschlecht, Alter(sgruppe), Bundesland etc.
• Es gibt keine pauschale Repräsentativität
• Ist die Studienpopulation nicht repräsentativ, ist Verzerrung die Folge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist Validität? Wie spielt die systematische Verzerrung dort hinein, wann tritt sie auf?

A

Validität und systematische Verzerrung
• Validität beschreibt die Gültigkeit eines Ergebnisses
• Systematische Verzerrung beeinträchtigt die Validität von Studienergebnissen
• Interne Validität: beschreibt, ob von der Studienpopulation unverzerrt Rückschlüsse auf
die Auswahlpopulation gezogen werden können
• Externe Validität: beschreibt, ob auch unverzerrte Rückschlüsse auf andere Populationen
(Zielpopulation, ganz andere Population) gezogen werden können
• Interne Validität ist wichtiger!
• Systematische Verzerrung tritt auf, wenn sich die Werte in der Studienpopulation aufgrund eines Stichprobenfehlers von der Auswahl- oder
Zielpopulation systematisch unterscheiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variation oder Verzerrung?

A

• Echte biologische Variation
• Zufällige Variation (aufgrund der Stichprobengröße)
• Nicht-zufällige Abweichungen = Verzerrung = systematische Abweichung von
der Wahrheit:
• Selektionsbias: Faktoren, die die Selektion bzw. die Aufnahme von Tieren / Patienten in
die Studie betreffen
• Informationsbias: Faktoren, die die akkurate Messung von Einfluss- und Zielvariablen
betreffen
• Störgrößen = Confounder: Faktoren, die sowohl die Einfluss- als auch die Zielvariablen
beeinflussen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der Selektionsbias?

A

• Tritt üblicherweise vor Beginn der Studie auf
• Verursacht durch die Art der Auswahl der Studienteilnehmenden und/oder Faktoren, die die
Studienteilnahme beeinflussen
• Die Beziehung zwischen Exposition und Krankheit
unterscheidet sich zwischen den Personen die
teilnehmen und denen, die nicht teilnehmen

Gründe für Selektionsbias
• (Non-)Response Bias
• Teilnehmer unterscheiden sich von Nichtteilnehmern
• Migration Bias
• z.B. Kranke, die ihren ungesunden Lebensstil verändern
• Healthy Worker Effekt
• z.B. Landwirte haben wenig Allergien -> Personen mit Allergien werden keine Landwirte.
• Follow-up Bias
• Bei Langzeitstudien machen Kranke länger mit als gesunde Kontrollgruppen.
• Bias aufgrund unterschiedlicher Überlebenszeiten
• Exposition wird unterschätzt, weil die Leute, die von der Exposition krank wurden, schon tot sind
• Detection Bias:
• Krankheit erhöht die Aufmerksamkeit für Exposition oder anders herum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist der Informationsbias?

A
Informationsbias
• Typen des Informationsbias
• Fehlklassifikation: bei kategorialen Daten
• Messfehler: bei stetigen Daten
• Was kann fehlklassifiziert werden?
• Krankheit / Zielvariable
• Exposition / Einflussvariable
• Confounder / Störgröße
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein Confounder?

A

Confounder („Störgröße“)
• Können sowohl die Exposition als auch die Zielgröße beeinflussen
• Wirkung ist nicht nur durch Exposition gegeben, sondern durch Confounder
mitbeeinflusst
• Risikofaktor, der nicht in der Kausalkette zwischen Exposition und Endpunkt steht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wozu nutzt man den Median?

A

Median: formale Definition
▪ Ordnet man die Daten der Größe nach, so ist der Median (auch Zentralwert, mittlerer Wert), derjenige, für den (mindestens) 50 % der Beobachtungen größer oder gleich diesem Wert und (mindestens) 50 % der Beobachtungen kleiner oder gleich diesem Wert sind, d.h. (Aufzeichnungen Gleichung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Nenne die Eigenschaften des Medians

A

Median: Eigenschaften
▪ Kann leicht durch Abzählen bestimmt werden
▪ Kann sowohl bei metrischen wie auch bei ordinalen (semi-quantitativen) Skalen
eingesetzt werden
▪ Ist robust gegenüber Extremwerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was macht ein Quantil?

A

Quantile

▪ Häufig ist man auch daran interessiert, einen bestimmten Prozentsatz der Daten zu charakterisieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nenne gängige Quantile

A
Median
▪ 0.5 Quantil
▪ Quartil (lateinisch „Viertelwerte“)
▪ 0.25, 0.5, 0.75 Quantil
▪ Perzentil (lateinisch „Hundertstelwerte“)
▪ 0.01, 0.02, 0.03 … 0.99 Quantil
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist der Modus/Modalwert?

A

Modus oder Modalwert
Der Modus oder Modalwert ist:
▪ der am häufigsten vorkommende Messwert
▪ bei einer diskreten Variable die Ausprägung mit der größten Wahrscheinlichkeit
▪ bei einer stetigen Variable die Maximumstelle der Dichtefunktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was beschreibt die Varianz?

A

Die mittlere quadratische Abweichung aller Einzel-Messwerte vom arithmetischen Mittelwert
heißt Varianz.
Es gilt (siehe Rechenregeln für S):
(Gleichungen Heft)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nenne die Definition der Standardabweichung

A

Die Dimension der Varianz ist quadratisch (z.B.cm2,° C2, etc.). Da dies schwierig zu interpretieren ist, betrachtet man oft
und bezeichnet diese Größe als Standardabweichung.
Diese ist in der gleichen Dimension angesiedelt wie die Messwerte und der arithmetische Mittelwert.
(Gleichung Heft)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Gebe eine Definition der Spannweite an

A

Spannweite (Range) R: Definition
Sind x(1)x(2)…x(n) die nach der Größe sortierten Daten, so ist die Breite des
Streubereichs, d.h. die Differenz
R := x(n) - x(1)
ein Maß für die Streuung der Daten. Sie wird als Spannweite oder Range
bezeichnet.

17
Q

Gebe eine Definition für den Quartilsabstand ab

A

Betrachtet man die Streuung “in der Mitte der Daten”, d.h. der mittleren
50 %, so heißt die Differenz zwischen dem 75%- und dem 25%-Quantil
der Quartilsabstand
(“oberes Quartil minus unteres Quartil”).

18
Q

Wozu dient ein Säulendiagramm?

A

Säulendiagramm
▪ … trägt in einem Koordinatensystem über jeder Ausprägung auf der
Abszisse die zugehörigen absoluten bzw. relativen Häufigkeiten als
senkrechte Stäbe ab.
▪ Achtung bei metrischen Skalen und unbesetzten Merkmalskategorien

19
Q

Wozu dient ein Histogramm?

A

Histogramm
▪ … trägt in einem Koordinatensystem über jeder Ausprägung auf der xAchse die zugehörigen relativen Häufigkeiten als Flächen ab.

20
Q

Wozu dient ein Kreisdiagramm ?

A

Kreisdiagramm (ein Merkmal)
… ordnet den relativen Häufigkeiten der Merkmalsausprägungen Kreissektoren zu, so dass die Sektorenflächen proportional zu den relativen Häufigkeiten sind.
▪ kann bei allen Skalen verwendet werden
▪ ist nur aussagekräftig bei wenigen Kategorien
▪ ist bei Rangskalen und metrischen Skalen unübersichtlich

21
Q

Wozu dient ein Blockdiagramm?

A

Blockdiagramm
▪ … ordnet den relativen Häufigkeiten der Merkmalsausprägungen Flächensegmente zu, die proportional zu den relativen Häufigkeiten sind.