AMBOSS MG: Medizinische Statistik und Testtheorie Flashcards

1
Q

Was ist ein latentes Konstrukt?

A

Ein nicht direkt messbares Konzept,
wie z.B. Lebensqualität oder Gesundheit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was bezeichnet der Begriff „Operationalisierung“?

A

Ein latentes Konstrukt wie Intelligenz lässt sich nicht direkt quantifizieren,
daher müssen dafür bei der Planung einer Studie eine Vorgehensweise zur Messung sowie geeignete Messinstrumente entwickelt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche verschiedenen Arten von Variablen kennst du, die innerhalb von Studien beobachtet werden können?

A

Unabhängige Variable
(= erklärende Variable):
Stellgröße, die in einem Experiment vom Versuchsleiter gezielt variiert wird,
um die Auswirkungen auf die abhängige Variable zu beobachten

Abhängige Variable
(= erklärte Variable):
Variable, deren – durch Variation der unabhängigen Variablen – herbeigeführte Veränderung beobachtet wird

Beispiel:
Messung der Nebenwirkungshäufigkeit (abhängige Variable)
in Abhängigkeit von der Dosis eines Chemotherapeutikums (unabhängige Variable)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Skalenniveaus gibt es und was bedeuten sie?
Wie lassen sie sich hierarchisch anordnen?

A
  1. Die Nominalskala benennt rein qualitativ die Kategorien, es sind nur Häufigkeitsbestimmungen möglich.
  2. Bei der Ordinalskala lassen sich die Merkmale einer Variablen in eine Reihenfolge bringen. Begriffe wie „größer“ und „kleiner“ lassen sich anwenden.
  3. Bei der Intervallskala kann zusätzlich der Abstand als Differenz zwischen den Merkmalen bestimmt werden.
  4. Den höchsten Rang hat die Verhältnisskala, bei der alle Grundrechenarten möglich sind und die einen natürlichen Nullpunkt hat.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ordne folgenden Beispielen passende Skalenniveaus zu:
- Stimmung (gut, mittel, schlecht)
- Augenfarbe (blau, grün, braun)
- Geld auf dem Konto (in Euro)
- Temperatur in °C (exakte Gradzahl).

A

Bei der Einteilung „gut, mittel, schlecht“ für die Stimmung kann eine Reihenfolge der Variablen festgelegt werden. Das Skalenniveau entspricht also einer Ordinalskala.

Die Angaben „blau, grün, braun“ sind rein qualitative Kategorien, daher handelt es sich um eine Nominalskala.

Wird der Kontostand gemessen, gibt es einen Nullpunkt (man ist pleite) und es können Vergleiche gezogen werden (X hat doppelt so viel Geld wie Y). Dies ist ein Beispiel für eine Verhältnisskala.

Die Temperatur in °C dagegen hat keinen natürlichen Nullpunkt, sondern einen, der willkürlich auf den Gefrierpunkt von Wasser festgelegt wurde. Es kann allerdings gesagt werden, dass der Kühlschrank mit 8 °C um 12 °C kälter ist als die Zimmertemperatur mit 20 °C. Daher handelt es sich um eine Intervallskala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Nenne die Maße der zentralen Tendenz.
Erkläre, wie sie bestimmt werden und für welche Skalen sie geeignet sind!

A

Der Modalwert gibt den häufigsten Wert einer Verteilung an und kann bei jedem Skalenniveau bestimmt werden.

Der Median ist der Wert, der genau in der Mitte der nach Größe sortierten Werte liegt. Er ist bei Ordinal-, Intervall- und Verhältnisskalen anwendbar.

Der arithmetische Mittelwert wird berechnet, indem alle Einzelwerte addiert und durch die Anzahl der Werte geteilt werden. Er ist bei Intervall- und Verhältnisskalen anwendbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Varianz und Standardabweichung?

A

Sind Maße für die Abweichung der Messwerte vom Mittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was bezeichnen Spannweite und Quartilsabstand und wie werden sie durch extreme Werte (sog. Ausreißer) beeinflusst?

A

Spannweite und Quartilsabstand sind Streuungsmaße.

Die Spannweite gibt den Abstand zwischen dem höchsten und niedrigsten Wert an und ist Ausreißern gegenüber sehr empfindlich.

Der Quartilsabstand bezeichnet den Abstand zwischen dem 75%-Quartil und dem 25%-Quartil. Da hier die „Ränder“ nicht mitbeurteilt werden, ist dieses Maß Ausreißern gegenüber weniger empfindlich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist eine Perzentile und welche speziellen Perzentilen gibt es?

A

Die Perzentile kann beliebige Prozentwerte zwischen 0 und 100 annehmen.

Eine x%-Perzentile teilt eine Menge in zwei Gruppen, wobei x% der Werte unter dieser Perzentile liegen, der Rest (100%-x%) darüber.

Der Median ist das 50%-Perzentil, d.h. 50% der Werte liegen jeweils darüber und darunter.

Das ¼-Quantil oder das untere Quartil ist das 25%-Perzentil, d.h. 25% der Werte liegen darunter, 75% darüber.

Das ¾-Quantil oder das obere Quartil ist das 75%-Perzentil, d.h. 75% der Werte liegen darunter, 25% darüber.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welchem Prozentrang entspricht ein Wert bei einer Normalverteilung, der zwei Standardabweichungen über dem Mittelwert liegt?

A

Bei einer Normalverteilung liegen 5% der Messwerte mehr als zwei Standardabweichungen vom Mittelwert entfernt, wobei jeweils 2,5% darunter bzw. darüber liegen.

Im Bereich von zwei Standardabweichungen über dem Mittelwert liegen dementsprechend: 100% - 2,5% = 97,5%. Der Prozentrang des Werts ist also 97,5%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche Testgütekriterien gibt es und wie können sie hierarchisch geordnet werden?

A

Es gibt drei Gütekriterien für Tests:
1. Objektivität
2. Reliabilität
3. Validität

Die Objektivität ist ein Maß für die Unabhängigkeit der Ergebnisse vom Untersucher.

Sie ist die Voraussetzung für die Reliabilität,
nämlich die Reproduzierbarkeit von Testergebnissen unter gleichen Bedingungen.

Diese ist wiederum Voraussetzung für die Validität,
ein Maß für die Belastbarkeit einer Aussage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche verschiedenen Methoden zur Abschätzung der Reliabilität kennst du und wie werden diese jeweils durchgeführt?

A
  1. Paralleltestreliabilität:
    Man vergleicht den vorliegenden Test mit einem ähnlichen (parallelen) Testverfahren.
    Wenn beide Testverfahren zu ähnlichen Ergebnissen kommen, besteht ein hoher Korrelationskoeffizient und somit eine hohe Paralleltestreliabilität
  2. Retest-Reliabilität:
    Ein Test wird zweimal mit der gleichen Versuchsperson durchgeführt und anschließend werden die Ergebnisse verglichen.
    Man kann die Retest-Reliabilität als Korrelationskoeffizient r zwischen den beiden Messungen ausdrücken
    Werte von r > 0,8 sprechen für eine gute Reliabilität, diese Anforderung schwankt aber sehr je nach Art des betrachteten Tests
  3. Interrater-Reliabilität:
    Kommen verschiedene Rater (Beobachter) unter Benutzung desselben Untersuchungsinstruments zu den selben oder ähnlichen Ergebnissen, liegt eine hohe Interrater-Reliabilität vor.
  4. Interne Konsistenz:
    Gibt an, wie sehr die verschiedenen Items (= Testaufgaben) einer Untersuchung miteinander in Beziehung stehen.
    Wird mit dem Kennwert Cronbachs α bestimmt.
    Je höher die interne Konsistenz (bzw. Cronbachs α), desto höher ist die Reliabilität der Untersuchung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie kann die Retest-Reliabilität quantifiziert werden und was ist als hoher Wert einzustufen?
Beziehe dich dabei auf die Beispiele „Intelligenztest“ und „Waage“.

A

Kann mithilfe des Korrelationskoeffizienten quantifiziert werden.
Ein hoher Korrelationskoeffizient r zwischen beiden Messungen spricht für eine gute Retest-Reliabilität.

Im Allgemeinen gelten r-Werte >0,8 als gut (z.B. beim Intelligenztest).
Allerdings schwankt diese Anforderung je nach Test sehr:

Bspw. bei einer Waage sollte r nahezu 1 sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist die Validität und welche 5 Formen der Validität werden unterschieden?

A

Die Validität ist ein Maß für die Belastbarkeit einer Aussage.

Interne Validität:
beschreibt, inwieweit sich ein kausaler Zusammenhang aus den Studienergebnissen ableiten lässt.

Externen Validität:
Es wird geprüft, ob sich die Ergebnisse aus der Studiengruppe auch auf eine größere Gruppe der Bevölkerung ausweiten lassen.

Prädiktiver Validität:
Ergebnisse aus der Studie für die Zukunft ableiten

Konvergente Validität:
prüft, ob verschiedene Tests für inhaltlich zusammenhängende Konstrukte korrelieren.

Diskriminante Validität:
Tests für nicht zusammenhängende Konstrukte sollten auch nicht korrelieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist eine Normierung und wie kann sie durchgeführt werden?

A

Die Normierung ist eine Eichung des Tests, um die Ergebnisse besser einzuordnen. Anhand einer repräsentativen Stichprobe wird festgelegt, was „normal“ ist.

Weichen die Ergebnisse einzelner Individuen bspw. um mehr als zwei Standardabweichungen vom Mittelwert der Stichprobe ab, gelten die Ergebnisse meist als ungewöhnlich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind
- Sensitivität,
- Spezifität,
- positiver und negativer prädiktiver Wert
und wie werden sie berechnet?

A

Die Sensitivität ist die „Richtig-positiv-Rate“ eines Tests. Sie gibt den Anteil der Testpersonen an, die bei einem Test richtigerweise „positiv“ getestet wurden, im Verhältnis zur Zahl aller Erkrankten.

Die Spezifität ist dagegen die „Richtig-negativ-Rate“ eines Tests. Sie wird als Quotient aus denen, die richtigerweise „negativ“ getestet wurden, und der Menge aller Gesunden berechnet.

Der positive prädiktive Wert gibt die Wahrscheinlichkeit an, bei einem positiven Testergebnis wirklich krank zu sein.

Der negative prädiktive Wert gibt dagegen die Wahrscheinlichkeit an, bei einem negativen Testergebnis wirklich gesund zu sein.

17
Q

Was gibt die Änderungssensitivität an?

A

Gibt an, wie sensitiv ein Test auf Änderungen der Messgröße reagiert.

18
Q

Erkläre die Begriffe
„absolutes Risiko“,
„relatives Risiko“ und
„attributables Risiko“!

A

Das absolute Risiko gibt das Erkrankungsrisiko in einer bestimmten Population an.

Das relative Risiko bezieht die Exposition gegenüber einem Risikofaktor ein und vergleicht das Risiko der Exponierten mit dem Risiko der Nichtexponierten.

Das attributable Risiko wird durch die Differenz des Risikos der Exponierten und des Risikos der Nichtexponierten berechnet.
Es gibt also an, welcher Anteil des Risikos tatsächlich auf den Risikofaktor zurückzuführen ist.

19
Q

Was bedeuten die Begriffe „Odds“ und „Odds Ratio“? Wie werden sie berechnet?

A

Odds drückt die Chance aus, dass ein Ereignis eintritt (z.B. 1/1 bei einem Münzwurf).

Die Odds Ratio bezieht die Exposition gegenüber einem Ereignis mit ein und wird berechnet aus
- dem Quotienten der Chance der Exponierten und
- der Chance der Nichtexponierten.

20
Q

Wie werden die absolute und die relative Risikoreduktion berechnet und wie lassen sie sich interpretieren?

A

Die absolute Risikoreduktion wird aus der Differenz des Risikos der Kontrollgruppe und des Risikos der Interventionsgruppe berechnet.
Sie gibt also die absolute Änderung des Risikos durch eine Intervention an.

Im Gegensatz dazu gibt die relative Risikoreduktion die prozentuale Abnahme des Risikos durch eine Intervention an.
Sie berechnet sich aus 1 minus dem Quotienten aus dem Risiko der Interventionsgruppe und dem Risiko der Kontrollgruppe.

21
Q

Was gibt die Number Needed To Treat an und wie wird sie berechnet?

A

Die Number Needed To Treat (NNT) gibt an, wie viele Patienten behandelt werden müssen, um genau 1 Ereignis zu verhindern. Sie entspricht dem Kehrwert der absoluten Risikoreduktion.

22
Q

Anhand welchen Kennwerts lässt sich beurteilen, ob eine Hypothese zutrifft?

A

Der p-Wert gibt die Wahrscheinlichkeit für einen Fehler 1. Art an, also ob das Studienergebnis nur zufällig entstanden ist.

Zur Beurteilung des p-Werts wird das Signifikanzniveau festgelegt, üblicherweise bei a = 0,05.
Liegt der p-Wert darunter, wird ein Unterschied als signifikant bezeichnet.

Das bedeutet, die Wahrscheinlichkeit, dass das Studienergebnis nur zufällig entstanden ist, liegt unter 5%.

23
Q

Erkläre den Begriff „Teststärke“ und nenne Faktoren, die die Teststärke erhöhen.

A

Die Teststärke oder Power gibt an, wie gut ein statistischer Test geeignet ist, um einen tatsächlichen Unterschied festzustellen.

Eine hohe Teststärke wird durch
- eine größere Stichprobe,
- ein höheres Signifikanzniveau und
- die Art des statistischen Tests erreicht.

24
Q

Wie lässt sich rechnerisch abschätzen, ob ein Untersuchungsergebnis relevant ist? Nenne ein Maß dafür und dessen Grenzwert!

A

Die Effektstärke wird herangezogen, um die Relevanz eines Ergebnisses zu prüfen.
Ein Maß dafür ist Cohens d, das die Mittelwerte der Interventionsgruppe und Kontrollgruppe miteinander vergleicht.

Es wird berechnet aus
- der Differenz der Mittelwerte der Interventionsgruppe und Kontrollgruppe
- geteilt durch die Standardabweichung.
Ab einem Betrag von >0,8 spricht man von einem deutlichen Unterschied.

25
Q

Wie wirkt sich eine größere Streuung auf die Effektstärke aus?

A

Die Effektstärke berechnet sich aus der Differenz der Mittelwerte zweier Gruppen geteilt durch die Standardabweichung.

Steigt die Standardabweichung (Maß für die Streuung), wird die Effektstärke kleiner.

26
Q

Erkläre allgemein, was Korrelation bedeutet.

Nenne außerdem ein Maß für die Stärke des Zusammenhangs.

Erläutere, welche Werte dieses annehmen kann und was als ein hoher Wert gilt!

A

Beschreibt, dass die Veränderung einer Größe mit der Veränderung einer anderen einhergeht.

Das Maß für die Stärke der Korrelation ist der Korrelationskoeffizient, der nach unterschiedlichen Methoden bestimmt werden kann.
Eine positive Korrelation wird durch Werte zwischen 0 und 1 angezeigt. Je höher die eine Größe ist, desto höher ist auch die andere. Werte zwischen 0 und -1 kennzeichnen eine negative Korrelation, je höher die eine Größe ist, desto niedriger ist die andere.

Ab einem Wert von etwa +/-0,7 spricht man von einem starken positiven/negativen Zusammenhang.

27
Q

Nenne und beschreibe Drittvariablen, die einen Einfluss auf das Ergebnis haben!

A

Störvariable (= confounder):
In der Studie nicht berücksichtigte Variable, die jedoch das Ergebnis beeinflussen kann

Mediatorvariable:
Steht als Bindeglied zwischen unabhängiger und abhängiger Variable

Moderatorvariable:
Beeinflusst den Effekt der unabhängigen Variable und somit das Ergebnis

Risikoindikator:
Variablen, die auf eine Erkrankung hinweisen.
Sie werden in der Epidemiologie rein deskriptiv festgestellt und zeigen anders als Risikofaktoren keinen kausalen Zusammenhang

Interaktionseffekt:
Effekt auf die abhängige Variable, der durch die Wechselwirkung von zwei oder mehr unabhängigen Variablen erzeugt werden kann