AMBOSS MG: Medizinische Statistik und Testtheorie Flashcards
Was ist ein latentes Konstrukt?
Ein nicht direkt messbares Konzept,
wie z.B. Lebensqualität oder Gesundheit.
Was bezeichnet der Begriff „Operationalisierung“?
Ein latentes Konstrukt wie Intelligenz lässt sich nicht direkt quantifizieren,
daher müssen dafür bei der Planung einer Studie eine Vorgehensweise zur Messung sowie geeignete Messinstrumente entwickelt werden.
Welche verschiedenen Arten von Variablen kennst du, die innerhalb von Studien beobachtet werden können?
Unabhängige Variable
(= erklärende Variable):
Stellgröße, die in einem Experiment vom Versuchsleiter gezielt variiert wird,
um die Auswirkungen auf die abhängige Variable zu beobachten
Abhängige Variable
(= erklärte Variable):
Variable, deren – durch Variation der unabhängigen Variablen – herbeigeführte Veränderung beobachtet wird
Beispiel:
Messung der Nebenwirkungshäufigkeit (abhängige Variable)
in Abhängigkeit von der Dosis eines Chemotherapeutikums (unabhängige Variable)
Welche Skalenniveaus gibt es und was bedeuten sie?
Wie lassen sie sich hierarchisch anordnen?
- Die Nominalskala benennt rein qualitativ die Kategorien, es sind nur Häufigkeitsbestimmungen möglich.
- Bei der Ordinalskala lassen sich die Merkmale einer Variablen in eine Reihenfolge bringen. Begriffe wie „größer“ und „kleiner“ lassen sich anwenden.
- Bei der Intervallskala kann zusätzlich der Abstand als Differenz zwischen den Merkmalen bestimmt werden.
- Den höchsten Rang hat die Verhältnisskala, bei der alle Grundrechenarten möglich sind und die einen natürlichen Nullpunkt hat.
Ordne folgenden Beispielen passende Skalenniveaus zu:
- Stimmung (gut, mittel, schlecht)
- Augenfarbe (blau, grün, braun)
- Geld auf dem Konto (in Euro)
- Temperatur in °C (exakte Gradzahl).
Bei der Einteilung „gut, mittel, schlecht“ für die Stimmung kann eine Reihenfolge der Variablen festgelegt werden. Das Skalenniveau entspricht also einer Ordinalskala.
Die Angaben „blau, grün, braun“ sind rein qualitative Kategorien, daher handelt es sich um eine Nominalskala.
Wird der Kontostand gemessen, gibt es einen Nullpunkt (man ist pleite) und es können Vergleiche gezogen werden (X hat doppelt so viel Geld wie Y). Dies ist ein Beispiel für eine Verhältnisskala.
Die Temperatur in °C dagegen hat keinen natürlichen Nullpunkt, sondern einen, der willkürlich auf den Gefrierpunkt von Wasser festgelegt wurde. Es kann allerdings gesagt werden, dass der Kühlschrank mit 8 °C um 12 °C kälter ist als die Zimmertemperatur mit 20 °C. Daher handelt es sich um eine Intervallskala.
Nenne die Maße der zentralen Tendenz.
Erkläre, wie sie bestimmt werden und für welche Skalen sie geeignet sind!
Der Modalwert gibt den häufigsten Wert einer Verteilung an und kann bei jedem Skalenniveau bestimmt werden.
Der Median ist der Wert, der genau in der Mitte der nach Größe sortierten Werte liegt. Er ist bei Ordinal-, Intervall- und Verhältnisskalen anwendbar.
Der arithmetische Mittelwert wird berechnet, indem alle Einzelwerte addiert und durch die Anzahl der Werte geteilt werden. Er ist bei Intervall- und Verhältnisskalen anwendbar.
Was sind Varianz und Standardabweichung?
Sind Maße für die Abweichung der Messwerte vom Mittelwert
Was bezeichnen Spannweite und Quartilsabstand und wie werden sie durch extreme Werte (sog. Ausreißer) beeinflusst?
Spannweite und Quartilsabstand sind Streuungsmaße.
Die Spannweite gibt den Abstand zwischen dem höchsten und niedrigsten Wert an und ist Ausreißern gegenüber sehr empfindlich.
Der Quartilsabstand bezeichnet den Abstand zwischen dem 75%-Quartil und dem 25%-Quartil. Da hier die „Ränder“ nicht mitbeurteilt werden, ist dieses Maß Ausreißern gegenüber weniger empfindlich.
Was ist eine Perzentile und welche speziellen Perzentilen gibt es?
Die Perzentile kann beliebige Prozentwerte zwischen 0 und 100 annehmen.
Eine x%-Perzentile teilt eine Menge in zwei Gruppen, wobei x% der Werte unter dieser Perzentile liegen, der Rest (100%-x%) darüber.
Der Median ist das 50%-Perzentil, d.h. 50% der Werte liegen jeweils darüber und darunter.
Das ¼-Quantil oder das untere Quartil ist das 25%-Perzentil, d.h. 25% der Werte liegen darunter, 75% darüber.
Das ¾-Quantil oder das obere Quartil ist das 75%-Perzentil, d.h. 75% der Werte liegen darunter, 25% darüber.
Welchem Prozentrang entspricht ein Wert bei einer Normalverteilung, der zwei Standardabweichungen über dem Mittelwert liegt?
Bei einer Normalverteilung liegen 5% der Messwerte mehr als zwei Standardabweichungen vom Mittelwert entfernt, wobei jeweils 2,5% darunter bzw. darüber liegen.
Im Bereich von zwei Standardabweichungen über dem Mittelwert liegen dementsprechend: 100% - 2,5% = 97,5%. Der Prozentrang des Werts ist also 97,5%.
Welche Testgütekriterien gibt es und wie können sie hierarchisch geordnet werden?
Es gibt drei Gütekriterien für Tests:
1. Objektivität
2. Reliabilität
3. Validität
Die Objektivität ist ein Maß für die Unabhängigkeit der Ergebnisse vom Untersucher.
Sie ist die Voraussetzung für die Reliabilität,
nämlich die Reproduzierbarkeit von Testergebnissen unter gleichen Bedingungen.
Diese ist wiederum Voraussetzung für die Validität,
ein Maß für die Belastbarkeit einer Aussage.
Welche verschiedenen Methoden zur Abschätzung der Reliabilität kennst du und wie werden diese jeweils durchgeführt?
- Paralleltestreliabilität:
Man vergleicht den vorliegenden Test mit einem ähnlichen (parallelen) Testverfahren.
Wenn beide Testverfahren zu ähnlichen Ergebnissen kommen, besteht ein hoher Korrelationskoeffizient und somit eine hohe Paralleltestreliabilität - Retest-Reliabilität:
Ein Test wird zweimal mit der gleichen Versuchsperson durchgeführt und anschließend werden die Ergebnisse verglichen.
Man kann die Retest-Reliabilität als Korrelationskoeffizient r zwischen den beiden Messungen ausdrücken
Werte von r > 0,8 sprechen für eine gute Reliabilität, diese Anforderung schwankt aber sehr je nach Art des betrachteten Tests - Interrater-Reliabilität:
Kommen verschiedene Rater (Beobachter) unter Benutzung desselben Untersuchungsinstruments zu den selben oder ähnlichen Ergebnissen, liegt eine hohe Interrater-Reliabilität vor. - Interne Konsistenz:
Gibt an, wie sehr die verschiedenen Items (= Testaufgaben) einer Untersuchung miteinander in Beziehung stehen.
Wird mit dem Kennwert Cronbachs α bestimmt.
Je höher die interne Konsistenz (bzw. Cronbachs α), desto höher ist die Reliabilität der Untersuchung
Wie kann die Retest-Reliabilität quantifiziert werden und was ist als hoher Wert einzustufen?
Beziehe dich dabei auf die Beispiele „Intelligenztest“ und „Waage“.
Kann mithilfe des Korrelationskoeffizienten quantifiziert werden.
Ein hoher Korrelationskoeffizient r zwischen beiden Messungen spricht für eine gute Retest-Reliabilität.
Im Allgemeinen gelten r-Werte >0,8 als gut (z.B. beim Intelligenztest).
Allerdings schwankt diese Anforderung je nach Test sehr:
Bspw. bei einer Waage sollte r nahezu 1 sein.
Was ist die Validität und welche 5 Formen der Validität werden unterschieden?
Die Validität ist ein Maß für die Belastbarkeit einer Aussage.
Interne Validität:
beschreibt, inwieweit sich ein kausaler Zusammenhang aus den Studienergebnissen ableiten lässt.
Externen Validität:
Es wird geprüft, ob sich die Ergebnisse aus der Studiengruppe auch auf eine größere Gruppe der Bevölkerung ausweiten lassen.
Prädiktiver Validität:
Ergebnisse aus der Studie für die Zukunft ableiten
Konvergente Validität:
prüft, ob verschiedene Tests für inhaltlich zusammenhängende Konstrukte korrelieren.
Diskriminante Validität:
Tests für nicht zusammenhängende Konstrukte sollten auch nicht korrelieren
Was ist eine Normierung und wie kann sie durchgeführt werden?
Die Normierung ist eine Eichung des Tests, um die Ergebnisse besser einzuordnen. Anhand einer repräsentativen Stichprobe wird festgelegt, was „normal“ ist.
Weichen die Ergebnisse einzelner Individuen bspw. um mehr als zwei Standardabweichungen vom Mittelwert der Stichprobe ab, gelten die Ergebnisse meist als ungewöhnlich.