8. Einzelfallprüfende Untersuchungsformen Flashcards
Intensive Design
viele Patientengruppen mit selektiven Beeinträchtigungen erfordern Studien mit kleinen Stichproben
Single Case Analysis
Einzelfallstudien
zufällige Zuweisung
random allocation, random assignment
Zufallsziehung
random Sampling
anfallende Stichprobe
von Therapeuten freigestellte, freiwillig teilnehmende, bezahlte Patienten
interne Validität in klinische Studien
gefährdet durch konkurrierende Erklärungen
Randomisierungstests stabilisieren sie durch Urnen-Randomisierung, Neuanordnung von Rohdaten
externe Validität in klinischen Studien
gefährdet, weil es oft unmöglich ist Zufallsziehung zu betreiben, Repräsentativität eingeschränkt
kann durch Randomisierungstests auch nicht gelöst werden, weil zufällige Zuweisung und nicht Zufallsziehung, ist aber in anderen Studien auch eher das Ideal als der Normalfall
Urnen-Randomisierung
jede Bedingung wird als Urne betrachtet in denen Probanden zufällig zugewiesen werden
die beobachteten Werte (Rohdaten) werden wiederholt den Urnen zugewiesen
empirische Verteilung von Mittwlwertdifferenzen wird verglichen
Häufigkeitsverteilung
Wenn gleich große Unterschiede in den den Urnen und zwischen Treatment und Kontroll selten auftauchen sind die Effekte wahrscheinlich basierend auf Treatment
Nicht-parametrische Rangtests
Mann-Whitney-U = t-test für unabh. Stichproben
Wilcoxon = t-Test für abhängige Stichproben
Kruskal-Wallis-H = einfaktoriellle Varianzanalyse
Friedman = Varianzanalyse mit Messwiederholungen
reduzierte Sensitivität (Power) durch Transformationen
Zeitreihenanalyse ARIMA (Autoregressive Integrated Moving Average)
verschiedene Prozeduren, die sich auf Einzelfallstudien mit Beobachtungen innerhalb verschiedener Untersuchungsphasen anwenden lassen
ab 50 mind. 100 Beobachtungen
Autokorrelation
Residuen von zeitlich nahen Beobachtungen sind ähnlicher als von zeitlich entfernten
Für parametrische Tests wird damit die Annahme der Unkorreliertheit der Residuen verletzt
In Einzelfaldesigns neigen dazu
Nicht-parametrische Tests in Einzelfalldesigns
Transformationen in Ränge führt zu Informationsverlust
neugeordnete Ränge (Permutationen) ohne verbundene Ränge, dadurch nur noch approximativ valide
wenn keine verbundenen Ränge, äquivalent zu Randomisierungstests
Randomisierungstests in Einzelfallanalyse
sind Vielseitig, weil sie sich an verschiedene Kombinationen anpassen lassen
besonders, wenn die Anzahl der Treatment-verabreichungen pro Bedingung nicht fixiert ist
noch nicht die beste Software
Große Stichproben
Voraussetzungen werden erfüllt
klassische parametrische Tests
große Stichproben Voraussetzungen werden verletzt
nicht-parametrische Tests
kleine Stichproben n<15
nicht-parametrische Tests (wenn verfügbar) Validität wird mit zunehmender Zahl verbundener Ränge in Frage gestellt
sehr kleine Stichproben n<10
Randomisierungstests
Einzelfalldesigns mit Autokorrelation mit wenig Beobachtungen
bei n<15 und nicht verbundenen Rängen = nicht parametrische Tests
bei n<10 Randomisierungstest
Einzelfalldesigns, viele Beobchtungen (mind. 50)
ARIMA-Modelle (gut mit Autokorrelationen, großer Aufwand)
Einzelfall-Designs mit wenigen Beobachtungen <50
Randomisierungstests
Unsicherheiten bestehen angesichts der Teststärke und Autokorrelationen in Abhängigkeit vom Design
Operante Verhaltensanalysen
deskriptive Statistiken werden durch Zusammenfassung von Daten und Probanden eingesetzt
visual Inspection
Kontrolle über Störvariablen schwierig bei Nicht-Laborsettings
zufällige Störvariablen
liegt vor, wenn sich Treatments und die Zuordnung von Probanden zufällig verteilen
systematische Störvariablen
üben einen verzerrenden (biasing) oder konfundierenden (confounding) Effekt aus
gefährden interne Validität
wenn sie durch Zufallszuweisung in zufällige Störvariablen verwandelt werden, bleibt die interne Validität gefährdet
reaktionsgeleitetes Experimentieren - operante Verhaltensanalyse
Argument für Operante Verhaltensanalysten zum Verzicht auf Inferenzstatistik
Phasen-Designs in denen Baseline-Beobachtungen solang fortgeführt haben, bis sie sich stabilisiert haben
interne Validität nicht gewährleistet, weil keine Aussage über zukünftige Baseline gemacht werden kann
Fehler 1. Art die Folge
visuelle Inspektion nicht genügend
Replikation - operante Verhaltensanalyse
Argument zum verzicht auf Inferenzstatistik
Replikation erhöht die Reliabilität, jedoch nicht zwangsläufig die interne Validität
klinische Signifikanz
nicht inferenzstatistische Analyse
ist überlegen, wenn bei Einzelfällen die Wirkung eines Treatments nachgewiesen werden soll
statistische vs. klinische Signifikanz
Je größer die experimentelle Kontrole desto geringer die Notwendigkeit stat. Analysen
große Variabilität = geringe experimentelle Kontrolle
Kontrolle in natürlicher Umgebung geringer
je größer der Effekt, desto geringer das Bedürfnis nach stat. Bestätigung
kleine Effekte und geringe Kontrolle = neue esperimentelle Variablen
Replikationen finales Entscheidungskriterium = interne Val. und Rel. sind nochmal im Einzelfallvergleich herzustellen
lag-1 Autokorrelation
Die Residuen von Beobachtung 1 korrelieren mit 2 und 2 mit 3 usw.
lag-2 Autokorrelation
Die Residuen von Beobachtung 1 korrelieren mit 3 und 2 mit 4 usw.
Angemessenheit der Randomisierungstests
Analytische Power ist notwendig wenn computationale Power fehlt in Rand. die analytische Power durch computationale Power ersetzt (keine Transformation)
Zufallsziehung (die immer eher ine Ideal als Realität ist) wird bei Rand. durch Zufallszuweisung ersetzt
parapmetrische Tests bieten bei großen n Approximationen an die exakten Wahrscheinlichkeiten bei kleinen muss man exakte Wahrscheinlichkeiten nehmen deshalb Rand.
Autokorrelation für Rand. weniger schlimm, besonders wenn Zuweisung rand. erfolgt
Teststärke in Randomisierungstests
Die Teststärke wird größer je nachdem wieviele Anordnungen es bei den Zufallsziehungen gibt.
1000 bis 2000 Anordnungen
Grundsatzproblem der Einzelfalldiagnostik
von gruppenstatistischen Kennwerten muss auf Einzelfälle geschlossen werden
besonders wenn Reliabilität und Validität kleiner als 1 sind
math. Wahrscheinlichkeitsaussagen beziehen sich immer nur auf Klassen nicht Einzelfälle
deshalb hohe Reliabilität der Messwerte
dafür Konfidenzintervall = Bereich um beobachteten Wert der den wahren Wert überdeckt
Einzelfall = keine Verteilung
Aggregatdaten
Klassen von Elementen bestimmten Umfangs (als Gegensatz zu Einzelfällen)
Standardmessfehler
gebildet nach der Äquivalenzhypothese = der beobachtete Wert ist eine gute Schätzung für den wahren Wert
Streuung um den Testwert
hiermit ist eine Schätzung des Konfidenzintervalls, in dem sich der wah!re Wert befindet, um den beobach- teten Wert X möglich.
Standardschätzfehler
gebildet nach der Regressionshypothese nach der der wahre Wert eine Schätzung aus dem beobachteten Wert ist
Maß für die Vorhersagegenauigkeit des geschätzten wahren Wertes
Der Standardschätzfehler ist die Streuung der tat-
sächlichen Werte um die aufgrund der Regressionglei- chung vorhergesagten Werte.
Unterschied Standardmessfehler und Stadardschätzfehler
Beim Standardmessfehler wird der Testwert selbst als Schätzer für den wahren Wert angenommen; beim Standardschätzfehler nimmt man den mittels Regressi- on berechneten Wert aus Test- und Gruppenmittelwert zur Grundlage.
Standardmessfehler und Standardschätzfehler erfordern
Homoskedastizität
Normalverteilung der Messfehler
Messfehler zwischen Gruppen nicht unterscheiden
Standardschätzfehler noch zusätzlich
bivariate Normalverteilung der Messfehler und der wahren Werte; dabei müssen beide Größen unkorreliert sein.
kritische Differenz
prüft die messfehlerkritische Absicherung, ob Differenzen in den Messwerten zweier Tests auf Messfehler zurückzuführen sind
Kann die Ursache füe Messwertdifferenzen auf einen Messfehler zurückgeführt werden?
Reliabilitäten dürfen nicht zu stark voneinander abweichen und die Messfehler der Messwerte müssen unkorreliert sein
Diagnostische Valenz
veraltet für Validität
die valenzkritische Absicherung prüft die Differenzen bedingt durch Unterschiede in den gemessenen Merkmalen
beobachtete Differenz
Vorausgesetzt es besteht eine kritische Differenz, kommt die beobachtete Messwertdifferenz in der Normstichprobe selten vor?
Korrelationen der Testverfahren für Beobachtung von Merkmalsunterschieden
geringe Korrelation der Testverfahren= Wahrscheinlichkeit für Beobachtung von Merkmalsunterschieden höher einzustufen
hohe Korrelatiion der Testverfahren = Wahrscheinlichkeit für die Beobachtung von Merkmalsunterschieden eher gering einzustufen
Theta-Normierung
Lösung für unterschiedliche Reliabilitäten bei kritischer Differenz
orientiert sich an der Verteilung der wahren Testwerte in der Population, für die eine ähnliche Verteilung wie die beobachteten Werte angenommen wird
deshalb geht die beobachtete Standardabweichung mit der Quadratwurzel der Reliabilität in die Normierungsgleichung ein
x-normierung
Lösung für unterschiedliche Reliabilitäten bei kritischer Differenz
liefert einen Vergleichsmaßstab für beobachtete Werte (Rohwerte) (Standardnormen, Prozentrangnormen)
beobachtete Standardabweichung (der Stichprobe) geht in die Normierungsgleichung ein
Korrelation zwischen Gesamttest und Subtest
um zu verhindern, dass korrelierte Messfehler in der kritischen Differenz auftauchen
Reliable Change Index (RCI)
untersucht bei Messwiederholungen ob die beobachtete Veränderung möglicherweise durch einen Messfehler hervorgerufen wurde
Im Nenner der Standardmessfehler der Differenz
Der RCI-Index ist ein z-Wert und wird mit einem kritischen z-Wert verglichen
ist er größer ist die Veränderung nicht auf den Messfehler der Messung zurückzuführen
Unterdurchschnittlich - Normvergleich (zwischen Personen)
wenn das Konfidenzintervall einers Einzelfalls vollständig unterhalb einer SD des Mittelwerrts der Normstichprobe entfernt liegt
Unterdurchschnittlich bis durchschnittlich - Normvergleich (zwischen Personen)
wenn Konfidenzintervall von Bereich <1 SD bis +-1 SD um den Mittelwert der Normstichprobe liegt
Durchschnittlich - Normvergleich (zwischen Personen)
Konfidenzintervall vollständig in Bereich +-1SD um den Mittelwert der Normstichprobe liegt
Durchschnittlich bis Überdurchschnittlich - Normvergleich (zwischen Personen)
Konfidenzintervall im Breich +-1SD bis > 1SD um den Normwert der Normstichprobe liegt
Überdurchschnittlich - Normvergleich (zwischen Personen)
Konfidenzintervall liegt vollständig in Bereich >1SD um den Mittelwert der Normstichprobe
Konfidenzintervalle für Reliabilitätskoeffizienten
Reliabilitätsquotient in Einzelfalldiagnostik zur Herleitung des Stichprobenfehlers
Deshalb Reliabilitätsquotienten transformiern
(Produkt-Moment-Korrelation = Fischer)
(Hyperbolische Tngesnfunktion = Tanh)
Alles gut was sich als Schätzung aus dem Quotienten aus wahrer Merkmalsvarianz und beobachteter Varianz interpretieren lässt
Fragestellung wichtig
Agglutinationstests - Testprofile für Reliabilitätsquotienten
Tests aus mehreren Einzeltests = Eigenständig, hinreichend reliabel aber möglichst niedrig korrelierend
Subtests in Testbatterien = ausreichend reliabel, hohe Testinterkorrelation
ähnliche Tests = nur bei diskrepanten Ergebnissen Nachuntersuchung, versch. Zeitpunkte Übungseffekte
ad-hoc Kombinationen von Einzeltests = gleiche Skalenreliabilitäten vorausgesetzt - einfach arithmetisches Mittel
Vergleich eines Individualprofils mit Referenzprofil