F/F2 Diagnostische Methoden & Verfahren Flashcards
- Nenne die 5 Definitionsebenen eines psychologischen Tests und bewerte ob es sich bei dieser Klausur um ein psychologischen Test handelt
1) Messmethode, Reaktion auf standardisierte Reizvorlagen (Aufgaben, Fragen)
2) Hervorrufen der Reaktionen durch spezifische Bedingungen (Formulierung der Items nachvollziehbar? Keine Antwort = nicht gewusst oder keine Zeit mehr?)
3) Reaktionen erlauben wissenschaftlich begründbaren Rückschluss auf individuelle Ausprägung psycholog. Merkmale (Items nicht zwangsläufig wissenschaftlich)
4) Standardisiertes Vorgehen (Hörsaal, Uhrzeit but Störvariablen wie Klausurtermin und Auswertung)
5) Ziel: quant/qual Aussage über psycholog. Merkmal (Ausprägung/ Vorhandensein; Art)
Rather not, bc nur 1 & 5 eindeutig
MC Frage: was trifft nicht zu?
a. Power Tests haben immer verschiedene Itemschwierigkeiten
b. Speed Tests haben immer Items mit identischer Schwierigkeiten
c. Um ein Merkmal am präzisesten messen zu können muss die Trennschärfe sehr hoch sein.
b ) Viele einfache Items mit geringer Itemschwierigkeit, die von (fast) allen Testpersonen gelöst werden können
7 Schritte der Testkonstruktion
1) Ziel festlegen
2) Messgegenstand definieren
3) Items generieren
4) Items & Testentwurf analysieren
5) Items revidieren
6) Items & Testentwurf analysieren
7) Validierung
3 Ziele psychologischer Tests
1) psychologisches Merkmal messen
2) Kriterien prüfen & Zuordnung zu Kategorien
3) Vorhersagen außerhalb der Testsituation
–> Geltungsbereich & Zielgruppe festlegen
Was ist ein Messgegenstand?
psycholog. Merkmal, dessen Ausprägung durch Test beschrieben werden soll (Konstrukt)
Aspekte zur Testlänge
= Anzahl der Items
je besser die Items, desto weniger notwendig für valide & reliable Messung
Aspekte zur Testzeit
Dauer der Bearbeitung
abhängig von Itemanzahl
Anpassung an ZG
abhängig von Testart (Niveau vs. Geschwindigkeit bei Leistungstests)
Aspekte der Testadministration
siehe Tabelle
Durchführungsart
- Paper & Pencil
- Computerbasiert
Form der Testung
- Einzel vs. Gruppe
Bearbeitungsform
- Selbst vs. Fremdbericht
Aspekte der Itemanalyse & Testrevidierung
Analyseschwerpunkte nach KTT
- Itemschwierigkeit (möglichst gemischt)
- Itemvarianz (mögl. hoch)
-Trennschärfe (größer als .3)
- Faktorladungen (mögl. homogen)
- Itemvalidität
- Testgütekriterien
nach probabilitischen Theorien:
- Prüfung Modellfit
Aspekte der Itemkonstruktion
Zwei Teile:
Item & Antwortformat
Was gilt bezüglich der Itemschwierigkeit bei
a) Powertests?
b) Speedtests?
a) Items aller Schwierigkeiten müssen ausreichend vorhanden sein
b) Viele einfache Items mit geringer Itemschwierigkeit, die von (fast) allen
Testpersonen gelöst werden können
4 Methoden der Itemgenerierung
Deduktiv
- aus Theorie abgeleitet
induktiv
- basierend auf Korrelationen/ Ähnlichkeiten, da dann selbes Konstrukt gemessen wird, aus Sammlung vorhandener Items gewählt
Kriteriumsorientiert
- Passung zu vorab definierten Kriterien - PISA Test, Klausuren
External
- zur Messung der Vorhersagekraft in der Realität
dazu Untersuchung von Personen, die relevantes Merkmal haben/nicht-haben
Welche Art des adaptiven Testens wurde beim AID verwendet?
branched testing
Welche Vor und Nachteile haben die 4 Verfahren zur Itemgenerierung jeweils?
siehe Tabelle
Was sind Vorteile der Testdiagnostik (4)?
- Standardisierung (including hoher Informations/Erkenntniswert; Kontrolle von Störeinflüssen, Nachvollziehbarkeit & Vergleichbarkeit)
- Überprüfung Testqualität & Gütekriterien
- weniger beabsichtigte verzerrte Mess- und Testergebnisse durch validierungsdiagnostik
- Vorhersagekraft für andere Tests
Risiken der Testdiagnsotik
- Standardisierung (unflexibel, nur im Vorfeld geplantes, Erhebungsaufwand x Infogewinn, wenn mehr Infos erhoben werden müssen als benötigt)
- Gefahr die Ergebnisse zu überschätzen
Merkmale von Leistungstests
-messen die kognitive Leistungsfähigkeit
-messen die maximale Verhaltensleistung
-haben klare richtige oder falsche Lösungen
- nur faking bad möglich, kein faking good
Unterscheidung von Leistungstests (3)
Speed, Power, Adaptive Tests
1) können von allen gelöst werden; viele Aufgaben in kurzer Zeit
2) breite Streuung der Aufgabenschwierigkeit
3) angepasst an Leistung in vorheriger Aufgabe - 2 Formen: branched vs. tailored testing (Anpassung nach Blöcken vs. nach jedem Item)
Merkmale von Persönlichkeitstests
über Selbstauskünfte erhoben
Faking in beide Richtungen möglich
objektive Tests & projektive Verfahren (qual.)
Welche Arten von Normen gibt es? (3)
Äquivalentnormen
- Vgl MW Referenzgruppe
Abweichungsnormen
- Vgl Abstände/Streuung MW referenzgruppe
Prozentrangnormen
- Vgl mit % der Referenzgruppe für bestimmten Wert
Welche zwei Arten von Repräsentativität der Normstichprobe gibt es?
globale & spezifische
Norm & Ziel- SP entsprechen sich in allen möglichen Faktoren vs. nur in bestimmten
Welche 5 Gründe gibt es für Unterschiede in der Selbst vs. der Fremdbeurteilung?
1) Urteilsbasis verschieden (Fremdbeurteilung nur über Verhalten möglich nicht durch Erleben)
2) Unrealistisches Selbstkonzept (in beide Richtungen)
3) Strategische Selbstdarstellung nach Nutzen
4) Urteilsfehler bei den Beobachtenden (Milde Effekt)
5) Messfehler - begrenzte Messgenauigkeit bei beiden, nicht hoch reliabel
Welche Vor- (4) und Nachteile (2) hat der FPI?
+
- Bildung der Skalen durch itemmetrische und faktorenanalytische Parameter abgesichert
- breites Anwendungsgebiet - Forschung & co
- viele Forschungsarbeiten dazu; häufig eingesetzt
- hohe Akzeptanz bei Befragten
-
- Offenheitsskala als Skala zur Aufdeckung von Antwortverzerrungen fraglich (mehrdeutig interpretierbar: Persönlichkeitsmerkmal; Antworttendenz, Bereitschaft zur Nichteinhaltung üblicher Normen)
- fehlende Ausweitung der Normierung auf klinische Stichproben
Welche Skalen umfasst der FPI?
10 Skalen je 12 Items
- Lebenszufriedenheit
- Soziale Orientierung
- Leistungsorientierung
- Gehemmtheit
- Erregbarkeit
- Aggressivität
- Beanspruchung
- körperliche Beschwerden
- Gesundheitssorgen
- Offenheit
+ Extraversion
+ Emotionalität
Anmerkung zu Lebenszufriedenheit
pos/neg Lebenseinstellung wirkt sich auf Leistungsmotivation & körperliches Wohlbefinden aus
Anmerkung soziale Orientierung
erfasst Disposition zu mitmenschlichem Interesse und Hilfsbereitschaft
Anmerkung zu Leistungsorientierung
erfasst individuelle Differenzen der Leistungsorientierung ohne Aussagen über direkte, aufgabenbezogene Leistungsmotivation/ tatsächliche Leistungsfähigkeit
Anmerkung Gehemmtheit
vielfältig: soziale Hemmungen & Schüchternheit + Selbstunsicherheit & Ängstlichkeit
Anmerkung Erregbarkeit
erfasst empfindlich-reizbare Komponente des Temperaments - Zusmmenhang zu aggressiven Zügen, Überforderung , allgemeiner Unzufriedenheit
Anmerkung Aggressivität
vorsichtige Interpretation - Kontext und Profil entscheidend
Anmerkung Beanspruchung
erfasst Differenzen in subjektiv erlebter Beanspruchung/Überforderung u.U. auch Klagsamkeit –> keine Aussagen zur tatsächlichen Belastung/ objektive Belastbarkeit
Anmerkung körperliche Beschwerden
erfasst relative Häufigkeit typischer körperlicher Beschwerden (bedingt durch Erkrankungen oder somatoformer Störungen)
–> medizinische Bedeutsamkeit berücksichtigen
Anmerkung Gesundheitssorgen
erfasst Tendenz zu überdauernden Sorgen um Gesundheit & Ansteckung
nur unter Vorbehalt Unterscheidung zwischen realistischen und übertriebenen Gesundheitssorgen möglich
Überblick über BDI - Becks Depressions Inventar
Erfassung der subjektiven Schwere einer Depression durch Selbsteinschätzung
Symptombezeichnung + 4 Schweregrade
Ermittelt nur die Schwere, nicht das Vorhandensein einer Depression
Welche Vor- (3) und Nachteile (2) hat der BDI?
+
- Häufigkeit des Einsatzes weltweit
- zuverlässig, valide, sensibel, änderungssensitiv –> wertvoll für klinische Praxis
- Brauchbarkeit im Wesentlichen belegt
- keine Info zur Geltung/Normierung im deutschsprachigen Raum (durch Studien belegbar)
- einzelne Items/Skalen sprachlich ungenau/wenig trennscharf
- Sitzung zu Verhaltensbeobachtung Kleinemas
Definition
Methode zur Gewinnung diagnostisch relevanter Infos, die verwendet werden kann, wenn Verhalten wahrnehmbar ist, aber standardisierte Verfahren fehlen
Unterscheidung zwischen systematischem (wissenschaftlichem) und unsystematischem Ansatz
Beeinflussende zeitabhängige Variablen bei der Verhaltensbeobachtung (7) nach Guion (1965)
- Gesundheit
- Müdigkeit
- Motivation
- Stress
- interindividuelle Differenzen in Reaktion auf Umweltbedingungen, wie Licht, Temperatur, Lärm
- Verständnis der Instruktion
- vorübergehende Aufmerksamkeit
Arten systematischer Verhaltensbeobachtung (3)
- Ort der Beobachtung (natürliche vs. Laborbedingungen - Kontrolle niedrig vs. hoch)
- Grad der Teilnahme des Beob. (aktiv vs. verdeckt + Zeitpunkt des Protokolls)
- Ausmaß der technischen Vermittlung
Arten der Datenregistrierung (2)
isomorphe vs. reduktive Deskription
ganzheitlich vs. reduziert
Zur Reduzierung des Datenmaterials
Zeichen- und Kategoriesysteme
1) Festlegung, welches Verhalten beobachtet wird (wie konkret, wie lange)
2) Daten vorab in benannte Kategorien eingeordnet, die trennscharf/disjunkt sein müssen erfassen gesamten Verhaltensstrom
Rating & Einschätzungsverfahren
Verfahren, zur nachträglichen Einschätzung der Häufigkeit des Auftretens eines zu beobachtenden Verhaltens
5-7 Likert Skalen
Was ist ein Vorteil dieses Verfahrens?
Beob. kann sich auf reine Verhaltensbeobachtung konzentrieren
Gütekriterien von Beobachtungsverfahren
Objektivität
Problem: Objektivität
Beobachter-Übereinstimmung:
bei Zeichensystemen (ja/nein) hoch, bei Kategoriesystemen problematisch (mehr Entscheidung)
Grenzwert 90% Übereinstimmung der Beob, darunter Schulung erforderlich
Beobachterfehler (5)
- Halo Effekt
- logische Fehler (nicht vorherrschendes Merkmal dominiert, es werden implizite Zsmhänge vorhergesagt, die nicht zwangsläufig auch vorhanden sind - bsp. Husten - Corona)
- Milde & Strengefehler (im Vgl zu gute/schlechte Urteile)
- Zentrale Tendenz (umgehbar durch grade Skalen)
- Tendenz zu Extremurteilen
Wie wird die Reliabilität eines Beobachtungsverfahrens ermittelt?
Beobachterübereinstimmung –> Konkordanzmaße Cohens Kappa, Kendall’s Tau
4 Diagramme zu Beobachterfehlern
Milde, Strenge, Mitte, Extrem
rechtssteil & linksschief ist dasselbe
Welche Validität wird gemessen?
Inhaltsvalidität
externe Val eher nicht gemacht (Prognose)
Beobachtungsmethoden in klinischen Settings (4)
- in vivo (natürlich)
- strukturiert (konkrete Richtlinien/Kriterien)
- Selbstbeobachtung (Schmerztagebuch)
- Verhaltenstests (Selbst & fremdbeob (PT) bsp. Agoraphobie - Supermarkt)