F/F2 Diagnostische Methoden & Verfahren Flashcards
- Nenne die 5 Definitionsebenen eines psychologischen Tests und bewerte ob es sich bei dieser Klausur um ein psychologischen Test handelt
1) Messmethode, Reaktion auf standardisierte Reizvorlagen (Aufgaben, Fragen)
2) Hervorrufen der Reaktionen durch spezifische Bedingungen (Formulierung der Items nachvollziehbar? Keine Antwort = nicht gewusst oder keine Zeit mehr?)
3) Reaktionen erlauben wissenschaftlich begründbaren Rückschluss auf individuelle Ausprägung psycholog. Merkmale (Items nicht zwangsläufig wissenschaftlich)
4) Standardisiertes Vorgehen (Hörsaal, Uhrzeit but Störvariablen wie Klausurtermin und Auswertung)
5) Ziel: quant/qual Aussage über psycholog. Merkmal (Ausprägung/ Vorhandensein; Art)
Rather not, bc nur 1 & 5 eindeutig
MC Frage: was trifft nicht zu?
a. Power Tests haben immer verschiedene Itemschwierigkeiten
b. Speed Tests haben immer Items mit identischer Schwierigkeiten
c. Um ein Merkmal am präzisesten messen zu können muss die Trennschärfe sehr hoch sein.
b ) Viele einfache Items mit geringer Itemschwierigkeit, die von (fast) allen Testpersonen gelöst werden können
7 Schritte der Testkonstruktion
1) Ziel festlegen
2) Messgegenstand definieren
3) Items generieren
4) Items & Testentwurf analysieren
5) Items revidieren
6) Items & Testentwurf analysieren
7) Validierung
3 Ziele psychologischer Tests
1) psychologisches Merkmal messen
2) Kriterien prüfen & Zuordnung zu Kategorien
3) Vorhersagen außerhalb der Testsituation
–> Geltungsbereich & Zielgruppe festlegen
Was ist ein Messgegenstand?
psycholog. Merkmal, dessen Ausprägung durch Test beschrieben werden soll (Konstrukt)
Aspekte zur Testlänge
= Anzahl der Items
je besser die Items, desto weniger notwendig für valide & reliable Messung
Aspekte zur Testzeit
Dauer der Bearbeitung
abhängig von Itemanzahl
Anpassung an ZG
abhängig von Testart (Niveau vs. Geschwindigkeit bei Leistungstests)
Aspekte der Testadministration
siehe Tabelle
Durchführungsart
- Paper & Pencil
- Computerbasiert
Form der Testung
- Einzel vs. Gruppe
Bearbeitungsform
- Selbst vs. Fremdbericht
Aspekte der Itemanalyse & Testrevidierung
Analyseschwerpunkte nach KTT
- Itemschwierigkeit (möglichst gemischt)
- Itemvarianz (mögl. hoch)
-Trennschärfe (größer als .3)
- Faktorladungen (mögl. homogen)
- Itemvalidität
- Testgütekriterien
nach probabilitischen Theorien:
- Prüfung Modellfit
Aspekte der Itemkonstruktion
Zwei Teile:
Item & Antwortformat
Was gilt bezüglich der Itemschwierigkeit bei
a) Powertests?
b) Speedtests?
a) Items aller Schwierigkeiten müssen ausreichend vorhanden sein
b) Viele einfache Items mit geringer Itemschwierigkeit, die von (fast) allen
Testpersonen gelöst werden können
4 Methoden der Itemgenerierung
Deduktiv
- aus Theorie abgeleitet
induktiv
- basierend auf Korrelationen/ Ähnlichkeiten, da dann selbes Konstrukt gemessen wird, aus Sammlung vorhandener Items gewählt
Kriteriumsorientiert
- Passung zu vorab definierten Kriterien - PISA Test, Klausuren
External
- zur Messung der Vorhersagekraft in der Realität
dazu Untersuchung von Personen, die relevantes Merkmal haben/nicht-haben
Welche Art des adaptiven Testens wurde beim AID verwendet?
branched testing
Welche Vor und Nachteile haben die 4 Verfahren zur Itemgenerierung jeweils?
siehe Tabelle
Was sind Vorteile der Testdiagnostik (4)?
- Standardisierung (including hoher Informations/Erkenntniswert; Kontrolle von Störeinflüssen, Nachvollziehbarkeit & Vergleichbarkeit)
- Überprüfung Testqualität & Gütekriterien
- weniger beabsichtigte verzerrte Mess- und Testergebnisse durch validierungsdiagnostik
- Vorhersagekraft für andere Tests
Risiken der Testdiagnsotik
- Standardisierung (unflexibel, nur im Vorfeld geplantes, Erhebungsaufwand x Infogewinn, wenn mehr Infos erhoben werden müssen als benötigt)
- Gefahr die Ergebnisse zu überschätzen
Merkmale von Leistungstests
-messen die kognitive Leistungsfähigkeit
-messen die maximale Verhaltensleistung
-haben klare richtige oder falsche Lösungen
- nur faking bad möglich, kein faking good
Unterscheidung von Leistungstests (3)
Speed, Power, Adaptive Tests
1) können von allen gelöst werden; viele Aufgaben in kurzer Zeit
2) breite Streuung der Aufgabenschwierigkeit
3) angepasst an Leistung in vorheriger Aufgabe - 2 Formen: branched vs. tailored testing (Anpassung nach Blöcken vs. nach jedem Item)
Merkmale von Persönlichkeitstests
über Selbstauskünfte erhoben
Faking in beide Richtungen möglich
objektive Tests & projektive Verfahren (qual.)
Welche Arten von Normen gibt es? (3)
Äquivalentnormen
- Vgl MW Referenzgruppe
Abweichungsnormen
- Vgl Abstände/Streuung MW referenzgruppe
Prozentrangnormen
- Vgl mit % der Referenzgruppe für bestimmten Wert
Welche zwei Arten von Repräsentativität der Normstichprobe gibt es?
globale & spezifische
Norm & Ziel- SP entsprechen sich in allen möglichen Faktoren vs. nur in bestimmten
Welche 5 Gründe gibt es für Unterschiede in der Selbst vs. der Fremdbeurteilung?
1) Urteilsbasis verschieden (Fremdbeurteilung nur über Verhalten möglich nicht durch Erleben)
2) Unrealistisches Selbstkonzept (in beide Richtungen)
3) Strategische Selbstdarstellung nach Nutzen
4) Urteilsfehler bei den Beobachtenden (Milde Effekt)
5) Messfehler - begrenzte Messgenauigkeit bei beiden, nicht hoch reliabel
Welche Vor- (4) und Nachteile (2) hat der FPI?
+
- Bildung der Skalen durch itemmetrische und faktorenanalytische Parameter abgesichert
- breites Anwendungsgebiet - Forschung & co
- viele Forschungsarbeiten dazu; häufig eingesetzt
- hohe Akzeptanz bei Befragten
-
- Offenheitsskala als Skala zur Aufdeckung von Antwortverzerrungen fraglich (mehrdeutig interpretierbar: Persönlichkeitsmerkmal; Antworttendenz, Bereitschaft zur Nichteinhaltung üblicher Normen)
- fehlende Ausweitung der Normierung auf klinische Stichproben
Welche Skalen umfasst der FPI?
10 Skalen je 12 Items
- Lebenszufriedenheit
- Soziale Orientierung
- Leistungsorientierung
- Gehemmtheit
- Erregbarkeit
- Aggressivität
- Beanspruchung
- körperliche Beschwerden
- Gesundheitssorgen
- Offenheit
+ Extraversion
+ Emotionalität