Grundlagen der Testtheorie und psychologische Diagnostik Flashcards

1
Q

Drei bekannteste Antworttendenzen nennen und erklären

A
  1. Akquieszenz: Tendenz, Item zuzustimmen oder abzulehnen, unabhängig vom Iteminhalt.
  2. Extreme Reaktionsneigung: Tendenz mittlere oder extreme Antwort ankreuzen, unabhängig v. Inhalt
  3. Sozial erwünschtes Antworten: Reaktionen, von denen eine antwortende Person annimmt, dass sie den Erwartungen relevanter anderer Personen entsprechen > Zustimmung.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Schritte zur Testkonstruktion

A
  1. Zu erfassendes Konstrukt definieren
  2. Itempool erstellen
  3. Antwortformat festlegen
  4. Itemanalyse und -auswahl
  5. Testanalyse
  6. Skalierung und Normierung
  7. Testdokumentation
  8. Gütekriterien prüfen und Testrevision

Die Schritte 2 – 5 i.d.R. so oft wiederholt, bis endgültiger Test vorliegt. Auch nachher Gütekriterien regelmäßig überprüfen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Genauigkeit diagnostischer Verfahren erhöhen, wie?

A
  1. Regeln und Hypothesen im diagnostischen Prozess generieren und prüfen
  2. Bei Entscheidungsfindung Informationen verschiedener methodischer Zugänge (Selbst- und Fremdbeurteilung, Persönlichkeits- und Leistungsdaten) integrieren
  3. Informationen zu verschiedenen Situationen und Zeiten erfassen
  4. Bestimmung von Interrater-Reliabilitäten
  5. Zustandekommen Entscheidung transparent und explizit machen
  6. Verzerrungstendenzen und Fehlerquellen bewusst machen
  7. Normen beachten und einhalten (DIN 33430)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Zuschlag (2006) psychologisches Gutachten definieren

A
  1. Ein Gutachten ist eine wissenschaftliche Leistung eines fachlich qualifizierten psychologischen Sachverständigen
  2. Fragestellung wird auf Grundlage wissenschaftlich anerkannter Untersuchungsmethoden und Beurteilungen bearbeitet
  3. Daten werden erhoben, ausgewertet und beurteilt
  4. Gutachten werden meist schriftlich verfasst und ggf. mündl. ergänzt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

(Zuschlag 2006)
psychologisches Gutachten von psychologischer Stellungnahme / Befund abgrenzen

A

Psychologischer Befund:
* Fokussiert auf Darstellung von Ergebnissen aus einer / mehreren Informationsquellen in Bezug auf Fragestellung
* Auftraggeber interpretiert Testergebnisse selbst
* Testergebnisse werden den Untertests bzw. Skalen der jeweiligen Inventare zugeordnet
* Konfidenzintervalle sollten um die Testwerte bestimmt und berichtet werden

Gutachterliche Stellungnahme:
* Beantwortung wenig komplexen Sachverhalts / einer ergänzenden Frage
* ausführliches Gutachten liegt meistens bereits vor
 Beispiel: Ergänzung zu einem neurologischen Gutachten auf die Untersuchung der Konzentrationsfähigkeit eines Probanden beziehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

(Zuschlag 2006)
ethische und rechtliche Standards + fachliche Standards

A

Ethische und rechtliche Standards
* Einhaltung von Schweigepflicht und Offenbarungspflicht
* Transparenz im diagnostischen Prozess
* Fairness und Respekt gegenüber dem Klienten
* Neutralität, Objektivität, Unabhängigkeit, Unbestechlichkeit

Fachliche Standards
* hinreichende fachliche Qualifikation
* wissenschaftsorientiertes Vorgehen bei der Bearbeitung der Fragestellung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

(Zuschlag 2006)
wie kann man Qualität von diagnostischem Prozess erhöhen?

A
  1. Fragestellung des Gutachtens in festgelegtem Zeitraum bearbeiten
  2. Kosten und Nutzen in angemessener Relation
  3. GA sollte gut lesbar, nachvollziehbar, verständlich, nachprüfbar und überzeugend sein
  4. Kommunizieren, Aushandeln und Anpassen von Standards
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Atypische Antwortformate erklären, 4 Beispiele nennen, Vor- und Nachteile

A
  • Probandinnen müssen eigenständig etwas tun, z.B.:
  1. Das Drücken von Tasten
  2. Das gestische Umsetzen einer Aufforderung
  3. Das Nachahmen
  4. Das Abzeichnen einer Vorlage

Vorteile:
* Keine Vorgaben müssen z. B. hinsichtlich des Formats eingehalten werden
* Vielzahl und Vielfalt von Konstrukten können erhoben werden
* Kreativität in der Konstruktion

Nachteile:
1. hoher Konstruktionsaufwand
2. spezifische Aufgaben ermöglichen keine Vergleiche
3. umfangreiche Prätests notwendig
4. keine Vergleichsstandards

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Standardnormen benennen, Mittelwerte und Standardabweichungen der Skalennormen in Tabelle einfügen

A
  • T- Werte: (T=50+10*z)
    Transformierte Werte, die zu annähernd normalverteilten Werten mit einem Mittelwert von 50 und einer Standardabweichung von 10 führen.
  • Stanine-Werte:
    Umfassen die neun ganzen Zahlen von 1 - 9. Name ist Verkürzung von „standard score of nine units“. Bei normalenverteilten Variablen ist der Mittelwert 5 und die Standardabweichung 2.
  • C-Werte:
    oberen und unteren Kategorien der Stanine-Werte werden in zwei Kategorien aufgeteilt. C-Skala umfasst 11 Werte von 0 - 10. Werte der Skala sind die ganzen Zahlen von 0 - 10. Bei normalverteilten Variablen haben C-Werte einen Mittelwert von 5 und eine Standardabweichung von 2.
  • Sten-Werte:
    Basieren auf demselben Prinzip wie Stanine- und C-Werte, die Skala umfasst allerdings 10 Werte, und zwar die ganzen Zahlen von 1 - 10. Im Falle normalverteilter Variablen haben Sten-Werte einen Mittelwert von 5,5 und eine Standardabweichung von 2.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Messinvarianz, prädiktive Invarianz, Test-Bias erklären

A
  • Messinvarianz liegt vor, wenn sich die interindividuellen Unterschiede in einem meist kontinuierlichen Merkmal niederschlagen.
    unabhängig von einer etwaigen Gruppenzugehörigkeit in den gemessenen Variablen (z. B. Items)
  • Prädiktive Invarianz liegt vor, wenn sich die interindividuellen Unterschiede in einem meist kontinuierlichen Prädiktor niederschlagen.
    unabhängig von einer etwaigen Gruppenzugehörigkeit in dem Kriterium
  • Test-Bias (dt. Testverzerrung) bedeutet, dass Personen – wegen ihrer Gruppenzugehörigkeit – aufgrund des Prädiktors (Tests) keine ihrer Eignung entsprechende Chance haben, ausgewählt zu werden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vor- und Nachteile von Fragebögen

A

Vorteile:
* praktikabel & ökonomisch
* Vergleiche mit Normen möglich
* es existieren viele Fragebögen zu Persönlichkeitseigenschaften
* Menschen berichten in der Regel gerne über sich
* Selbstauskünfte besser als Fremdauskünfte

Nachteile:
* Personen können sozial erwünschte Antworten generieren, die die Konstruktvalidität des Inventars beeinflussen können.
* Bei Interneterhebungen kann oftmals nicht kontrolliert werden, wer die Aussagen bearbeitet.
* Beim Beantworten wird auf bestimmte Situationen oder Zeitpunkte fokussiert, so dass die Generalisierbarkeit der Beantwortung eingeschränkt sein kann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Beispiele für Skalen zur Erfassung von Verzerrungstendenzen in Persönlichkeitsfragebögen

A
  1. Eysenck Persönlichkeits-Inventar (Lügenskala, 9 Items)
  2. Eysenck Personality Questionnaire, Revised (Lügenskala, 22 Items)
  3. Freiburger Persönlichkeitsinventar, revidierte Fassung (Skala Offenheit, 12 Items)
  4. Minnesota Multiphasic Personality Inventory-2 (Nichtreaktion/inkonsistente Reaktionen: CNS, VRIN, TRIN; Simulation/Aggravation: F, Fb, Fp, FBS, Fs; Dissimulation: L, K, S)
  5. 16-Persönlichkeitsfaktorentest, revidierte Fassung (Impression Management)
  6. Personality Research Form (Infrequenz-Items (Validitätsskala))
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beispiel für Fragebogen der nur zur VT-Abfrage da ist

Ein Modell / Test das / der genau zur Erfassung dieser Verzerrungstendenzerstellt wurde / VT-Abfrage

A

Conditional reasoning test (CRT)
(CRT–Test zum konditionalen Schlussfolgern)

-Mit Tests zum konditionalen Schlussfolgern kann untersucht werden, ob Antworten, die auf persönlichkeitsbezogenen impliziten kognitiven Verzerrungen basieren, für Personen logisch ansprechend sind.
-Im CRT sind u. a. solche Antwortoptionen enthalten, die sich auf eine Rechtfertigung bzw. eine Rationalisierung des eigenen Verhaltens beziehen.
-Im CRT wird auf die Erfassung impliziter kognitiver Verzerrungen abgestellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vier Phasen des diagnostischen Prozesses und Aufgaben nach Fernandes-Ballesteros

A
  1. Analyse des Anliegens
    * Fragestellung des Auftraggebers/in
    * Formulierung und Konzeptualisierung des Anliegens
    * Erheben der Infos
    * Verarbeitung der Infos
  2. Aufbereitung und Berichten der Ergebnisse
    * Organisation
  3. Planung der Intervention
    * Durchführung der Intervention
  4. Evaluation und Follow-up-Untersuchung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was muss in ein Manual bzw. in die Testdokumentation?

A
  1. theoretische Grundlagen des Tests
  2. empfohlene Anwendungsbereiche
  3. empirische Belege für die Anwendungsbereiche
  4. Hinweise auf missbräuchliche Anwendungen
  5. spezifische Qualifikationen des Testanwenders
  6. Instruktion für die Testdarbietung
  7. Beispiele von Interpretationen der Testergebnisse
  8. Grundlagen der Testentwicklung
  9. Hinweise darauf, inwieweit Testergebnisse durch Übung, Coaching oder Anleitung verbessert werden können
  10. Infos zu Gütekriterien
  11. Darstellung der Normen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nenne vier Arten der Reliabilitätsbestimmung und erklären diese

A

1) Retest-Reliabilität (auch: Test-Retest-Reliabilität)
- An einer Personenstichprobe werden dieselben Messungen zu zwei verschiedenen Zeitpunkten durchgeführt
- Anschließend wird die Bravais-Pearson-Korrelation beider Messungen als Schätzer für Reliabilität verwendet
 Somit setzt die Retest-Reliabilität voraus, dass Merkmalsunterschiede zwischen Probanden zu beiden Zeitpunkten gleich sind

2) Paralleltest-Reliabilität
- Zwei materiell verschiedene Messverfahren (Paralleltests) werden zu zwei Messzeitpunkten verwendet, so dass Erinnerungseffekte minimiert werden
- Schwierigkeit: Zwei parallele Tests / Fragebogen für ein Merkmal zu entwickeln
- Items / Aufgaben sollen für den Probanden unterschiedlich sein und zugleich dasselbe Merkmal messen
 Paralleltests sollten sich idealerweise aus Items mit denselben psychometrischen Eigenschaften (z.B. gleiche Schwierigkeiten / Faktorladungen) zusammensetzen

3) Split-Half-Reliabilität (Testhalbierungsreliabilität)
- Wenn keine Paralleltests zur Verfügung stehen und keine separaten Messzeitpunkte gewählt werden können
 Möglichkeit: Parallele Messungen durch Aufteilung der Items/Aufgaben einer Messung an einem Messzeitpunkt zu erzeugen, um dann beide Testhälften zu korrelieren (entscheidend: Beide Testhälften müssen dasselbe Merkmal messen)

4) Interne Konsistenz (meistens Cronbachs-α)
- Maß für die Homogenität eines Tests. Entspricht geschätztem Mittelwert aller möglichen Split-Half-Koeffizienten, die man anhand der Items eines Tests erhalten kann.
- Cronbachs entspricht der Reliabilität der Testsummenvariablen, wenn die Voraussetzungen eines Modells essenziell -äquivalenter Variablen erfüllt sind.
- Schätzung der Korrelation zwischen zwei Zufallsstichproben von Items aus der Itempopulation des Tests

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Terminale und investigatorische Entscheidungen bei diagnostischem Prozess definieren

A

Terminale Entscheidung:
* diagnostischer Prozess ist mit Beantwortung der Fragestellung beendet, sofern gewünscht, kann Intervention geplant werden

  • Beispiel: Frage, ob ein 4,7-jähriges Mädchen Entwicklungsverzögerungen aufweist und ob eine Frühförderung angezeigt ist. In dem Fallbeispiel ergaben sich Hinweise auf Entwicklungsverzögerungen, so dass den Eltern eine Frühförderung ihres Kindes empfohlen wurde, die auch umgesetzt wurde.

Investigatorische Entscheidung:
* Mit Erhebung erster Informationen zu Fragestellung und Beantwortung dieser treten weitere Fragen auf, die einer weiteren Überprüfung im diagnostischen Prozess bedürfen
* Weitere zu beantwortende Fragen können zu einer terminalen Entscheidung führen, aber auch weitere investigatorische Entscheidungen nach sich ziehen

  • Beispiel: Frage, ob eine 52-jährige Frau zum Lenken von Kraftfahrzeugen der Klasse B geeignet ist. Frage sollte im Rahmen einer verkehrspsychologischen Untersuchung bearbeitet werden, nachdem der 52-Jährigen der Führerschein aufgrund von zwei Alkoholdelikten innerhalb von fünf Jahren entzogen worden war.Fragestellung wurde dahingehend beantwortet, dass die kraftfahrspezifische Leistungsfähigkeit bei der Probandin zwar gegeben sei, wogegen eine ausreichende Bereitschaft zur Verkehrsanpassung nicht festgestellt werden konnte. In der Empfehlung hieß es daher, dass eine psychologische Beratung angezeigt erscheine, wobei die Alkoholabstinenz monatlich überprüft werden solle.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Offene/freie Antwortformate

A
  • Offene Fragen: Es werden keine Antwortalternativen vorgegeben (Exploration)
     Bsp. Kurzsatzaufgaben: Proband muss selbst Antwort formulieren, zB Ein-Wort-Sätze, kurzer Essay, eigene Zeichnung (z.B. bei Tests zum lexikalischen Wissen, oder allgemeinen Wissen)
     Bsp. Ergänzungsaufgabe: Vorgabe zum Itemstamm muss vervollständigt werden (zB Sätze, Zeichnungen, Bilder benennen, Lückentext)

Vorteile:
* Wissen und persönliche Rekonstruktionen können einfach erhoben werden
* Ratewahrscheinlichkeit der VP ist gering, Wissen muss aktiv produziert werden
* Besonders für Erhebung von persönlichen Assoziationen, komplexer Lösungswege, Kreativität

Nachteile:
* Grosse Antwortvarianz > grosser Spielraum bei Auswertung (Auswertungsobjektivität)
* Erhöhter Zeitbedarf für Bearbeitung und Auswertung der Items
* Personen, die sich nicht besonders gut ausdrücken können sind potenziell benachteiligt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Geschlossene/gebundene Antwortformate

A
  • Hier werden feste Antwortkategorien vorgegeben, aus denen eine ausgewählt werden muss. (z.B. Ordnungsaufgaben, Auswahlaufgaben)
     Bsp.Ordnungsaufgaben: Zuordnung von Paaren, Oberbegriffe zuordnen
     Umordnungsaufgaben: z.B. Bilder nach Größe ordnen, Bildergeschichte in logische Reihenfolge bringen, Postkorbaufgaben
     Auswahlaufgaben: Zustimmung zu einer Kategorie
     Ungeordnete mehrkategorielle Antwortformate wie z.B. Multiple Choice (bei dem falsche Antworten «Distraktoren» sind)

Vorteile:
 Vollständige Standardisierung möglich – hohe Objektivität
 Auswertung einfach und ökonomisch
 Verminderter Zeitaufwand für Durchführung und Auswertung
Nachteile:
 Zutreffende Antwort kann von VP geraten werden
 Bei Leistungstests: Wissen nicht produziert sondern nur wiedererkannt
 Höherer Konstruktionsaufwand, um gute Fragen zu finden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Welche Reihenfolgeeffekte gibt es + beschreibe diese

A
  • Die Anordnung von Items wirkt sich auf deren Beantwortung aus. Ist v.a. dann relevant, wenn die Person noch keine feste Meinung / verfügbares Wissen hat und sich dann durch die Fragestellung eine Meinung bildet
  • Arten von Reihenfolgeneffekten:
    1 Ankereffekte: Vergleichsanker wird genutzt
    2 Konsistenz/Assimilationseffekte: Frage ähnlich beantw, um Konsistenz zu demonstrieren
    3 Kontrasteffekte: Unterschiedlichkeit zu einer früheren Frage steht im Vordergrund
    4 Salienzeffekte: Durch Bearbeitung früherer Frage wird Konstrukt «salienter» und bei einer zweiten ähnlichen Frage anders bewertet
    5 Primingeffekte: Bestimmt Infos sind eher verfügbar (zB Prozentrechnung >Textaufgabe)
    6 Subtraktionseffekte: Befragter denkt, er soll nennen, was er davor nicht genannt hat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welche drei Formen / Facetten der Kriteriumsvalidität gibt es? Beschreibe diese.

A
  1. Konkurrente Validität – das Kriterium wird im Wesentlichen zur gleichen Zeit erhoben (Übereinstimmungsvalidität)
  2. Prognostische / prädiktive / Vorhersagevalidität – das Kriterium wird zeitlich später erhoben, Testergebnisse liegen bereits vor
  3. Retrograde Validität – das Kriterium wurde zeitlich schon vor der Testkonstruktion bzw. -validierung erhoben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Inhalts- und Augenscheinvalidität erklären und voneinander abgrenzen

A
  • Inhaltsvalidität:
  • bedeutet, dass die Items eine repräsentative Stichprobe aus dem Itempool des theoretisch formulierten Konstrukts umfassen.
  • Jeder Bereich des Konstruktes sollte abgedeckt sein.
  • Sie ist unbedingt zu erfüllen bei der Erstellung eines Tests, auch wenn sie je nach Fragestellung und Anwendungsbereich mehr oder weniger zum Tragen kommt
  • z.b. wichtig bei der induktiven oder kriteriumsorientierten Testkonstruktion, weniger bei der deduktiven (rationalen) oder externalen Testkonstruktion.
  • Augenscheinvalidität:
  • bedeutet, dass auch ein Laie erkennen kann, welche latente Variabel in einem Test erfasst werden soll.
  • kann hilfreich sein, um Probanden dazu zu motivieren, den Test durchzuführen.
  • Jedoch kann eine hohe Augenscheinvalidität auch dazu führen, dass es zu Verzerrungen kommt und die Probanden nicht ehrlich auf die Items antworten.
    -Daher ist sie ein Gütekriterium, wonach sich die Testkonstruktion nicht zwingend richtet, z.b. im Gegensatz zur Inhaltsvalidität.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Diskutiere warum die „Weder-Noch-Kategorie“ gut oder schlecht ist + eigener Meinung

A

Pro: bei bipolaren SKALEN gute Wahl einer Kategorie, kommt immer auf die Skalen an! Z.B. wie hoch ist das Interesse an Sex zu zwei Messzeitpunkten

Contra:
1. durch diese Mittelkategorie kann ein Antwortmuster produziert werden
2. diese Kategorie kann verschiedenen Bedeutungen haben, die sich in ihren Bedeutungen sehr voneinander unterscheiden.

Fazit:
*  diese Mittelkategorie sollte vermieden werden, wenn sie keine Bedeutung hat.
*  für VP vielleicht angenehm, für Testende aber nicht sehr gut erfassbar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Unterschied zwischen psychologischer und physikalischer Messung

A

-> Beispiel einer physikalischen Messung ist die Bestimmung der Körpergröße bei einer medizinischen Untersuchung

  1. Bei psychologischen Messungen gibt es keinen „Gold-Standard“ bzw. keinen allgemein akzeptierten Vergleichstandard (Eichung) wie z. B. bei der Maßeinheit Meter. Konsequenzen hat dies in Hinsicht auf die Validität (umfangreicherer Studien sind notwendig).
  2. In der Psychologie kann man das interessierende Merkmal anhand eines einzelnen Messvorgangs häufig nur sehr viel gröber messen, als dies bei der Größenmessung der Fall ist, siehe z. B. die Messung von Intelligenz. Ebenfalls ist der „Feinheitsgrad“ bei der Messung eines Merkmals wie der Intelligenz wichtig (Aufgabe gelöst / Aufgabe nicht gelöst meist nicht präzise genug). Hinsichtlich der Präzision nutzt man in der Psychologie sogenannte Psychometrische-Modelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Konstruktvalidität – Strategien zur Sicherung

A

Definition Konstruktvalidität:
Diese bezieht sich auf die Frage, inwieweit die Testwerte im Sinne des Konstrukts, das die beobachteten Testwerte und deren Zusammenhänge mit anderen Variablen erklären soll, interpretiert werden können.

Sicherung der Konstruktvalidität:

Um die Konstruktvalidität eines Tests zu sichern, muss nachgewiesen werden, dass die Testwerte den Erwartungen folgen, die man aus theoretischen Überlegungen zu dem Konstrukt herleiten kann.
Bsp: Will man die „Stimmung“ bestimmen (gute vs. schlechte), sollten die Werte teilweise schwanken.
1) Ebenfalls sollten die Testwerte mit denen jener Tests zusammenhängen, die ebenfalls „Stimmung“ messen. Ist dies der Fall, so spricht man von konvergenter Validität.
2) Die Testwerte von Tests, die nicht das gleiche Konstrukt messen, sollten nicht miteinander korrelieren. Kann man dies bestätigen, so liegt diskriminante Validität vor.

 Inhaltlich-logische Analyse der Testelemente (Inhaltsvalidität)
 Korrelation des Tests mit Aussenkriterien (Kriteriumsvalidität)
 Korrelation des Tests mit anderen Tests, die andere Merkmale erfassen  idealerweise niedrige Korrelation (diskriminante Validität)
 Korrelation des Tests mit anderen Tests, die gleiche Merkmale erfassen  idealerweise hohe Korrelation (konvergente Validität)
 Analyse interindividueller Unterschiede (Verteilungen) in den Testresultation
Analyse intraindividueller Veränderungen bei wiederholter Durchführung (interne Validität)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Nenne die fünf Normen nach Kolen

A
  1. Nationale Normen
     Beziehen sich auf ganze Nation, auch Subpopulationen möglich (Bildung, Geschlecht)
  2. Lokale Normen
     Fokussieren auf regionale spezifische Subpopulation (z.B. Bundesland)
  3. Gelegenheitsnormen
     Basieren auf Gelegenheitsstichproben (nicht repräsentativ vorgefunden, z.B Studierende an einer speziellen Hochschule)
  4. Gruppenniveau-Normen
     Haben nicht individuelle Werte, sondern mittlere Gruppenausprägung zum Gegenstand (z.B. mittlere Arbeitszufriedenheit in versch. Organisationen)
  5. Itemniveau-Normen
     Beziehen sich auf einzelne Items, nicht hingegen auf den gesamten Test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Konstruktvalidität überprüfen /erhöhen
Untersuchungsmethoden + erklären

A

o Analyse von Gruppenunterschieden: Werden Gruppenunterschiede, die sich aus Theorie er-geben, von Daten bestätigt? (zB depressive vs nicht-depressive Stimmung)

o Zusammenhangsanalysen mit anderen Tests: Sind Ergebnisse ähnlich wie/korrelieren mit anderen Testmethoden, die das gleiche/ähnliche Konstrukt abfassen sollen?

o Analyse der internen Struktur: Sind die Items zur Erfassung der Struktur eindimensional? Oder erfassen sie ein mehrdimensionales Konstrukt? Die Struktur des Tests sollte der Struktur des theo-retischen Konstruktes entsprechen

o Analyse der Stabilität und Veränderung von Testwerten: Schwanken Testwerte über Zeit/Situation/Stimmung hinweg? Untersuchung, ob fluktuierende Zustände die Testwerte in theo-riekonformer Weise verändern oder stabil bleiben

o Prozessanalyse: Untersuchung des Antwortprozesses: Wie kommen Probanden auf die Lösung? (Methode lautes Denken - Verbalisierung der Gedanken während der Beurteilung der Aufgabe)

28
Q

Klinische und statistische Urteilsbildung erklären + was ist besser + welche Strategie dahinter?

A

Klinische Urteilsbildung:
Informationen werden auf der Basis subjektiver, intuitiver, informeller Einschätzungen zu einem diagnostischen Urteil integriert.

Statistische Urteilsbildung:
Auf der Basis fester Regeln, Formeln und Algorithmen werden Infor-mationen zumeist computerbasiert zu einem diagnostischen Urteil integriert. Urteilsbildung basiert auf Zusammenhängen zwischen Prädiktor- und Kriteriumsvariablen. Ausprägungen des Prädiktors werden zur Vorhersage über Kriteriumsausprägungen genutzt.

  • Beim Vergleich diagnostischer Einschätzungen sind die auf Basis statistischer Urteilsbildung genauso gut und zumeist besser als diagnostische Einschätzungen.
    o Ein wesentlicher Einflussfaktor ist die Verfügbarkeit strukturierter Interviews
29
Q

Urteilsbildung nach Meehl und Sawyer

A

differenziert nach Art der Datenerhebung (psychometrisch vs nicht psychometrisch) sowie nach Art der Kombination der Daten (formell-statistisch vs. informell-klinisch)

Diese Daten können formell (nach expliziten Regeln) oder informell kombiniert werden

o Informell psychometrisch: Informationen mit psychometrischen Inventaren erfasst und intuitiv zu einem diagnostischen Urteil integriert

o Formell psychometrisch: Informationen mit psychometrischen Inventaren erfasst und dann in Modelle (zB Regressionsgleichung) integriert, um Entscheidung zu erlangen.

o Informell nichtpsychometrisch: Auf Grundlage von Beobachtungen schätzt ein Sachverständi-ger zb. Tendenz zu aggressivem Verhalten einer Person ein

o Formell nichtpsychometrisch: Auf Grundlage von Beobachtungen schätzt ein Sachverständiger zb. Tendenz zu aggressivem Verhalten einer Person ein. Informationen werden als Prädiktoren in eine Regressionsgleichung integriert, um Entscheidung zu erlangen.

Kritik: Oft werden Informationen erhoben, für die keine ausreichenden Informationen über Objektivität und Reliabilität vorliegen und die nicht nach einem transparenten Vorgehen zu einer diagnostischen Entscheidung integriert werden

30
Q

Qualität von Gutachten, Qualitätsmerkmale

A
  1. Das Gutachten sollte dem Auftraggeber (AG) nutzen. Gutachter sollte Fragestellung des AG innerhalb des vereinbarten Zeitrahmens beantworten
  2. Die Kosten und der Nutzen sollten in angemessener Relation stehen
  3. Das Gutachten sollte lesbar, verständlich, nachvollziehbar, nachprüfbar und über-zeugend sein

> Leicht nachvollziehbare Struktur, verständliche Wortwahl (Fachbegriffe erläutern, unerklärte Abkürzungen vermeiden).
Nachvollziehbarkeit erhöhen durch die Strukturierung der Fragestellung und eindeutig differen-zierbare Abschnitte im Gutachten (insbesondere die Darstellung von der Interpretation der In-formationen trennen)
Die Nachprüfbarkeit der diagnostischen Begutachtung kann dadurch gewährleistet werden, dass die Quellen der diagnostischen Informationen angegeben werden, der Untersuchungsablauf dokumentiert wird, Auswertungsmethoden und Beurteilungskriterien expliziert werden.

31
Q

Psychologische Diagnostik

A

-Empirisch basierte, möglichst genaue, Schätzung der Ausprägung und Veränderung psychologischer Konstrukte bei Merkmalsträgern
-die möglichst genaue Klassifikation der Merkmalsträger in Gruppen mit ähnlichen psychischen Merkmalen, unter Beachtung transparenter, wissenschaftlicher u ethischer Standards
-Ziel ist die Beantwortung diagnostischer Fragestellungen.

32
Q

Normorientierte und kriteriumsorientierte Transformation

A
  • Um Unterschiede zwischen Personen (interindividuell) oder in der Ausprägung eines Merkmals bei einer Person (intraindividuell) feststellen zu können, müssen Testwerte von Personen miteinander oder mit einem Kriterium verglichen werden .
  • Normorientierte und kriteriumsorientierte Skalierung basieren beide auf einem Bezugssystem:

o Bei der normorientierten Skalierung wird die Verteilung in einer Referenzpopulation hinzugezogen (inter-individuell)
 ZB kann man die Leistung eines Kindes in einem Test mit einem Normwert, beispielsweise dem Mittelwert einer Referenzpopulation, vergleichen. Als Referenz wird jetzt eine Population zum Vergleich herangezogen und das Ergebnis der VP wird hinsichtlich statistischer Verteilkennwerte interpretiert. (Bsp. IQ)
 So kann man auch zB den z-Wert bestimmen, indem man von der Merkmalsausprägung des Kindes den Mittelwert der Referenzpopulation abzieht und diesen Differenzwert durch die Standardabweichung teilt. (dann wäre ein z-Wert von 1 = Testergebnis liegt um eine Standardabweichung über den Mittelwert der Referenzpopulation)

o bei der kriteriumsorientierten Skalierung wird ein Kriterium festgelegt, das es zu erfüllen gilt: (intra-individuell)
 zB Einbürgerungstest: Hier müssen von 33 Fragen 17 erreicht werden, um den Test zu bestehen. Die Zuordnung des Ergebnis wird in bestanden vs. nicht bestanden gemacht.
Hier ist es wichtig, dass man an theoretischen Überlegungen festmacht, wann eine Zuordnung passend ist.

33
Q

Sensitivität und Spezifizität

A

Falsch positiv: Personen, die ausgewählt werden, obwohl sie nicht geeignet sind.

Falsch negativ: Personen, die nicht ausgewählt werden, obwohl sie geeignet sind.

Sensitivität: bedingte Wahrscheinlichkeit, dass eine Person, die zur Kriteriumsgruppe gehört, auch als zu dieser zugehörig diagnostiziert wird. Anteil richtig-positiver der Kriteriumsgruppe

Spezifizität: bedingte Wahrscheinlichkeit, dass eine Person, die der Kriteriumsgruppe nicht ange-hört, auch richtig-negativ diagnostiziert wird. Konsistenz & Spezifizität = Reliabilität

Positiver prädiktiver Wert = Wahrscheinlichkeit, dass eine Person, die als der Kriteriumsgruppe zugehörig diagnostiziert wird, auch wirklich der Kriteriumsgruppe angehört.

Negativer prädiktiver Wert = Wahrscheinlichkeit, dass eine Person, die nicht als der Kriteriums-gruppe zugehörig diagnostiziert wird, wirklich nicht der Kriteriumsgruppe angehört

34
Q

Kind kurz hintereinander beim schulpsychologischen Test-unterschiedliche Testwerte-Welches Hauptgütekriterium könnte verletzt sein und dessen Facetten nennen. Die beiden anderen Hauptgütekriterien erklären.

A
  • Hier ist Reliabilität verletzt. Reliabilität beschreibt, dass bei einer wiederholten Messung desselben Merkmals mit demselben Instrument dieselbe Ausprägung entstehen sollte. Bei mehrmaliger Testung der Intelligenz sollte sich also das Messresultat nicht signifikant unterscheiden
  • Andere Gütekriterien eines Tests:
    o Objektivität: Durchführungsobjektivität, Interpretationsobjektivität, Auswertungsobjektivität
    o Validität: Gültigkeit und wichtigstes Kriterium: Test soll das messen, was er zu messen vorgibt.
35
Q

Definition psychologischer Test

A
  • Bei psychologischen Tests will man meist aus beobachtbaren oder manifesten Variablen (z.B. direkt beobachtbare Reaktionen wie das Lösen vs. Nichtlösen einer Aufgabe) auf latente Persönlichkeitsmerkmale schließen. Diese Persönlichkeitsmerkmale kann man nicht beobachten, sondern nur über das Verhalten erkennen.
  • Um latente Merkmalsausprägungen zu messen, braucht man drei Komponenten
    o 1) Reize, die merkmalsrelevantes Verhalten provozieren (z.B. Bilder von Gesichtern oder Fragen)  Reize provozieren relevantes Verhalten
    o 2) Reaktionsformen, anhand derer das Verhalten registriert werden kann (z.B. korrekte Kategorisierung eines Bildes oder nicht-Erkennen)  Reaktion korrekt/inkorrekt
    o 3) Modell, in dem die beobachtbaren Reaktionen interpretiert werden als Repräsentation latenter Merkmalsausprägung: Schafft Verbindung zwischen ausgelöstem/beobachtbaren Verhalten und latentem Merkmal
  • Je nach Art der Reize (Items) können verschiedene Erfassungsmethoden genutzt werden, z.B. Messung spezifischer Leistungen, Fragebögen zur Erfassung von Persönlichkeitsmerkmalen, Einstellungen, Interessen.
  • Die beobachtbaren Ausprägungen sind dabei oft Konstrukte
  • Psychometrisches Messmodell:
    o Verhalten wird dargestellt als Funktion des latenten Persönlichkeitsmerkmals und eines Items.
    o Idee, dass schwierigere Items eher von Leuten gelöst werden, die höhere Fähigkeit haben
36
Q

Latente Variable / Merkmal mit Beispiel

A
  • = Personenmerkmal, dessen Ausprägungen nicht direkt beobachtbar sind, sondern über beobachtbares Verhalten erschlossen werden.
  • Im Gegensatz dazu sind manifeste Variablen direkt beobachtbar.
  • Welcher Variablentyp ist auf Ebene der latenten Variablen in der Psychologie der häufigste?

o In der Psychologie hat man meist Modelle, die latente kontinuierliche Variablen als Hintergrund haben (z.B. Gewaltbereitschaft, Stimmung, Intelligenz)
o Latente Merkmale/Variablen:

 Liegen einem Verhalten zugrunde
 Ausprägungen sind nicht direkt beobachtbar, sondern werden über beobachtbares Verhalten erschlossen
 Wird über Wahrscheinlichkeitsbeziehung mit beobachtbaren Testwerten verbunden, dieser Zusammenhang zwischen Test/Frage und Hintergrund basiert also auf theoretischen Annahmen
 «Bist du zufrieden?» als manifeste Variablen, die Antworten (ja/nein) sind direkt messbar. Die Stimmung, die als Ursache für die Antworten gilt, kann jedoch nicht direkt gemessen werden und ist somit die latente Variable.

o Im Gegensatz dazu gibt es kategoriale Variablen, bei denen es begrenzte Ausprägungen gibt (z.B. Religionszugehörigkeit)

37
Q

Testtheorie – was ist das?

A

Testtheorie =
Teilgebiet der Psychometrie, das sich mit der Entwicklung und Formalisierung psychometrischer Modelle für psychologische Tests befasst,
inkl. Nutzung der Konstruktion und Evaluation der Tests

38
Q

“Lautes Denken” erklären

A
  • Lautes Denken ist ein Beispiel für die Prozessanalyse.
  • Bei der Prozessanalyse geht man der Frage nach, wie die Lösung einer Aufgabe zustande kommt bzw. wie die Beantwortung einer Frage vonstattengeht.
  • Bei der Methode des lauten Denkens fragt man nach der Verbalisierung der Gedanken während der Beurteilung der Aufgabe.
  • Beispiel: Bei Kind wird während einer Multiplikationsaufgabe ersichtlich, dass es sich nicht an Rechenfähigkeit handelt, aber das Kind die Aufgabe nicht versteht (Sprachkompetenz). Der Schluss vom Ergebnis auf die Rechenfähigkeit wäre also nicht gültig.
39
Q

Was versteht man unter dem Ankereffekt?

A
  • Zur Beantwortung einer vorhergenutzten Frage wird ein Vergleichsanker aus der letzten Frage genutzt, v.a. bei numerischen Fragen untersucht
  • Beispiel: Bei Fragebogen soll zunächst das Geburtsjahr angegeben werden. Dann soll der Preis eines T-Shirts bestimmt werden. Die Zahlen des Geburtsjahrs werden den Preis beeinflussen.
40
Q

Assimilationseffekt/ Konsistenzeffekt erklären

A
  • Konsistenz- oder Assimilationseffekte: Die Antwort auf eine zweite Frage fällt ähnlicher zur ersten aus, als wenn man die Fragen getrennt stellen würde. VP versucht, ein konsistentes Bild abzugeben (Subfacette des Ankereffekts).
  • Bsp: Einschätzung der Sympathie zu einem Parteipolitiker, spätere Beurteilung wie sympathisch Politiker im Allgemeinen sind
41
Q

Kontrasteffekt + Beispiel

A
  • Antwort auf die 2. Frage weicht stärker von der ersten ab, als wenn beide Fragen getrennt gestellt werden. Subfacette d. Ankereffektes
  • Dabei wird vermutet, dass der Effekt zustande kommt, weil für die urteilenden Personen eher die Unterschiedlichkeit der Urteilsgegenstände im Vordergrund steht
  • Bsp. Einschätzung der Sympathie zu einer Politikerin, die man sympathisch findet, und danach zu einer anderen, die man dann in Relation setzt und stark unsympathisch findet.
42
Q

Erklären Sie den Salienz-Effekt und geben Sie ein Beispiel dafür

A
  • Durch die Beantwortung einer ersten Frage verändert sich die Bewusstheit für einen bestimmten Sachverhalt, was zu einer veränderten Einschätzung einer zweiten Frage führt.
  • Bsp. Befragung zu Rassenfeindlichkeit, «Sind Weisse rassenfeindlich?» bzw. «Sind schwarze rassenfeindlich?»
  • Unabhängig davon, welche Gruppe zuerst beurteilt wurde, wurde immer die zweite Gruppe als Rassenfeindlicher bewertet.
  • Man schliesst darauf, dass die Befragten dabei dann weniger die Frage beantworteten, welche Gruppe schlimmer sei, sondern dass sie durch die Frage ein Bewusstsein entwickelt haben und dieses Bewusst machen («Rassenfeindlichkeit existiert») verstärkend wirkte beim Beantworten der zweiten Frage.
43
Q

Subtraktionseffekt mit Bsp. Erklären

A
  • Subtraktionseffekte: der Befragte schlussfolgert aus der Tatsache, dass er eine erste Frage bereits beantwortet hat, dass die folgende Frage einen weiteren Aspekt erfragt und die Information zu ersten Frage also unberücksichtigt bleiben soll, um Redundanz (man hat es schon mal erläutert) zu vermeiden.
  • Bsp. Wohlbefinden der Familie, wird anders beantwortet, wenn vorher schon mal nach dem Wohlbefinden eines einzelnen Familienmitglieds gefragt wurde. Dies wird verstanden als: „Wie geht’s dem Rest der Familie?“ und tritt auch oft in Krankheitsgeschichten auf: Ein Symptom wird nicht mehr genannt auch wenn es bei einer anderen Krankheit mit auftritt.
44
Q

Skaleneffekt + Beispiel

A

Benennung der Skalenendpunkte wirkt auf Antwortverhalten
- Unabh. von Inhalt werden Skalen als Vergleichsinformation genutzt, wenn kein Wissen über den Beurteilungsgegenstand da ist. Effekt ist umso höher, je komplexer das zu erstellende Urteil ist
- Z.b. können Personen die Skalen als bewertend empfinden oder darauf ablesen, was eher der sozialen Norm entspricht (z.b. Stunden vor dem Fernseher)

45
Q

Anamnesefragebogen „Persönliche Daten“, „Entw. Eines Psch.Problems“. Vor- und Nachteile / Was sind gebundene (= geschlossene) Antwortformate? Nennen Sie Vor- und Nachteile / Antwortformate (offen, geschlossen, atypisch) Beispiele einer Anamnese auswählen. Fragen zu “persönlichen Daten” (Alter, Beruf,…), Fragen zur “Entwicklung eines psychischen Problems”. Vor- und Nachteile der Antwortformate nennen.

A
  • Es gibt verschiedene Antwortformate: frei, gebunden und atypisch.
  • Welche Formate man nutzen will, sollte sich an der Passung der Items zum zugrunde liegenden psychometrischen Modell, ihrem Beitrag zur Schätzgenauigkeit, der Ökonomie des Tests, Zumutbarkeit des Tests, Testfairness und der Unverfälschbarkeit orientieren (siehe Gütekriterien, Reliabilität und Validität).
46
Q

Was versteht man unter Item-Schwierigkeit und erläutern Sie diese

A
  • Idee ist, dass ein Item umso leichter zu beantworten, je höher sein Lagemaß ist. Bei ordinalen Variablen nutzen wir den Median als Lagemaß der Itemschwierigkeit. Wenn also über 50 % der Population einen höheren Wert angeben, dann ist das Item leicht.
47
Q

Trennschärfe Definition und wie wird sie bei dichotomen Variablen bestimmt

A
  • Wenn eine Itemmenge einen einzigen gemeinsamen Faktor konstituiert, ist die Korrelation zwischen einem Item und der Itemsumme ein Schätzer für den Anteil, mit dem ein Item das intendierte Konstrukt erfasst. Dieser Schätzer wird als Trennschärfe (item-total-correlation) bezeichnet.
  • Es geht also immer um die Frage, ob ein Item Personen genauso in solche mit hohen und niedrigen Ausprägungen trennt wie die Gesamtsumme der Itemrohwerte.
  • Der Trennschärfekoeffizient eines Items entspricht der Korrelation des Items mit der Testwertvariablen. Je grösser die Korrelation ist, umso stärker ist der Zusammenhang eines Items mit dem Gesamtwert und umso stärker wirken sich auch Unterschiede in den Testwerten auf Unterschiede in den Itemantworten aus. Anzustreben sind daher Items mit hohen Trennschärfekoeffizienten.
  • Trennschärfe soll sozusagen eine Einschätzung ermöglichen, wie gut ein Item zwischen Personen mit niedriger und hoher Merkmalsausprägung trennt.
  • Um die Trennschärfe eines Items zu bestimmen, nimmt man oft das Item aus der Summierung heraus bzw. korrigiert den Korrelationskoeffizienten. Eine solche Korrektur nennt man auch Part-Whole-Korrektur, da das Ganze (der Testwert) um eines seiner Teile (das Item) korrigiert wird.
  • Interpretation:
    a. Bei einer hohen positiven Trennschärfe (Korrelation von +1) erfasst das Item etwas sehr ähnliches wie der Gesamttest
    b. Bei einer Trennschärfe von 0 hat es wenig mit dem Gesamttest zu tun, bei einer Trennschärfe von -1 sogar gegensätzlich.
    c. Normalerweise strebt man Trennschärfen von mind. 0.3 an.
  • Wenn Variablen dichotom sind, bietet sich ein Zusammenhangsmass Yules Q an, sonst nutzt man biseriale Korrelation
  • Wir müssen immer überprüfen, ob unsere Items überhaupt dasselbe Konstrukt im Hintergrund messen
48
Q

Erklären Sie die Reliabilität anhand der KTT /wahrer Wert / Messfehler OFT / Was versteht man unter True Score Variable (wahrer Wert) und Messfehler. Eigenschaften nennen und den Zusammenhang mit Reliabilität erläutern OFT

A
  • In der Klassischen Testtheorie (KTT) will man herausfinden, wie man den wahren Werte einer Person anhand der Mittelung gemessener Werte schätzen kann, und wie reliabel diese Schätzungen sind.
  • Wahrer Wert = true score.

o Der wahre Wert (true score) einer Person ist der personenbedingte Erwartungswert einer manifesten Variable. Sehr schwer zu schätzen, da es bei jedem Messvorgang zu potenziellen Abweichungen kommen kann.
o Der beobachtete Messwert setzt sich zusammen aus einem wahren Wert plus dem Messfehler (error score)
o Als wahrer Wert gilt, was bei verschiedenen Messungen desselben Merkmals bei denselben Personen konstant bleibt.
o Mittelwerte werden deshalb hier oft genommen, um den bestmöglichsten schätzbaren Wert darzustellen

  • Messfehler:
    o Messfehler sind Abweichungen des beobachtbaren Wertes vom wahren Wert, entstehen beim Messen. Es gibt zB Störvariablen, die das Ergebnis bei der Messung mit beeinflussen. Als Messfehler gilt das, was in den verschiedenen Messungen nicht konstant ist.
    o Wir erwarten einen möglichst geringen Messfehler. Dieser ist unkorreliert zur Variable und hat auch keine Korrelation mit anderen Messfehlern.
  • 4 Annahmen:
    o 1) Gemessenen Werte setzen sich aus wahren Werten und Messfehlern zusammen.
    o 2) Wir erwarten Messfehler so gering wie möglich
    o 3) Messfehler stellen etwas Zufälliges dar, sodass sie nicht mit dem wahren Wert korrelieren
    o 4) Messfehler korrelieren auch nicht miteinander, da zufällig
  • Zusammenhang der Messfehler mit Reliabilität:
    o Varianzzerlegung ist die Grundlage für die Definition der Reliabilität. Reliabilität ist einer der wichtigsten Kennwerte der Messfehlertheorie.
    o Reliabilität = Anteil der Varianz der True-Score-Variablen an der Gesamtvarianz. Wenn die Varianz der True-Score-Variablen gleich 0 ist, nimmt die Reliabilität den Wert 0 an. Reliabilität = wahre Varianz / Gesamtvarianz. Ist 1, wenn die Varianz der Fehlervariablen gleich null ist.
    o Reliabilität = Differenzialpsychologisches Mass, da sie angibt, inwieweit interindividuelle Unterschiede auf der beobachtbaren Variablen durch interindividuelle Unterschiede auf der True-Score-Variablen bedingt singt.
    o Die Reliabilität ist dann 0, wenn die Varianz der True-Score-Variablen 0 ist, also keine wahren interindividuellen Unterschiede bestehen.
    o Die Grösse der Reliabilität hängt vom Ausmass der wahren Unterschiede und somit auch von der Auswahl der Personengruppe ab, die man betrachtet.
    o Wählt man eine Gruppe aus, die in Bezug auf ihre wahren Werte relativ homogen ist, dann ist die Reliabilität bei gleicher Messfehlervarianz kleiner, als wenn man eine Gruppe von Personen betrachtet, die sich in ihren wahren Merkmalswerten stark unterscheidet.
49
Q

Wie kann man einen Test mit ungesicherter Reliabilität anwenden und dann prüfen? (Stellen Sie sich vor, es gibt in der Personalabteilung einen neuen Test zur Bewerberauswahl. Die Reliabilität des Tests ist bisher nicht bekannt. Wie können Sie den Test verwenden und die Reliabilität bestimmen?)

A
  • Generell sollten Tests fortlaufend überprüft werden, v.a. wenn sie als unsicher gelten.
  • Reliabilität = Anteil der Varianz der True-Score-Variablen an der Gesamtvarianz. Wenn die Varianz der True-Score-Variablen gleich 0 ist, nimmt die Reliabilität den Wert 0 an. Wenn die gesamte Varianz zwischen den Messwerten auf die Varianz der wahren Variablen zurückzuführen ist, ist die Reliabilität hoch – es liegen ja scheinbar keine Messfehler vor.
  • Für psychologische Tests wollen wir eine Reliabilität von mind. 0.7, bei einer Stichprobengrösse von N>300, um Robustheit von Reliabilität und kritischer Differenzen zu ermöglichen
  • Da wir die wahren Werte nicht kennen, kann auch die Reliabilität nur geschätzt werden. Dies geschieht zB mit Split-Half-Tests, Test-Retest-Variabilität, Paralleltest-Variabilität, Cronbachs Alpha
  • Methoden der Reliabilitätsschätzung: Interne Konsistenz, Retest-Reliabilität, Testhalbierungs-Reliabilität, Paralleltest-Reliabilität
    a. Interne Konsistenz / Cronbachs Alpha
    Interne Konsistenz der Items wird mittels Cronbachs Alpha bestimmt
    b. Retest-Reliabilität:
    Tests wird bestimmter Personenstichprobe zweimal zu verschiedenen Zeitpunkten, unter den gleichen Bedingungen gegeben. Anschliessend wird Pearson-Korrelation er Messungen als Schätzer für die Reliabilität genutzt. (Problem: Über Zeit könnte es zu Veränderungseffekten oder Erinnerungseffekten kommen)
    c. Testhalbierungs-Reliabilität (Split-Half-Reliabilität):
    Wenn es keine Paralelltests gibt und keine separaten Messzeitpunkte gewählt werden können, kann man parallele Messungen durch eine Aufteilung der Aufgaben/Items miteinander vergleichen. Müssen aber dasselbe Merkmal messen. Dabei werden dann die Itemwerte testhälftenspezifisch aufsummiert und korreliert.
    d. Paralleltest-Reliabilität:
    Zwei materiell verschiedene Messverfahren zum gleichen Konstrukt werden zu zwei Messzeitpunkten verwendet und dann korreliert. Hier können Erinnerungseffekte minimiert werden. Schwierig ist es aber, zwei Tests für dasselbe Merkmal zu entwickeln.
50
Q

Was sind lineare und was sind nicht lineare Transformationen?

A
  • Hat man eine Normpopulation definiert und eine Stichprobe gezogen, so müssen die Testwerte zu Parametern der Population bzw. Kennwerten der Stichprobe in Bezug gesetzt werden, um eine normbezogene Interpretation der Werte vornehmen zu können.
  • Es gibt zwei Arten von Transformation:
    a. Lineare Transformation
    b. Nicht-Lineare Transformation
  • Ziel ist es, die Ergebnisse besser interpretierbar zu machen und Merkmalsausprägungen zwischen verschiedenen Tests vergleichbar gemacht werden können. Bezugssystem für Vergleich von Testwerten ist die Normpopulation, die Testwerte bzw. Stichprobe muss so transformiert werden, dass eine normbezogene Interpretation vorgenommen werden kann.
  • Lineare Transformation: Dadurch gekennzeichnet, dass der Testwert mit einer Zahl multipliziert wird und diesem Produkt eine additive Konstante hinzugefügt wird.

c. Beispiel: z-Transformation:
i. Von den Testwerten wird der Mittelwert abgezogen und die Abweichung des Testwerts vom Mittelwert wird durch Standardabweichung dividiert.
ii. Vorteile davon: Testwerte werden so transformiert, dass sie einen Mittelwert von 0 und eine Standardabweichung von 1 aufweisen.
iii. Interpretation: Von einer Person, die einen z-Wert = 2 aufweist, weiss man, dass ihr Testwert um zwei Standardabweichungen über dem mittleren Testwert liegt, die Merkmalsausprägung also überdurchschnittlich ist.

o Nachteil davon: Nachkommastellen und können negativ werden. Wenn man dann die z-Werte zB aufrundet, ist das irgendwie einfach beliebig.
o Weitere Beispiele für lineare Transformationen: z-, Z-, T- und IQ-Transformation. Besonders bei normalverteilten Variablen sinnvoll

o Vorteile von linearen Transformationen:
iv. Sie ändern die Form der Verteilung der Merkmalsausprägung nicht
v. Sie können über Personen, Messzeitpunkt oder Tests gemittelt werden, was in verschiedenen Kontexten von Bedeutung ist

o Nachteile linearer Transformationen:
vi. Normierung erfolgt am Mittelwert der Verteilung, reagiert stark auf Ausreisser, was zu Fehlinterpretationen führen kann

51
Q

Nicht lineare Transformation: (Erklären Sie Prozentrangwerte)

A
  • Basiert auf Prozentrangwerten, die angeben, wie viel % der Personen der Normpopulation/Stichprobe denselben oder einen geringeren Wert als die Person mit einem spezifischen Testwert aufweisen.
  • Prozentrangwerte werden oft anhand von Stichprobendaten geschätzt. Wird berechnet, indem man die kumulierte Häufigkeit (Anzahl der Personen mit gleichem oder grösseren Testwert) durch die Grösse der Normstichprobe teilt und mit 100 multipliziert.
  • Interpretation: Eine Intelligenzleistung, der ein Prozentrangwert von 98 entspricht, spricht für eine aussergewöhnlich gute Leistung, während ein Wert von 2 eine Minderbegabung anzeigten würde.

e. Beispiele für nicht lineare Transformationen:
i. Prozentrangwerte
ii. Dezilrangwerte (Merkmale in Intervalle von 10 geteilt, die annähernd gleich viele Personen umfassen)
iii. Quartilrangwerte (Gruppierung in 4 Quartile)
iv. Prozentrangbänder (nimmt man an, um bei Prozentrangwerten die Messfehlerbehaftetheit zu berücksichtigen = Konfidenzintervalle für Prozentrangwerte)

f. Vorteile von Prozentrangwerten:
i. Erlauben einfache Interpretation des Testwertes, da sie anzeigen, wie die Testleistung in Bezug auf die Person einer Normstichprobe/Population einzuordnen sind
ii. Hohe/breite Anwendbarkeit

g. Nachteile von Prozentrangwerten:
i. Hinter derselben Differenz zweier nicht linear transformierter Werte können sich unterschiedlich grosse Konstrukt/Merkmalsunterschiede verbergen
ii. Das bedeutet dass numerisch gleicher Wert für zwei unterschiedliche Prozentrangunterschiede unterschiedlich grosser Merkmalsunterschied bedeuten kann
iii. Hier kann man also nicht sinnvoll mitteln oder andere statistische Kennzeichen anwenden

h. Bsp für nicht lineare Transformation: Stanine-Werte oder Prozentrang

52
Q

Vergleich lineare und nicht lineare Transformation:

A

Wenn eine Person auf einem Test mit Mittelwert 50 und Standardabweichung 10 einen Testwert von 64 aufweist und ein 95 % Konfidenzintervall für ihren wahren Testwert von {63;65} aufweist, dann entspricht dies einem Konfidenzintervall der z-transformierten Werte von {1,3 ; 1,5} und somit einem Prozentrangband von {90, 93}

53
Q

Schritte des diagnostischen Prozess nennen

A
  • Jäger definiert folgende Phasen des diagnostischen Prozesses:
  1. Auftraggeber schildert Anliegen
  2. Sachverständiger muss dies in psychologische Konstrukte umwandeln
    (Anforderungsanalyse): Prüfen der Anforderungen, ggf. reformulieren, Prüfen des Zeitrahmens
  3. Sachverständiger wird Hypothesen generieren
  4. Hypothesen werden operationalisiert:
    Sachverständiger wählt geeignete diagnostische Instrumente aus und achtet auch auf Gütekriterien
  5. Planung und Durchführung der Untersuchung:
    Sachverständiger plant Reihenfolge der Verfahren, dokumentiert Untersuchungssituation, Auswertung der Daten und Hypothesen. Ergebnisse werden in Bezug auf die Fragestellung integriert und Schlussfolgerungen gezogen und das Gutachten erstattet.
    Falls Interventionsmassnahmen Teil der Auftragsklärung waren, formuliert Sachverständiger Interventionshypothesen und potenzielle Verfahren.
  • Vier Phasen des diagnostischen Prozesses (Fernandez et al):
    f. 1) Analyse des Anliegens, Analyse und Konzeptualisieren des Anliegens
    g. 2) Aufbereitung und Berichten von Ergebnissen
    h. 3) Planung der Intervention
    i. 4) Evaluation / Follow-up
54
Q

Endscheidungsfindung: konjunktives und kompensatorisches Modell erklären
-> Anforderungsanalyse

A
  • Im diagnostischen Prozess werden typischerweise verschiedenste Informationen erhoben. Im Rahmen von Anforderungsanalysen wird dabei u. a. festgelegt, welche Merkmale und Informationen erhoben werden und welche Inventare dazu herangezogen werden.

o Terminale Entscheidung: Diagnostische Entscheidung beendet Prozess der Beantwortung der Fragestellung und darauf aufbauend kann Intervention geplant werden
o Investigatorische Entscheidung: Mit der Erhebung erster Informationen müssen weitere Überprüfungen eingeleitet werden.
- Folgende Modelle zur Entscheidungsfindung im diagnostischen Prozess sind möglich: Kompensatorisches vs. Konjunktives Modell

o Kompensatorisches Modell:
 Im kompensatorischen Modell können Schwächen auf einer Merkmalsdimension durch Stärken auf einer anderen Merkmalsdimension ausgeglichen werden
 Beispiel: unterdurchschnittliche Leistungen in figuralen Aufgaben können durch überdurchschnittliche Leistungen in verbalen Aufgaben kompensiert werden

o Konjunktives Modell:
 Nach dem konjunktiven Modell werden Mindestleistungen für ein oder mehrere Merkmale festgelegt (z. B. ein Versicherungsvertreter sollte durchschnittlich extravertiert sein, durchschnittlich freundlich sein, durchschnittliche Rechenfähigkeiten aufweisen).
 Darüber hinaus kann in der Anforderungsanalyse festgelegt werden, ob alle relevanten Merkmale des konjunktiven Modells entsprechend der Mindestanforderung vorliegen müssen.

55
Q

Methoden der Reliabilitätsschätzung:

A

Interne Konsistenz, Retest-Reliabilität, Testhalbierungs-Reliabilität, Paralleltest-Reliabilität
a. Interne Konsistenz / Cronbachs Alpha
Interne Konsistenz der Items wird mittels Cronbachs Alpha bestimmt
b. Retest-Reliabilität:
Tests wird bestimmter Personenstichprobe zweimal zu verschiedenen Zeitpunkten, unter den gleichen Bedingungen gegeben. Anschliessend wird Pearson-Korrelation er Messungen als Schätzer für die Reliabilität genutzt. (Problem: Über Zeit könnte es zu Veränderungseffekten oder Erinnerungseffekten kommen)
c. Testhalbierungs-Reliabilität (Split-Half-Reliabilität):
Wenn es keine Paralelltests gibt und keine separaten Messzeitpunkte gewählt werden können, kann man parallele Messungen durch eine Aufteilung der Aufgaben/Items miteinander vergleichen. Müssen aber dasselbe Merkmal messen. Dabei werden dann die Itemwerte testhälftenspezifisch aufsummiert und korreliert.
d. Paralleltest-Reliabilität:
Zwei materiell verschiedene Messverfahren zum gleichen Konstrukt werden zu zwei Messzeitpunkten verwendet und dann korreliert. Hier können Erinnerungseffekte minimiert werden. Schwierig ist es aber, zwei Tests für dasselbe Merkmal zu entwickeln.

56
Q

Reliabilitätskoeffizient

A
  • Reliabilität ein wichtiges Maß für Test- und Skalenwerte.
  • Reliabilitätskoeffizient gibt an, wie viel an Varianz einer beobachtbaren Variable durch die wahren Unterschiede erklärt werden kann.
  • Es wird bei zB der Berechnung von Standardfehlern für Konfidenzintervalle und kritische Differenzen immer implizit davon ausgegangen, dass die verwendeten Reliabilitätskennwerte robust sind, dh möglichst bei Stichprobengrössen von >300 bzw >400 ermittelt wurden.
    Ist dies nicht der Fall, spricht man von der „praktischen Invarianz“ der Reliabilitätskoeffizienten
  • Schwankungen des Reliabilitätskoeffizienten können auf Stichprobengrösse zurückzuführen sein, und auch in Abhängig von anderen Stichprobenmerkmalen (zB Kinder vs Erwachsene als Population) stark variieren
  • Möglichkeit, um Robustheit von Reliabilitätskennwerten zu untersuchen: Reliabilitätsgeneralisierung.
    o Dabei werden wie bei einer Metaanalyse Datenbanken durchgesucht nach Primärstudien zu einem speziellen Inventar
    o Die Reliabilitätskennwerte und Stichprobengrössen der Studien werden dann dokumentiert und aufbereitet.
57
Q

Was versteht man unter Normierung und wozu ist diese gut?
Was sind Gruppenspezifische Normen?
Welche Vor- und Nachteile haben diese?

A
  • Normen sind erforderlich, um die konkreten Werte einzelner Personen in den Kontext einer repräsentativen Referenzgruppe einzuordnen. Normen sind Maßeinheiten, in die man die Rohwerte verschiedener diagnostischer Verfahren transformieren kann, um sie vergleichbar zu machen und um sie in den Kontext einer möglichst repräsentativen Referenzgruppe einzuordnen.
  • Zwei Gruppen können so zB gut verglichen werden: Bsp Intelligenztest für Erwachsene vs. Kinder  Ziel: Vergleichbarkeit erreichen zwischen Populationen
  • Gruppenspezifische Normen (Bezugssystem nutzen): Gruppenspezifische Normen werden genutzt, wenn man relevante Teilgruppen (zB Geschlecht) identifizieren kann, die Konsequenzen für die Interpretation der Testwerte haben.

o Vorteile:
1. Gruppenspezifische Normen können verwendet werden, um die Testfairness zu optimieren (+/-).
2. Gruppenspezifische Normen können sowohl die Reliabilität als auch die Validität eines Testergebnisses vermindern oder erhöhen.
Die Wirkung einer gruppenspezifischen Norm ist ähnlich der Wirkung einer Quote, da z.B. die Teilnehmer beider Gruppen, trotz etwaiger Unterschiede im Test, gleiche Chancen erhalten, ausgewählt zu werden.

o Nachteile:
1. Auswirkung auf die Gütekriterien (Reliabilität und Validität)
2. Unterschiedliche Behandlung der Rohwerte der Gruppe kann nachteilig sein, wenn man zb damit diskriminiert

58
Q

Was ist ein Testprofil und wo wird es genutzt?

A
  • Testprofile = Ziel, Persönlichkeitstypen zu identifizieren, die eine bestimmte Gruppe von Personen charakterisieren. Zusammenfassung von Ergebnissen aus mehreren eigenständigen Einzeltests mithilfe einer grafischen Darstellung (zB Diagramm)
  • Profil = Standardisierte Skalenwerte eines Inventars werden grafisch dargestellt und miteinander verbunden
  • Ziel: Ergebnisse aus verschiedenen Tests einfliessen zu lassen, sodass ein umfassendes Bild über verschiedene psychologische Merkmale möglich wird.
  • Beispiel: Bei Persönlichkeitsinventaren werden mehrere Merkmalsausprägungen erfasst, und dann grafisch dargestellt, zB mit Referenz auf die Normwerte. Beispiel Berufsauswahl: berufsrelevante Eigenschaften werden zu Profilen zusammengesetzt
  • Testwerte eines Profils werden hinsichtlich dreier Merkmale beschrieben:
    a. Profilhöhe (profile level):
    i. Profilhöhe errechnet sich aus der Summe, der aus den Subtests erreichten Ergebnissen (standardisiert vorliegend) geteilt durch Anzahl der Subtests. Profilhöhe = Mittelwert der erreichten Werte der Subtests

b. Profilsteuerung (profile scatter):
i. Prüfung, ob Steuerung v.a. auf Messfehler zurückzuführen ist. Wenn Messfehler vorhanden, dann ist das Profil echt
ii. Streuung kann mit der Grösse X-Quadrat bestimmt werden.

c. Profilgestalt (profile shape):
i. Aussehen des Profils
ii. Frage nach signifikanten Stärken/Schwächen

  • Anwendung von Testprofilen:
    d. In der klinischen Psychologie werden so bestimmte Personengruppen identifiziert (mehrdimensionale Persönlichkeitsinventare)
    e. In der Arbeits- und Organisationspsychologie werden so u.a. berufsrelevante Eigenschaften anhand von Profilen dargestellt, um im Rahmen der Personalauswahl über die Eignung von Bewerbern zu entscheiden. Genauso zB Leadership Circle Profile – mehrere Dimensionen und Ausprägungen
59
Q

Erklären Sie das Konfidenzintervall. Welchen Einfluss hat das Konfidenzintervall in der psychologischen Diagnostik?

A
  • Wir müssen annehmen, dass Skalen oder Tests, mit denen Persönlichkeitsmerkmale etc. gemessen werden können, nicht frei von Messfehlern sind. Es liegt also keine perfekte Messgenauigkeit vor!
    Das bedeutet, dass die wahren Werte einer Person mit einer bestimmten Wahrscheinlichkeit um den gemessenen Testwert liegen.
  • Die Grenzen von Intervallen anzugeben ist wichtig, um die Testwerte richtig angeben zu können und Einschätzungen korrekt einordnen zu können.
  • Zeigt Wahrscheinlichkeit an, dass ein Wert innerhalb eines Konfidenzintervalles liegt: Statistische Sicherheit / vs. Irrtumswahrscheinlichkeit
  • Ein häufig verwendetes Konfidenzintervall ist 95 %. Man geht davon aus, dass 95 % der Werte den wahren Wert überdecken.
  • Die Reliabilität der Testskala ist ein wichtiger Anhaltspunkt zur Bestimmung des Konfidenzintervalls für individuelle Testwerte. Eine höhere Reliabilität führt zu einem engeren Konfidenzintervall.
  • Einordnung:
    a. Vorteile:
    1. Einfaches Verständnis, schnelles Ablesen des Bereiches, beinhaltet ähnliche Infos wie Signifikanztest, bietet Schätzung des entsprechenden Populationsparameters
    2. Erlaubt Aussagen über die Genauigkeit der Schätzung

b. Nachteile:
1. Kann durchaus passieren, dass der Wert nicht innerhalb des Intervalls liegt.
2. Spielraum statt konkreter Wert

60
Q

Das Bsp. mit dem IQ-Wert von 47 -Was bedeutet dies (Einordnung-Intelligenzminderung) und Konfidenzintervall von 6, was bedeutet das Mit diesen Werten aus gegebenen ICD 10 Diagnose die richtige auswählen bzw. vornehmen und Konfidenzintervall erklären

A
  • IQ-Wert von 47 und Konfidenzintervall von 6, bedeutet dass der sich der «wahre Wert» zwischen {41;53} befindet.
  • IQ 35-49: Mittelgradige Intelligenzminderung ICD10-Code F71.0: Deutliche Entwicklungsverzögerung in der Kindheit, meist aber mit gewissem Mass an Unabhängigkeit und Kommunikationsfähigkeit
  • Bei einem Konfidenzintervall von 6 kann es aber auch nur eine leichte Intelligenzminderung sein
61
Q

Arten der Testkonstruktion

A
  • Rationale (deduktive) Testkonstruktion: Items auf Grundlage theoret. Überlegungen formuliert > Konstruktkarte erstellen, Konstruktion Items, Kodierung Antwortformate, Auswahl Messmodell

o Induktiv: Repräsentativität des Items soll vor allem inhaltlich valid sein (Kontentvalidität). Grundgesamtheit wird beschrieben durch alle möglichen Ausprägungen.

o lexikalischer Ansatz: ZB.Persönlichkeitsdiagnostik: Nutzung von Adjektiven aus dem Wörterbuch, welche die Persönlichkeit beschreiben, um ein Itemuniversum zu erstellen (schwierig, da evtl. Facetten verloren gehen) bzw. über eine exploratorische Faktorenanalyse Hauptdimensionen der Persönlichkeit rausfiltern und zur Itemgenerierung nutzen.

o Prototypenansatz: Items werden danach ausgewählt, wie typisch sie für das jeweilige Konstrukt sind, z. B. beziehen sie sich auf Eigenschaften oder Handlungen.

  • Kriteriumsorientiert: Erreicht Person aufgrund ihrer Leistung ein gewisses Kriterium? (zB Kompetenzstufe). Test ist kriteriumsorientiert wenn: er inhaltsvalide ist, zur Erfassung v. Fähigkeit der Person konstruiert ist, Person anhand der Fähigkeitsausprägung einer Klasse von Personen zuordnet.
  • Externale Testkonstruktion = auf andere Konstrukte schliessen (Kriteriumsvalidität). Vorhersagen von Aussenkriterien.
62
Q

Was gehört zur induktive Testkonstruktion?

A

a. Prototypischer und lexikalischer Ansatz
Konstruktion eines Tests anhand dimensionsanalytischer Verfahren, aufbauend auf einer vorgegebenen Menge von Items.

Dazu gehören:
1. Lexikalischer Ansatz – in der Persönlichkeitsdiagnostik werden Adjektive aus dem Wörterbuch genutzt, die z.b. die Persönlichkeit beschreiben, um ein Itemuniversum zu erstellen (sehr schwierig, da evtl. Facetten verloren gehen) bzw. über eine exploratorische Faktorenanalyse können Hauptdimensionen der Persönlichkeit rausgefiltert und zur Itemgenerierung genutzt werden.
2. Prototypenansatz: Items werden danach ausgewählt, wie typisch sie für das jeweilige Konstrukt sind, z.b. beziehen sie sich auf Eigenschaften oder Handlungen.

63
Q

Was sagt die kritische Differenz aus?

A
  • Die kritische Differenz kann zum einen für Testwerte zwischen zwei Personen bestimmt werden und zum anderen für Testwerte bei einer Person.
  • Die kritische Differenz, bei der der Testwert auf einer Skala j bei zwei Personen bestimmt wird, sagt etwas darüber aus, ob sich zwei Personen substanziell in ihren Testwerten auf der interessierenden Skala j unterscheiden (z.b. ob sich die IQ Werte von zwei Personen für den Untertest verbale Fähigkeiten unterscheiden).
  • Die kritische Differenz, die für zwei Testwerte auf einer Skala j (z.B. positiver Affekt) beispielweise von Zeitpunkt 1 (Prä-Messung) zu Zeitpunkt 2 (Post-Messung) signifikant verändert hat.
64
Q
  1. Nennen Sie 3 weitere Gütekriterien
A

o T Testfairness – keine systematische Benachteiligung/Diskriminierung
o N Nützlichkeit – praktische Relevanz des gemessenen Merkmals
o T Testökonomie – Test verbraucht wenig Ressourcen
o S Skalierung – Verrechnungsvorschrift eines Testes
o U Unverfälschbarkeit – Kann nicht manipuliert werden
o N Normierung – Referenzstichprobe des Testes (Erststichprobe)
o Z Zumutbarkeit – keine unverhältnismässige Belastung für Test
o V Vergleichbarkeit

65
Q

3 Hauptgütekriterien erläutern und je ein Beispiel nennen (oft) / jeweils zwei Facetten erklären und benennen

A
  • Gütekriterien sind Qualitätskriterien, nach denen Diagnostiker/Psychologen die Tests, die gemacht werden sollen, auswählen
  • 3 Gütekriterien: Validität, Reliabilität, Objektivität
  • Validität: Gültigkeit
    o Test ist valide, wen er misst, was er zu messen vorgibt: Validität als Grad der Genauigkeit
    o Misst das Testinstrument das, was ich messen möchte?
    o Validität der Schlüsse, die aus Testwerten gezogen werden: diese müssen adäquat und angemessen sein
  • Reliabilität: Zuverlässigkeit
    o Reliabilität (auch Zuverlässigkeit) beschreibt die Messgenauigkeit eines diagnostischen Verfahrens bei einer Gruppe von Personen.
    o «Reliabilität ist der Grad, mit dem numerische Ergebnisse (z.B. Rohwerte) für eine Gruppe von Personen bei mehrfacher Anwendung des diagnostischen Verfahrens konsistent und wiederholbar sind.
    o Bei Wiederholung der Messung unter gleichen Bedingungen würde das gleiche Messergebnis erzielt werden
    o bei hoher Reliabilität: Anteil Varianz der durch Messfehler zustande kommt soll so gering wie möglich sein
  • Objektivität: Unabhängigkeit:
    o Das Ergebnis einer diagnostischen Erhebung oder eines Tests soll möglichst unabhängig vom Testleiter, von den Testsituationsmerkmalen, von den Rahmenbedingungen, von den Auswertern und von den interpretierenden Personen sein.
    o Die Ergebnisse sollen also «objektiv unabhängig» sein

o DIA:
 Durchführungsobjektivität: Unabhängigkeit von den Personen, die ein Verfahren anweisen bzw. durchführen, aber auch Unabhängigkeit vom Ort der Erhebung
 Interpretationsobjektivität: Unabhängig von Personen die interpretieren
 Auswertungsobjektivität: Unabhängig von Personen, die Verfahren auswerten

66
Q

Verzerrungstendenzen bei Testpersonen

A
  • Arten von Verzerrungstendenzen:
    -. Sind bewusste, stellen eine Form des Täuschens dar, beziehen sich meist auf andere Personen
    -. Häufig auftretende Verzerrungstendenzen: Reaction stil (trait) and set (situativ)
    1 Soziale Erwünschtheit (impression management): Ziel, bei anderen einen positiven Eindruck zu hinterlassen
    2 Selbsttäuschende Erhöhung (self-enhancement): Selbstwertgefühl soll aufrecht erhalten werden, Selbstbild geschützt werden
    3. Akquieszenz (Zustimmungstendenz unabhängig vom Iteminhalt)
    4. Tendenz zur Mitte
    5. Tendenz zu Extremantworten: überschiessend und demonstrativ antworten
    6. Simulation: zB bestimmte Beschwerden vortäuschen
    7. Aggravation: bewusstes Übertreiben vorhandener Krankheitssymptome
    8. Dissimulation: Bagatellisieren oder Weglasssen von Symptomen