MC Gesamt Flashcards

1
Q

Welche Aspekte gehören zum Nebengütekriterium „Zumutbarkeit“
a) Keine systematische Benachteiligung von Gruppen
b) keine unverhältnismäßige Belastung für VP (zeitlich, physisch und psychisch)
c) Der Test kann so nicht manipuliert werden
d) Das gemessene Merkmal ist praktisch relevant
e) Der Test verbraucht wenig Ressourcen

A

b) keine unverhältnismäßige Belastung für VP (zeitlich, physisch und psychisch)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

An wen richtet sich die Schweigepflichtsregelung nach § 203 des Strafgesetzbuches?
a) Lehrer
b) Erzieher
c) Ärzte
d) Psychologen
e) Praktikanten

A

c) Ärzte
d) Psychologen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was gehört zur Urteilsbildung
a) Statistische Urteilsbildung
b) Pädagogische Urteilsbildung
c) Klinische Urteilsbildung
d) Urteilsbildung auf Rechtslage
e) Testtheoretische Urteilsbildung

A

a) statistische Urteilsbildung
c) klinische Urteilsbildung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Konjunktives Entscheidungsmodell: Welche Aussagen sind richtig?
a) Wird im Rahmen der Anforderungsanalyse verwendet
b) Wird im Rahmen der Faktorenanalyse verwendet
c) Ähnelt dem kompensatorischen Modell, denn beide Modelle liegen diagnostische
Entscheidungen zugrunde
d) Und-/ Oder- Verknüpfung
e) Entspricht dem Prinzip des „lauten Denkens“

A

a) Wird im Rahmen der Anforderungsanalyse verwendet
c) Ähnelt dem kompensatorischen Modell, denn beide Modelle liegen diagnostische
Entscheidungen zugrunde (nur wenn zweiter Teil enthalten, sonst fundamentale unterschiede)
d) Und-/ Oder- Verknüpfung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie kann Reliabilität geschätzt werden?
a) Retest-Reliabilität
b) Cronbachs Alpha
c) Paralleltest-Reliabilität
d) Testhalbierungs-Reliabilität (Split-half)

A

a) Retest-Reliabilität
b) Cronbachs Alpha
c) Paralleltest-Reliabilität
d) Testhalbierungs-Reliabilität (Split-half)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Reliabilität…
a) Beeinflusst die Weite des Konfidenzintervalls ✅️
b) Dient als wichtige Information für Konfidenzintervalle ✅️
c) Je größer die Reliabilität ist, desto enger das Konfidenzintervall ✅️
d) Je größer die Reliabilität ist, desto weiter das Konfidenzintervall ❌️

A

a) Beeinflusst die Weite des Konfidenzintervalls
b) Dient als wichtige Information für Konfidenzintervalle
c) Je größer die Reliabilität ist, desto enger das Konfidenzintervall

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Aussagen treffen zur Klassischen Testheorie (KTT) zu?

a) Die KTT dient der Schätzung der Reliabilität ✅️
b) Die KTT lässt sich als Menge von Annahmen beschreiben, die für die Schätzung wahrer Werte, anhand der Mitteilung gemessener Werte, erforderlich sind ✅️
c) Es gibt 6 zentrale Annahmen der KTT, die auch „Axiome“ genannt werden
d) Die KTT nimmt an, dass sich die Messfehler nie zufällig um den wahren Wert verteilen, sondern systematisch

‼️ UMKEHRUNG MÖGLICH

A

a) Die KTT dient der Schätzung der Reliabilität ✅️
b) Die KTT lässt sich als Menge von Annahmen beschreiben, die für die Schätzung wahrer Werte, anhand
der Mitteilung gemessener Werte, erforderlich sind ✅️

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Die Klassische Testtheorie wird auch als Messfehlertheorie bezeichnet. Welche der Aussagen gehören zu den
Eigenschaften von Messfehler-Variablen in KTT?
a) Ein beobachteter Messwert einer Person in einem Test setzt sich additiv aus einem wahren Wert bzw.
True score und einem Messfehler/ Error score zusammen ✅️
b) der Erwartungswert der Korrelation zwischen den Messfehlern und dem wahren Wert ist 0 ✅️
c) der Erwartungswert der Korrelation zwischen den Messfehlern ist 0 ❌️
d) der Mittelwert des Messfehlers ist über unendlich viele Messungen desselben Merkmals bei einer
Person = 0 ✅️
e) Messfehlervariable ist mit jeder True-Score-Variablen unkorreliert ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definition von Konstruktvalidität wurde genannt und man sollte die entsprechenden Facetten der Validität
auswählen
a) Kontentvalidität (Inhaltsvalidität) ✅️
b) Kriteriumsvalidität ✅️
c) Konstruktvalidität ✅️
d) Augenscheinvalidität ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Womit lässt sich die Konstruktvalidität untersuchen?

a) Analyse von Gruppenunterschieden ✅️
b) Zusammenhangsanalysen mit anderen Tests ✅️
c) Analyse der internen Struktur eines Tests✅️
d) Analyse der Stabilität vs. Veränderung von Testwerten ✅️
e) Prozessanalyse ✅️
f) Inhaltsanalyse

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Facettentheorie…
a) Ist vor allem für die Konstruktvalidierung relevant ✅️
b) Wird zur Selektion von Target-Variablen herangezogen
c) Ist eine Erweiterung des Rasch-Modells
d) Kann genutzt werden, um unsystematische Häufungen von Items zu vermeiden ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Die Trennschärfe bzw. der Trennschärfenkoeffizient…
a) Entspricht der Korrelation des Items mit der Testwert-Variablen ✅️
b) wird über eine Profilanalyse gewonnen ❌️
c) Die Trennschärfe ist = 0 bei einer Itemschwierigkeit von = 1 ❌️
d) beschreibt auf mathematischer Weise, ob Reihenfolgeneffekte bei der Beantwortung von Items aufgetreten sind❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Odd Even zur Reliabilitätsschätzung veränderlicher Merkmale

A

Wenn ein leicht veränderliches Merkmal gemessen wurde, dann kann man durch die sogenannte Odd-
EvenMethode (Gerade-Ungerade-Methode) den Effekt der Merkmalsveränderung auf die Reliabilitätschätzung
gering
halten. Dabei werden alle ungeraden und alle geraden nummerierten Items getrennt summiert, um zwei
Testhälften zu erstellen. Da beide Hälften denselben Bearbeitungszeitraum umfassen, können etwaige
Merkmalsveränderungen während der Itembearbeitung in beiden Hälften ähnlich berücksichtigt werden, was
parallele Messungen ermöglicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche Kriterien gehören zu den Nebengütekriterien?

A

• Testfairness
• Messäquivalenz
• Normierung
• Testökonomie
• Nützlichkeit
• Zumutbarkeit
• Unverfälschbarkeit
• Akzeptanz
• Skalierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welche Aussagen definieren die Target-Variablen?

A

Target-Variablen (Zielvariablen) sind Variablen, für die eine statistische Vor- hersage als relevant oder
notwendig erachtet wird, wobei für die Auswahl von Prädiktoren keine theoretischen Gründe angeführt
werden können. Daher können für die Vorhersage von Target-Variablen lediglich empirisch begründbare
Prädiktoren herangezogen werden. Die Target- Variable entspricht in der Regel der Kriteriumsvariable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie lässt sich die Trennschärfe ermitteln?

a) Bestimmung über die Punkt-Biseriale Korrelation und die biseriale Korrelation ✅️
b) Part-Whole-Korrektur ❔️
c) Wenn die Itemschwierigkeit 0 ist = Trennschärfe 1 ❌️
d) Korrelation Testwert mit Summenvariablen ✅️
e) Korrelation Summenvariablen mit Testwert ❌️
f) Konfirmatorisch ❌️
g) exploratorisch ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Funktionen des diagnostischen Prozesses nach Jäger (welche gehört nicht dazu?)

A

Das Prozessmodell von Jäger (1983) beschreibt den diagnostischen Prozess als ein komplexes Geschehen,
das verschiedene Phasen umfasst. Diese Phasen müssen nicht unidirektional durchlaufen werden, sondern
können mehrfach durchlaufen werden, um zu einer diagnostischen Entscheidung zu gelangen. Zu den
Funktionen des diagnostischen Prozesses nach Jäger zählen:
• Kommunikationsprozess: Die Verständigung über den zu untersuchenden Sachverhalt zwischen dem
Diagnostiker und dem Auftraggeber.
a) Prozesshaftes Geschehen: Der diagnostische Prozess wird als dynamische Interaktion zwischen den am
Prozess beteiligten Personen betrachtet.
b) Technologischer Bezug: Das Vorgehen wird festgelegt, um den diagnostischen Prozess zu strukturieren
und die Daten zu gewinnen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was versteht man unter der Basisrate und Selektionsrate?

A

a) Basisrate: Die Basisrate ist der relative Anteil von Personen mit den in- tendierten Eigenschaften in einer
Population. Als Beispiel kann hier der relative Anteil von Personen mit Berufserfolg in einer Population
oder auch der relative Anteil von Personen mit einer psychischen Störung in einer Population genannt
werden.
b) Selektionsrate: Die Selektionsrate ist der relative Anteil der Personen, deren Messwerte ein Kriterium
erfüllen. Ein Beispiel für die Selektionsrate ist der Anteil der Bewerber, die aufgrund eines
Testergebnisses, das ein Kriterium erfüllt, einen Job erhalten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was beeinflusst die Falsch- Negativen und die Falsch-Positiven? /Wovon hängt die Klassifikation falsch-positiv/
falsch-negativ ab?
a) Basisrate ✅️
b) Selektionsrate ✅️
c) Reliabilität ❌️
d) Validität ✅️
e) Objektivität ❌️
f) Trennschärfe ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wovon hängt die Größe der Eichstichprobe ab?

A

Eine Eichstichprobe ist eine speziell ausgewählte Gruppe von Personen, die zur Normierung eines
diagnostischen Verfahrens verwendet wird. Die Größe der Eichstichprobe hängt von der erforderlichen
Genauigkeit ab, die durch die Reliabilität des Tests und das Konfidenzintervall für individuelle Werte
bestimmt wird. Eine größere Eichstichprobe ermöglicht präzisere Normen und stabile Ergebnisse in
verschiedenen Teilgruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welche Daten gehören zu den Datenquellen nach Cattell?

a) L(ife)-Daten ✅️
b) E (motion)-Daten ❌️
c) Q(uestionnaire)-Daten ✅️
d) T(est)-Daten ✅️
e) P(ersonal)-Daten ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Profilart von Carttell: wie werden erhobene Daten zusammengefasst? Bzw. Testprofil:
Nach was wird die Profilanalyse ausgerichtet?

a) Profilhöhe ✅️
b) Profilart ❌️
c) Profilstreuung ✅️
d) Profilgestalt ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was trifft auf den Impliziten Assoziationstest (IAT) zu?

a) Es handelt sich hierbei um ein indirektes Maß von Verzerrungen ✅️
b) Der IAT wurde ursprünglich im sozialpsychologischen Kontext zur Messung von Einstellungen, Stereotypen oder Vorurteilen entwickelt. ✅️
c) Mit dem IAT können auch Persönlichkeitsmerkmale oder Einstellungen können untersucht
werden ✅️
d) Der IAT erfüllt Merkmale eines objektiven Persönlichkeitstests ❌️
e) Kann nur von Kindern zwischen 6-12 Jahren ausgefüllt werden ❌️
f) Es werden Reaktionszeiten gemessen ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was sagt die kritische Differenz aus?

a) Ist der absolute Betrag der Differenz zweier Testwerte gleich oder kleiner als die kritische
Differenz, so unterscheiden sich die beiden Werte signifikant voneinander ❌️
b) ist der absolute Betrag der Differenz zweier Testwerte gleich oder größer als die kritische
Differenz, so unterscheiden sich die beiden Werte nicht signifikant voneinander ❌️
c) ist der absolute Betrag der Differenz zweier Testwerte gleich oder größer als die kritische Differenz so unterscheiden sich die beiden Werte signifikant voneinander ✅️
d) ist der absolute Betrag der Differenz zweier Testwerte gleich oder kleiner als die kritische
Differenz so unterscheiden sich die beiden Werte nicht signifikant voneinander ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Differential-Item-Functioning (DIF)

a) Setzt sich aus dem Item-pool und dem Personenmerkmal zusammen ❌️
b) Wir im Rahmen der Klassischen Testtheorie eingesetzt ❌️
c) Liegt vor, wenn ein Item unterschiedliche Messeigenschaften in verschiedenen Gruppen aufweist, unabhängig davon, ob sich die beiden Gruppen in dem gemessenen Merkmal bzw. Konstrukt unterscheiden ✅️
d) Verwendet zur Testung, ob ein Item den richtigen Abforderungen entspricht ❌️
e) Beschreibt eine Verletzung der Messvarianz für einzelne Items ✅️
f) Sollte zugunsten der Fairness eines diagnostischen Verfahrens angestrebt werden ❔️
g) Der DIF kann darauf hinweisen, dass Gruppen unterschiedlich verzerrt werden ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Welche ist die häufig auftretende Verzerrungstendenz?

a) Assimilationseffekte ❌️
b) selbsttäuschende Erhöhung ✅️
c) Äquidistanz ❌️
d) Dissimulation ❔️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Konfidenzintervalle erklären und mit Reliabilität in Verbindung bringen. Welche Aussagen sind falsch?

a) Das Konfidenzintervall dient der Intervallschätzung eines Parameters ❌️
b) Ein häufig verwendetes Konfidenzniveau ist 90% ✅️
c) Das Konfidenzintervall dient der der Bestimmung des Mittelwertes ✅️
d) Die Reliabilität beeinflusst die Weite des Konfidenzintervalls ❌️
e) Je kleiner die Reliabilität desto weiter Konfidenzintervall ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Welche Aussagen treffen zu? → DIN33430

a) richtet sich an Personen, die in der beruflichen Eignungsdiagnostik tätig sind ✅️
b) macht Aussagen zur Qualifikation der Diagnostizierenden ✅️
c) wird in der Regel als Prozessnorm und Transparenznorm beschrieben ✅️
d) ist rechtsverbindlich❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Ein Konfidenzintervall…

a) beschreibt Messfehler um wahren Wert ❌️
b) beschreibt einen Bereich, in dem der wahre Wert mit einer gewissen Wahrscheinlichkeit liegt ✅️
c)…
d)…

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Nivellierung und Akzentuierung

a) In der Grafik lässt sich eine Akzentuierung der Unterschiede im mittleren Bereich erkennen ✅️
b) In der Grafik lässt sich eine Nivellierung der Unterschiede im mittleren Bereich erkennen ❌️
c) In der Grafik lässt sich eine Akzentuierung der Unterschiede in den Randbereichen erkennen ❌️
d) In der Grafik lässt sich eine Nivellierung der Unterschiede in den Randbereichen erkennen ✅️
e) Die Grafik zeigt Akzentuierung und Nivellierung der Unterschiede in einer glockenförmigen Verteilung ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Verhaltensgleichung nach Westhoff und Kluck (2008) Welche Variablengruppen?

a) Organismusvariablen (O) ✅️
b) Umgebungsvariablen (U) ✅️
c) Skalierten Variablen (S) ❌️
d) Organisationsvariablen (O) ❌️
e) Universitätsvariablen (U) ❌️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Welches Antwortformat soll gewählt werden für eine hohe Durchführungsobjektivität?

a) Ratingskala❔️
b) Dichotomes Antwortformat ❔️
c) Kategorial ❔️
d) Geschlossene/ gebundene Antwortformate ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Welches Antwortformat soll gewählt werden für die geringste Ratewahrscheinlichkeit?

a) Freie Antwortformate ✅️
b)…
c)…
d)…

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Welche Effekte zählen zu den Reihenfolgeeffekten?

a) Ankereffekte ✅️
b) Konsistenz oder Assimilationseffekte ✅️
c) Kontrasteffekte ✅️
d) Salienzeffekte ✅️
e) Salienzeffekte ✅️
f) Subtraktionseffekte ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Wähle die Schritte der rationalen Testkonstruktion aus.

  1. Erstellen einer Konstruktkarte
  2. Konstruktion von Items
  3. Kodierung von Antworten
  4. Auswahl eines Messmodells
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Welche Beispiele lassen sich den sogenannten „Umordnungsaufgaben“ zuordnen? Kreuze an

a) Der Subtest Wahrnehmung Visuell der IDS-P ❔️
b) Der Subtest Bilder Ordnen des Wechsler Intelligenztests für Erwachsene ✅️
c) Sprachtests ❔️
d) Testverfahren Handlungsorganisation und Tagesplanung (HOTAP) ✅️
e) Postkorbaufgaben ✅️

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Was bewirkt eine große Stichprobe in einem Test?

a) Power ✅️
b) Schätzgenauigkeit ✅️
c) Angemessenheit der Parameterschätzung ✅️
d) Modelltestung ✅️

A
38
Q

Was trifft NICHT auf das Forced-Choice-Format zu?

a) Das Format kann die ❌️ Durchführungsobjektivität beeinträchtigen ✅️
b) Das Format kann die Validität beeinträchtigen ❌️
c) Das Format kann die Reliabilität beeinträchtigen ❌️
d) gebundenes Antwortformat bei denen Personen eine Antwortalternative auswählen müssen, auch wenn sie sich nicht vollständig mit ihr identifizieren können oder die korrekte Antwort nicht wissen ❌️
e) offenes Antwortformat bei denen Personen eine Antwortalternative auswählen, wenn sie sich vollständig mit ihr identifizieren können oder die korrekte Antwort wissen ✅️

A
39
Q

Power-Speed-Index

A

Der Power-Speed-Index ist ein Maß, das verwendet wird, um den Grad zu bestimmen, in dem ein Test
zwischen einem idealen Speedtest (einfache Aufgaben, die schnell bearbeitet werden können) und einem
idealen Powertest (komplexere Aufgaben, die nicht unbedingt schnell bearbeitet werden können) variiert.
Der Index kann Werte zwischen 0 und 1 annehmen, wobei 0 einen Speedtest und 1 einen Powertest
kennzeichnet. Ein Wert unter 0,3 deutet eher auf einen Speedtest hin, während ein Wert über 0,7 auf einen
Powertest hindeutet. Der Index zeigt, wie stark die Bearbeitungsgeschwindigkeit die Testergebnisse
beeinflusst und variiert je nach Testlänge und den Eigenschaften der untersuchten Stichprobe. Der
PowerSpeed-Index ist relevant, um zu verstehen, wie ein Test zwischen Geschwindigkeit und Leistung
differenziert und ob er für die Zielgruppe angemessen ist.

40
Q

Itempopularität

a) Alle Items einer definierten Itemgrundgesamtheit/Itempool ❌️
b) Anteil an Probanden, die einem Item nicht zustimmen ❌️
c) Anteil an Probanden, die einem Item zustimmen ✅️
d) Wahrscheinlichkeit, ein Item korrekt zu beantworten (als Itemleichtigkeit zu interpretieren) ❌️
e) Man unterscheidet Modellbasierte und nicht Modellbasierte Definitionen der Itempopularität ❌️

A
41
Q

Itemschwierigkeit

a) Alle Items einer definierten Itemgrundgesamtheit/Itempool ❌️
b) Anteil an Probanden, die einem Item nicht zustimmen
c) Anteil an Probanden, die einem Item zustimmen ❌️
d) Wahrscheinlichkeit, ein Item korrekt zu beantworten (als Itemleichtigkeit zu interpretieren) ✅️
e) Man unterscheidet Modellbasierte und nicht Modellbasierte Definitionen der Itemschwierigkeit ✅️

A
42
Q

Itempopulation

a) Alle Items einer definierten Itemgrundgesamtheit/Itempool ✅️
b) Anteil an Probanden, die einem Item nicht zustimmen ❌️
c) Anteil an Probanden, die einem Item zustimmen ❌️
d) Wahrscheinlichkeit, ein Item korrekt zu beantworten (als Itemleichtigkeit zu interpretieren) ❌️
e) Man unterscheidet Modellbasierte und nicht Modellbasierte Definitionen der Itempopulation ❌️

A
43
Q

Konversationsmaximen

A

Konversationsmaximen sind implizite Gesprächsnormen, die sich auf das Kooperationsprinzip beziehen und
an die sich die Beteiligten im Rahmen eines kooperativen Gesprächs in der Regel halten.
Sie umfassen Qualitätsmaxime (Eine Frage oder Aufforderung ist begründet und „ehrlich“ gemeint),
Quantitätsmaxime (Äußerungen bzw. der Beitrag so informativ wie erforderlich und nicht übermäßig),
Relevanzmaxime (sachbezogen äußern) und Klarheitsmaxime (klar und verständlich äußern). Die Befragten
nehmen an, dass diese Normen sowohl bei Gesprächen als auch schriftlichen Befragungen gelten,

44
Q

Welche Form der Itemkonstruktion wird im Folgenden Beschrieben: Sie fokussiert sich auf das Vorwissen
über ein Konstrukt, dass in den Items abgebildet werden soll.

a) Theoretische Itemkonstruktion ✅️
b)…
c)…
d)…

A
45
Q

Gütekriterien psychologischer Tests nach Schermelleh-Engel et al.

a) Unverfälschbarkeit ❌️
b) Raschhomogenität ❌️
c) Item-Heterogenität ❌️
d) Reliabilität ✅️

A
46
Q

Schätzverfahren für Itemparameter

a) unbedingte ML-Schätzung ✅️
b) bedingte ML-Schätzung ✅️
c) marginale ML-Schätzung ✅️
d)…

A
47
Q

Welcher Ansatz gehört zu induktiven Testkonstruktion?

a) Biseraler Ansatz ❌️
b) Protypsicher Ansatz ✅️
c) Bayes-Ansatz ❌️
d) Lexikalischer Ansatz ✅️

A
48
Q

Werden Personen sukzessive diejenigen Items dargeboten, die maximal zur Schätzung ihrer Fähigkeiten
beitragen (Lösungswahrscheinlichkeit beträgt 0,05) so kommt…zum Einsatz:

a) Bonferroni-Korrektur ❌️
b) Eine Itembank an Rasch-homogenen Items ❔️
c) Das adaptive Testen ✅️
d) …

A
49
Q

Bedeutung von Kommunalität

A

Der durch die Faktoren gemeinsam erklärte Varianzanteil der beobachtbaren Variablen heißt Kommunalität.
Der Varianzanteil, der durch die latenten Variablen erklärt wird, heißt i also n der Faktorenanalyse Kommunalität. Geht man davon aus, dass die gesamte Residualvarianz die Fehlervarianz darstellt, so entspricht die Kommunalität der Reliabilität.

50
Q

Was sagt der Schwellenparameter aus?

a) Kennt die Schwierigkeit, die Schwelle von der unteren zur oberen Kategorie zu überschreiten ✅️
b) Gibt an, ob die Validität eines Tests oder Fragebogens hinreichend ist ❌️
c) Kennt den Punkt auf der lateralen Variablen, ab dem die höhere Kategorie bevorzugt wird ✅️
d) Kann so interpretiert werden, wie der Schwierigkeitsparameter im Rasch-Modell ❌️
e) Schnittpunkt zwischen zwei Kategorien ✅️

A
51
Q

Was sagt die Schwellenwahrscheinlichkeit aus?

A

Der Schwellenparameter kennzeichnet die Schwierigkeit, die Schwelle von der unteren zur oberen Kategorie
zu überschreiten. Je größer der Wert einer Person auf der latenten Variablen η ist, umso größer ist die
Wahrscheinlichkeit, die obere Kategorie im Vgl. zur darunter liegenden Kategorie zu wählen.

52
Q

Bezugssysteme für den Vergleich von Testwerten nach Mellenbergh (2011): Testwerte vergleichen …

A
  1. Testergebnisse anderer Personen einer Bezugsgruppe (Normpopulation),
  2. Testergebnisse derselben Person in anderen Tests,
  3. Testergebnis derselben Person in demselben Test zu einer anderen Messgelegenheit,
  4. Vergleich mit einem externen Standard (Kriterium).
53
Q

Was trifft auf essenziell t-äquivalente Variablen zu? (Annahmen)

a) korrelierte Fehlervarianzen ❌️
b) Unkorreliertheit Fehlervarianzen ✅️
c) Modelle sind dichotom ❌️
d) bedingte stochastische Unabhängigkeit liegt immer vor ❌️
e) Die Korrelation entspricht dem Mittelwert der Variablen ❌️
f) Alle Items erfassen eine latente Variable✅️

A
54
Q

Welche Modelle für metrische Variablen?

a) Modell essenziell -äquivalenter Variablen ✅️
b) Modell -äquivalenter Variablen (Spezialfall des Modells essenziell -äquivalenter Variablen) ✅️
c) Modell essenziell -paralleler Variablen (Spezialfall des Modells essenziell-äquivalenter Variablen) ✅️
d) Modell -paralleler Variablen (Spezialfall des Modells essenziell -äquivalenter Variablen) ✅️
e) Modell -kongenerischer Variablen (Spezialfall des Modells essenziell -äquivalenter Variablen) ✅️
f) Dispersionsmodell (Spezialfall des Partial-Credit-Modells) ❌️
g) Das Partial-Credit-Modell ❌️
h) Ratingskalenmodell (Spezialfall des Partial-Credit-Modells) ❌️
i) Äquidistanzmodell (Spezialfall des Partial-Credit-Modells) ❌️

A

Das Partial-Credit-Modell kann nur geordnete, kategoriale Daten modellieren. Metrische Variablen sind kontinuierlich und benötigen Modelle, die lineare Beziehungen und kontinuierliche Werte abbilden können.

  1. Metrische Variablen haben intervall- oder verhältnisskalierte Eigenschaften, das PCM modelliert ordinalskalierte Antwortkategorien, die keine gleichmäßigen Abstände haben.
  2. Das PCM arbeitet mit Schwellenwerten (Thresholds), metrische Variablen haben keine solchen klaren Schwellen, da sie auf einer kontinuierlichen Skala liegen.
55
Q

Spezialfälle von Tau – Modellen
a) Modell -äquivalenter Variablen ✅️
b) Modell essenziell -paralleler Variablen ✅️
c) Modell -paralleler Variablen ✅️
d) Modell -kongenerischer Variablen ✅️

A
56
Q

Spezialfälle vom Partial Credit Modell

a) Ratingskalenmodell ✅️
b) Äquidistanzmodell ✅️
c) Dispersionsmodell ✅️
d) …

A
57
Q

Was gehört zur Faktoranalyse?

a) Konfirmatorisch ✅️
b) Exploratorisch ✅️
c) Metrische Faktorenanalyse ❌️
d) Latente und manifeste Faktorenanalyse ❌️

A
58
Q

Exploratorische Faktoranalyse, was ist hier bekannt?

a) NICHTS (weder Anzahl latenter Variablen noch Faktorladungen) ✅️

A
59
Q

Was trifft auf konfirmatorische Faktorenanalyse zu?

a) Anzahl latenter Variablen heißt Faktoren ✅️
b) Faktoren und Ladungsstrukturen sind bekannt ✅️
c) …
d) …

A

Konfirmatorische Faktorenanalyse: Man geht von einem spezifischen Modell mit bekannten Faktoren und
Ladungsstrukturen aus und überprüft, ob dieses Modell zu den Daten passt. Das bedeutet, dass man
zunächst das Modell definiert. Dies nennt man die Modellspezifikation. Hierbei legt man fest, welche
beobachtbaren Variablen auf welchen Faktoren laden. In einem zweiten Schritt muss gezeigt werden, dass
sich die Parameter des Modells anhand der Verteilungskennwerte der beobachtbaren Variablen
(Erwartungswerte, Varianzen, Kovarianzen) eindeutig bestimmen lassen.

60
Q

Welche Aussagen zur linearen Transformation stimmen?
a) Der Testwert wird mit einer Zahl multipliziert, zu diesem Produkt wird eine Konstante addiert ✅️
b) Sie ändern die Form der Merkmalsausprägung ❌️
c) Führen bei normalverteilten Variablen häufig zu Fehlinterpretationen ❌️
d) Testwerte können dadurch über Personen, Messzeitpunkte oder Tests gemittelt werden ✅️

A
61
Q

Was gehört zur nicht-linearen Transformationen?

g) Prozentstrangwerte ✅️
h) Dezilrangwerte ✅️
i) Quartilrangwerte. ✅️
j) …

A

Nicht lineare Transformationen setzen an den berichteten Nachteilen von linearen Transformationen bei
nicht normalverteilten Variablen an. Kennt man die Verteilung der Werte nicht, so lassen sich z-Werte nur
schwer hinsichtlich des Standes einer Person in der Verteilung der Werte in der Normpopulation
interpretieren. Eine einfachere Interpretation erhält man durch Prozentrangwerte. Weitere nicht lineare
Transformationen: Dezilrangwerte und Quartilrangwerte.

62
Q

Welche Aussagen treffen nicht auf Prozentrangwerte zu?

a) gibt an, wie viel Prozent der Personen einer Vergleichsgruppe (z. B. Normpopulation oder -
Stichprobe) denselben oder einen geringeren Wert wie die untersuchte Person aufweisen ❌️
b) zeigen an wie viel Prozent genauso oder weniger in einer Normpopulation erreicht haben ❌️
c) sind Grenzen von Konfidenzintervallen ✅️
d) in englischsprachiger Literatur werden Begriffe percentile score, percentile rank, percentile als austauschbare Begriffe für den Prozentrangwert benutzt ❌️
e) erhält man, indem man die kumulierte Häufigkeit durch die Größe der Normstichprobe teilt und den Wert mit 50 multipliziert ✅️

A
63
Q

Schätzmethoden für Itemparameter jeweils eine zum Rasch-Modell und partial Credit Modell auswählen.

a) unbedingte Maximum-Likelihood-Schätzmethode ✅️
b) bedingte Maximum-Likelihood-Schätzmethode ✅️
c) marginale Maximum-Likelihood-Schätzmethode ✅️

A
  1. unbedingte Maximum-Likelihood-Schätzmethode,
  2. bedingte Maximum-Likelihood-Schätzmethode
  3. marginale Maximum-Likelihood-Schätzmethode.
64
Q

Partial-Credit-Modell zur Kategoriencharakteristik, ob Schwellenwert bedeutet, dass Kategorie
darüber gewählt wird?

a) Der Schwellenwert bedeutet, dass die Wahrscheinlichkeit eine von den beiden Kategorien
(darüber liegende) zu wählen, gleich ist. ❌️
b) Der Schwellenwert bedeutet, dass die Wahrscheinlichkeit eine von den beiden Kategorien
(untere) zu wählen, gleich ist. ❌️
c) Der Schwellenwert bedeutet, dass die Wahrscheinlichkeit eine von den beiden Kategorien (untere
oder darüber liegende) zu wählen, größer ist. ❌️
d) Der Schwellenwert bedeutet, dass die Wahrscheinlichkeit eine von den beiden Kategorien (untere
oder darüber liegende) zu wählen, kleiner ist. ❌️
e) Der Schwellenwert bedeutet, dass die Wahrscheinlichkeit eine von den beiden Kategorien (untere
oder darüber liegende) zu wählen, gleich ist. ✅️

A
65
Q

Sensitivität und Spezifität

A

Sensitivität ist die Wahrscheinlichkeit, dass eine tatsächlich zur Kriteriumsgruppe gehörende Person auch als solche diagnostiziert wird. Sie misst den Anteil der richtig-positiv Diagnostizierten an der Gesamtzahl der Personen in der Kriteriumsgruppe.

Spezifität ist die Wahrscheinlichkeit, dass eine Person, die nicht zur Kriteriumsgruppe gehört, auch als solche diagnostiziert wird. Sie misst den Anteil der richtig-negativ Diagnostizierten an der Gesamtzahl der Personen, die nicht zur Kriteriumsgruppe gehören.

66
Q

Die Eigenschaften der Kategorienscharakteristik

A

Die Kategoriencharakteristik beschreibt die Wahrscheinlichkeit, mit der eine Person in verschiedenen
Kategorien (z.B., Kategorie 1, Kategorie 2 usw.) einer latenten Variablen eingeordnet wird. Einige wichtige
Eigenschaften der Kategoriencharakteristiken:
1. Die Wahrscheinlichkeit der ersten Kategorie nimmt ab, wenn die latente Variable größer wird.
2. Die Wahrscheinlichkeit der höchsten Kategorie nimmt zu, wenn die latente Variable größer wird.
3. Die Wahrscheinlichkeiten der mittleren Kategorien nehmen zuerst zu und erreichen dann einen
maximalen Wert, bevor sie wieder abnehmen.
4. Die Schnittpunkte der Kategoriencharakteristiken entsprechenden Schwellenparametern, wo die
bedingte Wahrscheinlichkeit für zwei benachbarte Kategorien gleich ist.
5. Die Schnittpunkte der Kategoriencharakteristiken (Schwellenparameter) entsprechen den
Wendepunkten der Schwellenwahrscheinlichkeiten, an denen eine Person eine höhere Kategorie
präferiert als eine darunterliegende
→ Die Abhängigkeit der bedingten Antwortwahrscheinlichkeit von der latenten Variablen wird also durch die
Kategoriencharakteristik beschrieben.

67
Q

Was gehört zur linearen Transformation?

a) Z-Transformationen ✅️

A
68
Q

Rotierende Faktoranalyse

A

Verfahren innerhalb der explorativen Faktorenanalyse (EFA), das die Interpretation der Faktoren erleichtert, indem es die Achsen des Faktorraums dreht. Die rotierende Faktorenanalyse optimiert die Interpretation der Faktoren. Ziel ist eine vereinfachte und klarere Struktur der Variablen-Faktor-Beziehungen.

Orthogonale Rotation: Faktoren bleiben unabhängig

Oblique Rotation: Faktoren dürfen korrelieren

69
Q

Itemselektion

A

Itemselektionsprozess ist an folgenden Kriterien orientiert:

  1. Passung zum Modell (Anforderungen des psychometrischen Modells entsprechend)
  2. Schätzgenauigkeit (Auswahl von Items, die einen hohen Beitrag zur Schätzgenauigkeit leisten)
  3. Ökonomie (möglichst wenig Ressourcen verbrauchen)
  4. Zumutbarkeit (keine übermäßige Belastung der Testperson)
  5. Testfairness (keine systematische Benachteiligung von Testpersonen, sollte für alle Testgruppen das selbe Konstrukt messen)
  6. Unverfälschbarkeit (Eliminierung leicht verfälschbarer Items)
70
Q

Was sind die vier Phasen des diagnostischen Prozesses nach Fernandez-Ballesteros et al. und Westhoff et al.?

A
  1. Analyse des Anliegens (d.h. Formulierung und Konzeptualisierung des Anliegens)
  2. Aufbereitung und Berichten der Ergebnisse
  3. Planung der Intervention
  4. Evaluation und Follow-up-Untersuchung
71
Q

Brunswick-Symmetrie

A

Die Brunswik-Symmetrie (auch Brunswik-Symmetrieprinzip) ist ein Konzept aus der Wahrnehmungs- und Kognitionspsychologie. Es beschreibt die Idee, dass Verhaltensweisen und Wahrnehmungen in einem symmetrischen Verhältnis zur Umwelt stehen sollten, um eine realistische Abbildung der Realität zu ermöglichen.

Ansatz: Die Brunswik-Symmetrie fordert eine realistische Abbildung der Umwelt in der Forschung.

Begründung: Menschen nutzen Hinweisreize aus der Umwelt, um auf nicht direkt beobachtbare Merkmale zu schließen. Experimente sollten die Vielzahl der Umweltreize repräsentieren, um verzerrte Ergebnisse zu vermeiden. Es geht um die Balance zwischen Wahrnehmung und Umweltmerkmalen.

Das Prinzip der Brunswik-Symmetrie fordert, dass sowohl in der Forschung als auch im Alltag:

  1. Die Vielfalt der Umweltreize berücksichtigt werden muss.
  2. Die kognitive Verarbeitung der Reize und die Umweltmerkmale in einem symmetrischen Verhältnis stehen sollten.
72
Q

Items, die auf soziale Erwünschtheit schließen lassen.

A

Items in Fragebögen, die auf soziale Erwünschtheit schließen lassen, sind solche, bei denen sich Personen möglicherweise dazu verleitet fühlen, gesellschaftlich akzeptierte oder positive Antworten zu geben, anstatt ehrlich über ihr tatsächliches Verhalten oder ihre Einstellungen zu berichten. Solche Items fragen oft nach Verhaltensweisen oder Einstellungen, bei denen Menschen moralisch oder ethisch positiv wirken wollen.

  1. Ich Lüge nie.
  2. Ich sage immer die Wahrheit, auch wenn es mir Nachteile bringt.
73
Q

Falsch negative Personen.

A

Personen, die nicht ausgewählt werden, obwohl sie geeignet sind.

74
Q

Falsch positive Personen

A

Personen, die ausgewählt werden, obwohl sie nicht geeignet sind.

75
Q

Item-response Theorie

A

Eine Testtheorie, die von einzelnen Itemantworten ausgeht. Im Rahmen
einer generalisierten linearen Item-Response-Theorie werden psychome-
trische Modelle betrachtet, bei denen die beobachtbaren Variablen kon-
tinuierlich oder kategorial sein können. Ebenso können die latenten Vari-
ablen kontinuierlich oder kategorial sein.

76
Q

Der Varianzanteil, der durch die latente Variable erklärt wird, heißt in der Faktorenanalyse …

gemeinsame Varianz ODER Kommunalität ✅️

A
77
Q

Part-whole Korrektur

A

Durch diese Korrektur kann man den Effekt der Überschätzung der Trennschärfen vermeiden.

78
Q

Persönlichkeitsmerkmale nach Furr

A

Die Beschreibung und Quantifizierung von Profilähnlichkeiten beschäf-
tigt Psychologen seit mehr als 60 Jahren (z.B. Cattell, 1949; Cronbach
& Gleser, 1953; Nunnally, 1962; Furr, 2010). Der Vergleich von zwei In-
dividualprofilen hinsichtlich Ähnlichkeit vs. Unähnlichkeit setzt voraus,
dass vorab definiert wurde, hinsichtlich welcher Merkmale die Profile
von zwei Personen untersucht werden (Cronbach & Gleser, 1953). Typi-
scherweise wird man nicht annehmen, dass zwei Personen, die ähnliche
Merkmalsausprägungen in bestimmten Testwerten aufweisen, in allen
möglichen Merkmalen Ähnlichkeiten aufweisen. In der Differentiellen und
Persönlichkeitspsychologie sowie in der Sozialpsychologie spielt der
Vergleich von Individualprofilen eine wesentliche Rolle. Furr (2008) fasst
verschiedene Fragestellungen zusammen, auf die sich die Beurteilung
von Profilähnlichkeiten beziehen kann:
• Ähnlichkeit von Persönlichkeitsprofilen von Ehepartnern,
• Ähnlichkeit von Persönlichkeitsprofilen von Selbst- und Fremdratings,
• zeitliche Stabilität von Persönlichkeitsmerkmalen,
• Bezüge zu pathologischen Persönlichkeitsmerkmalen,
• Person-Umwelt-Passung.
Die Ähnlichkeit von zwei Individualprofilen kann rein deskriptiv anhand der
Ähnlichkeit auftretender Hügel („peaks“) oder Täler („valleys“) beschrie-
ben werden (Furr, 2008). Die Übereinstimmung von Profilen kann aber
auch quantitativ bestimmt werden. Zur Bestimmung der Ähnlichkeit von
Profilen wurden verschiedene Koeffizienten vorgeschlagen (z.B. Cattell,
1949; Cronbach & Gleser, 1953; McCrae, 1993). Bei den Profilvergleichen
können folgende Vergleiche von Interesse sein:
• Vergleich eines Individualprofils mit einem Normprofil,
• Vergleich von zwei Individualprofilen,
• Vergleich von zwei Normprofilen.

79
Q

PCM (Partial Credit Modell)

A

Eindimensionales Testmodell für kategoriale Antwortvariablen mit geord-
neten Antwortkategorien. Stellt eine Erweiterung des Rasch-Modells dar,
in dem die Annahmen des Rasch-Modells auf die Schwellenwahrschein-
lichkeiten übertragen werden.

Das Partial-Credit-Modell stellt eine Erweiterung des Rasch-Modells für
kategoriale Variablen mit geordneten Antwortkategorien dar. Es geht wie
das Rasch-Modell davon aus, dass den beobachtbaren Itemantworten
eine gemeinsame kontinuierliche latente Variable (das zu erfassende Kon-
strukt) zugrunde liegt. Um das Modell herzuleiten, werden die Kategorien
zunächst aufsteigend durchnummeriert. Der ersten Kategorie wird der
Wert 0, der zweiten der Wert 1, der dritten der Wert 2 und der j-ten Kate-
gorie der Wert j – 1 zugeordnet. Bezeichnet ki die Anzahl der Kategorien
eines Items i, so wird der letzten Kategorie eines Items der Wert ki – 1
zugeordnet. Um die Notation zu vereinfachen, gehen wir im Folgenden
davon aus, dass alle Items dieselbe Anzahl von Kategorien aufweisen,
d. h. ki = k. Dies ist der typische Anwendungsfall des Modells. Das Partial-
Credit-Modell erlaubt, dass sich die Items in der Anzahl der Kategorien
unterscheiden dürfen. Die Gleichungen für diesen allgemeineren Fall erhält
man, indem in den Modellgleichungen k durch ki ersetzt wird.
Um die Idee des dichotomen Rasch-Modells auf den mehrkategoriellen
Fall zu übertragen, werden zunächst immer nur zwei Kategorien betrachtet.
Beim Partial-Credit-Modell greift man auf die Antwortwahrscheinlichkei-
ten zweier benachbarter Kategorien zurück (Rost, 2004).

  • Erste Modellannahme: Item- und Kategorien-
    homogenität

-Zweite Modellannahme: Bedingte (lokale) stochasti-
sche Unabhängigkeit

80
Q

Start-P

A

START-P ist ein teilweise an Metaanalysen, teilweise an der Facettentheorie
ausgerichteter Fragebogen zur berufsbezogenen Persönlichkeitsdiagnostik
(Beauducel & Kersting, 2010). Das Verfahren hat ein Verhaltens-Input-Modul,
in dem sich die Fragen darauf beziehen, wie Umweltreize auf die Personen
wirken. Konkret wird im Verhaltens-Input-Modul die Sensitivität für Belohnun-
gen und Bestrafungen nach der Verstärkungs-Sensitivitäts-Theorie (Gray,
1994; Gray & McNaughton, 2000) erfasst. Der Facettenansatz kommt dadurch
zum Tragen, dass auch die Sensitivität für die Quellen der Belohnung oder
Bestrafung (Vorgesetzten oder Lehrer, oder das eigene Team) als Dimensi-
onen erfasst werden (vgl. auch Beauducel, Kersting & Liepmann, 2005). Das
Verhaltens-Output-Modul erfasst eher Verhaltenstendenzen, die von der Per-
son an die Umwelt herangetragen werden und basiert auf Metaanalysen zum
Zusammenhang zwischen Persönlichkeitseigenschaften und Berufserfolg z.B. Barrick, Mount & Judge, 2001). Auf dieser Grundlage werden hier
emotionale Stabilität, Kontaktorientierung, Empathie, Durchsetzungsvermö-
gen, Sorgfalt und Leistungsstreben erfasst. Die Dimensionen des Verhaltens-
Input- und des Verhaltens-Output-Moduls werden in drei Globaldimensionen
(Belastbarkeit, Soziale Orientierung, Gewissenhaftigkeit) zusammengeführt.

81
Q

Test bias - Testfairness

A

Test-Bias bedeutet, dass Personen – wegen ihrer Gruppenzugehörigkeit –
aufgrund des Prädiktors (Tests) keine ihrer Eignung entsprechende Chance
haben, ausgewählt zu werden. Diese Definition schließt auch eine gemessen
an der Eignung überhöhte Chance der Auswahl ein.
Eine Vermeidung von Test-Bias bedeutet, dass jede geeignetere Person –
unabhängig von jedweder Gruppenzugehörigkeit – aufgrund des Prädiktors
(Tests) eine entsprechend ihrer Eignung erhöhte Chance hat, ausgewählt zu
werden.

82
Q

Messinvarinanz

A

Messinvarianz liegt vor, wenn sich die interindividuellen Unterschiede in einem
meist kontinuierlichen Merkmal (= intendiertes Konstrukt) unabhängig von
einer etwaigen Gruppenzugehörigkeit in den gemessenen Variablen (z.B.
Items) niederschlagen.

Formal kann man diesen Sachverhalt auch so formulieren, dass die be-
dingte Wahrscheinlichkeit für eine Ausprägung auf einem Item, wenn eine
bestimmte Merkmalsausprägung gegeben ist, genauso groß sein soll wie
die bedingte Wahrscheinlichkeit für eine Ausprägung auf einem Item, wenn
sowohl eine bestimmte Merkmalsausprägung als auch eine bestimm-
te Gruppenzugehörigkeit gegeben ist (Millsap, 2007). Die gemessenen
Variablen sollen somit nicht die Gruppenzugehörigkeit, sondern allein
die Merkmalsausprägung abbilden. Wenn in den betrachteten Gruppen
Mittelwertsunterschiede der Merkmalsausprägung bestehen, sollen die
gemessenen Variablen eben auch genau diese Mittelwertsunterschiede
der Merkmalsausprägung zwischen den Gruppen abbilden, aber nicht in
anderer Weise von der Gruppenzugehörigkeit beeinflusst werden. Diese
Konzeption der Messinvarianz schließt nicht aus, dass es Eigenschaften
diagnostischer Verfahren gibt, für die sich Gruppenunterschiede finden
lassen. So könnte beispielsweise die Variabilität eines Merkmals in zwei
Gruppen unterschiedlich sein, ohne dass deswegen Messinvarianz im
oben genannten Sinne gegeben sein muss. Allerdings impliziert die Gup-
penunabhängigkeit der Beziehung zwischen dem zu messenden Merkmal
und den Variablen (z.B. Items), dass in den Gruppen gleiche Reliabilitäten
und konvergente Validitäten der Items gegeben sind.

83
Q

Personenparameter

A

Mit jeder zusätzlichen Person muss nämlich ein zusätzlicher
Personenwert (Personenparameter) geschätzt werden. Dies führt dazu,
dass die Itemparameter „unter der Ungenauigkeit der Personenpara-
meterschätzungen leiden“ (Rost, 2004, S. 310). Um dieses Problem zu
lösen, greift man auf Schätzmethoden für die Itemparameter zurück,
die unabhängig von der Schätzung der Personenwerte sind. Am häu-
figsten werden hierzu die bedingte ML-Schätzung und die marginale
ML-Schätzung eingesetzt.

84
Q

Stichprobenarten

A

Folgende Stichprobenarten können bei der Normierung
unterschieden werden:

  1. Gebietsstichprobe
  2. Quotenstichprobe
  3. Sekundäre Quotenstichprobe
85
Q

Reliabilitätsgeneralisierung

a) Form der Metaanalyse ✅️
b) Literaturrecherche nötig✅️
c) statistische/klinische Urteilsbildung ❔️ (kommt auf Satzbau an)

A

Die Reliabilitätsgeneralisierung ist eine Form der Metaanalyse, bei der Po-
pulationsreliabilitäten auf der Basis statistischer Analysen ermittelt werden.
Um Populationsreliabilitäten berechnen zu können, werden mittels Literatur-
recherche
in Datenbanken (z.B. PsycInfo, Medline) möglichst viele Primär-
studien zu einem diagnostischen Inventar identifiziert. Anschließend werden
die Reliabilitätskennwerte und die Stichprobengröße, in der die Kennwerte
ermittelt wurden, systematisch dokumentiert und für die metaanalytische
Auswertung vorbereitet.

Die Reliabilitätsgeneralisierung ist ein wichtiges Instrument, um die Verlässlichkeit von Tests und Verfahren in der klinischen Diagnostik zu bewerten. Sie hilft dabei, die klinische Urteilsbildung objektiver zu machen, indem sie die Nutzung hoch reliabler Tests in der statistischen Urteilsbildung unterstützt. Dies erhöht die Genauigkeit von Diagnosen und Prognosen.

86
Q

Konjunktives Modell

A

Nach dem konjunktiven Modell werden Mindestleistungen für ein oder meh-
rere Merkmal(e) festgelegt (z.B. ein Versicherungsvertreter sollte durchschnitt-
lich extravertiert sein, durchschnittlich freundlich sein, durchschnittliche Re-
chenfähigkeiten aufweisen). Darüber hinaus kann in der Anforderungsanalyse
festgelegt werden, ob alle relevanten Merkmale des konjunktiven Modells
entsprechend der Mindestanforderung vorliegen müssen (UND-Verknüpfung:
Ein Versicherungsvertreter sollte durchschnittlich extravertiert und durch-
schnittlich freundlich sein und durchschnittliche Rechenfähigkeiten aufweisen)
bzw. ob nicht alle, sondern nur ein oder mehrere Merkmalsausprägungen den
Mindestanforderungen entsprechen müssen (ODER-Verknüpfung: Ein Versi-
cherungsvertreter sollte durchschnittlich extravertiert oder durchschnittlich
freundlich sein oder durchschnittliche Rechenfähigkeiten aufweisen).

87
Q

AERA/APA Standarts

A

Die AERA, APA und NCME Standards beziehen sich auf die “Standards for Educational and Psychological Testing”, ein zentrales Regelwerk zur Erstellung, Durchführung und Bewertung von Tests im Bereich der psychologischen, pädagogischen und beruflichen Diagnostik. Sie wurden gemeinsam von drei bedeutenden Organisationen entwickelt:

AERA: American Educational Research Association

APA: American Psychological Association

Ziel der Standards: Die Standards legen fest, wie Tests und Messverfahren entwickelt, validiert und angewendet werden sollen, um wissenschaftlich fundierte, faire und ethische Diagnosen zu gewährleisten.

🧩 Zentrale Inhalte der AERA, APA, NCME Standards

  1. Validität

Ein Test muss das messen, was er zu messen vorgibt.

Es müssen verschiedene Validitätsarten (z. B. Inhalts-, Konstrukt- und Kriteriumsvalidität) nachgewiesen werden.

  1. Reliabilität

Die Zuverlässigkeit eines Tests muss gesichert sein.

Es wird geprüft, ob der Test bei wiederholten Anwendungen konsistente Ergebnisse liefert.

  1. Fairness

Tests müssen frei von Verzerrungen sein, die bestimmte Gruppen diskriminieren könnten.

Es müssen Maßnahmen getroffen werden, um Chancengleichheit sicherzustellen.

  1. Verantwortung der Testentwickler

Testentwickler müssen sicherstellen, dass die Tests wissenschaftlich fundiert sind.

Es müssen klare Anleitungen zur Anwendung, Interpretation und Bewertung der Testergebnisse bereitgestellt werden.

  1. Datenschutz und ethische Standards

Es muss der Datenschutz der Testpersonen gewährleistet sein.

Der Umgang mit Testergebnissen muss den ethischen Grundsätzen entsprechen.

88
Q

Psychometrische Daten

A

Psychometrische Daten:
Daten, die anhand von Persönlichkeitsinventaren oder Leistungstests erhoben werden können, für die eindeutige Instruktionen zur Durchführung, Auswertung und Interpretation bestehen. Im Sinne von Cattell (1957) können psychometrische Daten als Q(uestionnaire)-Daten bei Persönlichkeitsinventaren oder als T(est)-Daten bezeichnet werden, wenn es beispielsweise um die Erfassung der intellektuellen Leistungsfähigkeit geht.

Nicht psychometrische Daten:
Eindrücke (auch: Interpretationen) des Diagnostikers, die anhand von Äußerungen des Probanden in Gesprächen oder Interviews gewonnen werden. Nicht psychometrische Daten können aber auch Einschätzungen sein, die der Diagnostiker anhand von Ratingskalen vornimmt. Im Sinne von Cattell (1957) könnte man diese Daten als subjektive Life-Daten beschreiben.

89
Q

Personenbezogene Verhaltensvariablen

A

Das Verhalten von Personen setzt sich demnach als Funktion aus Umgebungsvariablen (U), Organismusvariablen (O), kognitiven Variablen (K), emotionalen Variablen (E), motivationalen Variablen, sozialen Variablen (S) und den Interaktionen zwischen den genannten Variablen zusammen:

• Umgebungsvariablen: finanzielle Situation, Wohnsituation, Verkehrsbedingungen
• Organismusvariablen: allgemeine körperliche Belastbarkeit, Alter, Beeinträchtigungen
• kognitive Variablen: allgemeine Intelligenz/Intelligenzstruktur, Konzentration, Arbeitsstil
• emotionale Variablen: emotionale Belastbarkeit, Umgang mit Belastungen
• motivationale Variablen: Motive, Überzeugungen, Ziele, Interessen
• soziale Variablen: Einstellungen, Stereotype, Pflichten

90
Q

Stellungnahme

A

Bei der gutachterlichen Stellungnahme handelt es sich um die Be-
antwortung eines vergleichsweise wenig komplexen Sachverhalts oder
einer ergänzenden Frage. Ein ausführliches Gutachten liegt in diesem
Fall meistens bereits vor. Eine gutachterliche Stellungnahme kann sich
beispielsweise in Ergänzung zu einem neurologischen Gutachten auf die
Untersuchung der Konzentrationsfähigkeit eines Probanden beziehen.

91
Q

Normen nach Kohl.

A

Die Normen nach Kohl beschreiben Verfälschungstendenzen in Fragebögen und Tests durch sozial erwünschtes Antwortverhalten. Sie beziehen sich auf verschiedene strategische Verhaltensweisen, die Personen bei der Beantwortung von Items in diagnostischen Verfahren anwenden können, um sich gezielt besser oder schlechter darzustellen.

🧩 Kohls Normen der Antwortverfälschung

Kohl (1993) beschreibt drei wichtige Normen, die Personen in Testsituationen beeinflussen können:

  1. Maximalnorm

Die Maximalnorm beschreibt die Tendenz, sich im Test von der bestmöglichen Seite darzustellen.

Personen versuchen, den idealen Eindruck zu hinterlassen, indem sie Eigenschaften betonen, die gesellschaftlich hoch angesehen sind.

Beispiel:

„Ich bin immer hilfsbereit.“

„Ich behalte in jeder Situation die Ruhe.“

  1. Idealnorm

Die Idealnorm beschreibt das Streben nach Perfektion in der Selbstdarstellung.

Die Befragten orientieren sich an sozialen Idealen und versuchen, sich als fehlerfrei und moralisch einwandfrei darzustellen.

Beispiel:

„Ich habe noch nie gelogen.“

„Ich halte mich immer an die Regeln.“

  1. Minimumnorm

Die Minimumnorm beschreibt die Tendenz, negative Aspekte zu verharmlosen oder herunterzuspielen.

Personen versuchen, unangenehme Fragen durch Bagatellisierung zu beantworten, um weniger schlecht dazustehen.

Beispiel:

„Ich habe nur selten Wutausbrüche.“

„Ich habe vielleicht einmal jemanden unfair behandelt.“