AK mit Lösung Flashcards

1
Q

Welche der folgenden Aussagen ist falsch? (1 Punkt) X2 19/20 1.Termin
. Die Feldbeobachtung zeichnet sich dadurch aus, dass Verhalten in realen, vom Untersucher in der Regel nicht speziell hergestellten Situationen beobachtet wird.
a. In Feldbeobachtungen können neben Ratingverfahren auch Zeichensysteme und Kategoriensysteme zur Kodierung von Verhalten verwendet werden.
b. Die Generalisierbarkeit von in Laborbeobachtungen gewonnen Erkenntnissen auf Situationen in der realen Welt (das heißt deren externe Validität) ist in der Regel höher als bei Feldbeobachtungen.
c. Die Laborbeobachtung erlaubt eine bessere Kontrolle (beziehungsweise Konstanthaltung) der Umwelt-Bedingungen als die Feldbeobachtung.

A

b. Die Generalisierbarkeit von in Laborbeobachtungen gewonnen Erkenntnissen auf Situationen in der realen Welt (das heißt deren externe Validität) ist in der Regel höher als bei Feldbeobachtungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

ie haben einen Test entwickelt zur Messung des Merkmals X. Nach einer ersten Optimierung haben Sie in einer Stichprobe eine Reliabilität von .55 festgestellt. Nun soll die Reliabilität des Tests anhand einer weiteren Stichprobe erneut bestimmt werden. In dieser zweiten Stichprobe stellen Sie eine deutlich höhere Reliabilität fest. Was ist keine mögliche Erklärung dafür? (1 Punkt) X3 19/20 1.Termin; 19/20 2.Termin VL 06
. Für die erste Stichprobe war der Test zu schwer.
a. Die erste Stichprobe war zu homogen bezüglich des Merkmals X.
b. Die erste Stichprobe war zu heterogen bezüglich des Merkmals X.
c. Für die erste Stichprobe war der Test zu leicht.

A

b. Die erste Stichprobe war zu heterogen bezüglich des Merkmals X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Aussage über die Item-Trennschärfe ist falsch? (1 Punkt)
. Entfernung eines wenig trennscharfen Items kann die Reliabilität der Skala verbessern.
a. Die Trennschärfe wird als Korrelationskoeffizient angegeben.
b. Die Trennschärfe fällt bei mittlerer Itemschwierigkeit in der Regel am höchsten aus.
c. Eine niedrige Trennschärfe lässt auf Redundanz des Items schließen.

A

c. Eine niedrige Trennschärfe lässt auf Redundanz des Items schließen. (Tutor hat das wohl bei jemandem ins Logbuch geschrieben)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welches ist kein Axiom der Klassischen Testtheorie (mit X = beobachteter Wert, T = wahrer Wert, e = Fehlerwert)? (1 Punkt) X4 16/17 1.Termin; 19/20 1.Termin; 15/16 1.Termin VL 06; Folie 15
. r(X1, X2) = 0
a. r(e1, e2) = 0
b. r(T2, e1) = 0
c. r(T, e) = 0

A

. r(X1, X2) = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche der folgenden Aussagen zur Reliabilität ist falsch? (1 Punkt) VL 06; Folie 27; Buch S. 129
. Die Reliabilität eines Tests bezeichnet den Grad der Genauigkeit, mit dem der Test (irgend-)eine Eigenschaft erfasst.
a. Die Bestimmung der Reliabilität mittels Cronbachs Alpha stellt eine Verallgemeinerung der Test-Halbierungsmethode dar.
b. Die Reliabilität eines Tests steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte).
c. Die Reliabilität eines Tests sinkt mit sinkender Varianz der wahren Werte (bei konstanter Varianz der Fehler).

A

b. Die Reliabilität eines Tests steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist kein Nachteil von gebundenen Antwortformaten? (1 Punkt) VL 03; Folie ab 29
. schlecht geeignet zur Erfassung von Spontanitäeativitätt und Kr
a. Einschränkung durch Antwortkategorienvorgabe
b. subjektive, aufwändige Auswertung und Interpretation
c. niedrigere Akzeptanz von Probanden

A

b. subjektive, aufwändige Auswertung und Interpretation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ein Item weist eine Schiefe von 1.03 auf. Welche Grafik entspricht den Items?

A

– Schiefe > 0: linkssteile Verteilung (rechtsschief)
– Schiefe < 0: rechtssteile Verteilung (linksschief)
– Schiefe = 0: symmetrische Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was trifft auf ICD 10 zu? X2 19/20 1.Termin VL 01; Folie ab 37
a) erste Kategorien gemeinsam aufgrund genetischer Zusammenhänge
b) Abschaffung eines multiaxialen Systems
c) Keine Option ist korrekt
d) Maßgeblich für die Abrechnung bei der Krankenkasse

A

d) Maßgeblich für die Abrechnung bei der Krankenkasse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Kritische Differenzen geben an…. VL 06; Folie ab 45
a) … wie stark sich die Reliabilitäten von zwei Tests unterscheiden dürfen, um vergleichbar zu sein
b) …wie groß der Unterschied sein muss, um bedeutend zu sein.
c) Keine der Optionen
d) wie groß der Unterschied von Validitäten sein muss.

A

b) …wie groß der Unterschied sein muss, um bedeutend zu sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welche Aussage zu projektiven und psychometrischen Tests stimmt nicht? X3 19/20 1.Termin; 16/17 1.Termin
a) bei projektiven Tests ist Training nötig
b) Psychometrische Tests sind objektiver
c) Projektive Verfahren haben offene Reizmuster
d) Auswertung psychometrischer Tests ist zeitaufwändiger
a. Projektive Tests verwenden mehrdeutige Stimuli-Sets
b. Man braucht bei projektiven Tests trainierte Personen für Durchführung und Auswertung
c. Psychometrische Tests haben bessere Gütekriterien
d. Bei psychometrischen Tests braucht man länger für die Auswertung

A

d) Auswertung psychometrischer Tests ist zeitaufwändiger
d. Bei psychometrischen Tests braucht man länger für die Auswertung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche Aussage stimmt nicht? Je homogener die Skala… VL 07; Folie ab 12
a) desto höher ist die mittlere Inter Item Korrelation
b) desto weniger Einfluss hat die Testlänge
c) desto mehr Einfluss hat die Testlänge
d) desto höher ist Alpha

A

c) desto mehr Einfluss hat die Testlänge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Älteste diagnostische Anwendung VL 01
a. Beamtenauswahl im alten China

A

a. Beamtenauswahl im alten China

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Eigenschaftsdiagnostik - was gehört nicht dazu?
a. Arbeitsproben

A

a. Arbeitsproben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Item mit Lösungswahrscheinlichkeit von p = .10 – Was trifft nicht auf dieses Item zu? X2 16/17 1.Termin
a. Es handelt sich um ein schwieriges Item
b. Item hat eine geringe Trennschärfe
c. Item hat einen Bodeneffekt
d. Es gibt eine hohe Itemvarianz

A

d. Es gibt eine hohe Itemvarianz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Es gibt zwei Rater, die bewerten, ob Personen zu einem Vorstellungsgespräch eingeladen werden sollen (ja/nein) – Welche Reliabilitäts-Bestimmungsmethode würde man verwenden?
a. Cohens Kappa (tendieren hierzu; bis zu 2 Ratern)
b. Fleiss Kappa (auch für mehr als 2, wenn du kategorische ratings hast)
c. ICC
d. Cronbachs Alpha (eventuell auch das, aber eher a)

A

a. Cohens Kappa (tendieren hierzu; bis zu 2 Ratern)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Der MMPI (Minnesota Multiphasic Personality Inventory) gehört welchem Konstruktionsprinzip an? VL 03; Folie 21
a. Rationale Konstruktion
b. Induktive Vorgehensweise
c. Prototypenansatz
d. Keine der oben genannten (in externale Testkonstruktion)

A

d. Keine der oben genannten (in externale Testkonstruktion)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Mit dem Multitrait-Multimethod Ansatz kann man folgende Validität nicht berechnen? VL 07; Folie 24-28 X2 16/17 1.Termin
a. Konvergente Validität
b. Inhaltsvalidität
c. divergente Validität
d. Konstruktvalidität

A

b. Inhaltsvalidität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q
  1. Was trifft nicht auf das DSM-5 zu? VL 01
  2. vom Testkuratorium eingeführt
  3. 20 Kategorien
  4. multiaxiales System abgeschafft
A
  1. vom Testkuratorium eingeführt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q
  1. Was ist Phrenologie?
    a. von Form des Schädels aus Merkmalen schließen, Annahme, dass bestimmte Merkmale an einem bestimmten Ort im Schädel platziert sind
A

a. von Form des Schädels aus Merkmalen schließen, Annahme, dass bestimmte Merkmale an einem bestimmten Ort im Schädel platziert sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q
  1. Welchen Vorteil bieten offene Fragen?
  2. Detailfragen klären
  3. gehemmte Personen zum Reden bringen
  4. Klarheit bei viel-redenden Menschen
A
  1. Detailfragen klären
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q
  1. Frage zum Zusammenhang von Itemvarianz + Schwierigkeit
    ab wann löst jemand das Item → wie hoch muss seine Fähigkeit sein, deshalb Zusammenhang! Streuung eines Items → daraus die Schwierigkeit berechnen
A

→ in quadratischem Zusammenhang (keine Ahnung was mit der Frage gemeint ist)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q
  1. Welche Disziplin trug nicht zur Entwicklung der psychologischen Diagnostik bei? VL 01; Folie 22
    . Differenzielle Psychologie
    a. Experimentelle Psychologie
    b. Psychoanalyse
    c. Psychiatrie
A

b. Psychoanalyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q
  1. Welche Aussage ist richtig bezüglich Fragen bei Interviews?
    . Offene Fragen sind gut bei ausschweifenden Redner*innen
    a. Geschlossenes Format ist gut, um Beispiele oder Zusammenhänge zu erfragen
    b. Offene Fragen sind gut, um gehemmte Personen zum Reden zu bringen
    c. Geschlossene Fragen sind gut, um Detailaspekte zu klären (offene eigentlich)
A

c. Geschlossene Fragen sind gut, um Detailaspekte zu klären (offene eigentlich)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q
  1. Wenn sich die Fehlervarianz erhöht… VL 06; Folie 47
    . …erhöht sich die wahre Varianz
    a. …steigt die Reliabilität
    b. …sinkt die Reliabilität
    c. …steigt die beobachtete Varianz
A

b. …sinkt die Reliabilität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q
  1. Was ist kein Verfahren, mit dem man Reliabilität messen kann?
    . Korrelation zwischen Tests, die unterschiedliche Konstrukte messen sollen
    a. Beschreibung Split-Half-Reliabilität
    b. Beschreibung Retest-Reliabilität
    c. Beschreibung Paralleltest-Reliabilität
A

. Korrelation zwischen Tests, die unterschiedliche Konstrukte messen sollen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q
  1. Beim dichotomen Rasch-Modell: Wie ist die Lösungswahrscheinlichkeit wenn PP > IP? VL 08; Folie 45
    . = 0.5
    a. > 0.5
    b. < 0.5
    c. = 0
A

a. > 0.5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q
  1. Bei welchen Aufgaben ist die Ratewahrscheinlichkeit am geringsten?
    . Dichotomes Aufgabenformat
    a. Ergänzungsaufgabe
    b. Mehrfachwahl-Aufgabe
    c. Zuordnungsaufgabe
A

a. Ergänzungsaufgabe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q
  1. Rasch-skalierte Items: Wie ist der Zusammenhang zwischen den Items, wenn die Fähigkeitsausprägung auf einer Stufe konstant gehalten wird?
    . r = 0
    a. r = 1
    b. r = 0.5
    c. r = -1
A

. r = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q
  1. Die Arbeitsprobe ist eine Methode der… X2 15/16 1.Termin
    . …Eigenschaftsdiagnostik
    a. …Verhaltensdiagnostik
    b. …Situationsdiagnostik
A

a. …Verhaltensdiagnostik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Erklären Sie den sogenannten induktiven Ansatz der Testkonstruktion. Beschreiben Sie dazu die einzelnen Schritte, die der Diagnostiker geht, in kurzen Stichpunkten. Nennen Sie zusätzlich noch einen Anwendungskontext, in dem ein solches Vorgehen empfohlen werden kann. (2 Punkte)

A

Bei dem induktiven Ansatz werden die Items zu homogenen Gruppen kategorisiert, d.h. man hat am Ende z.B. 2 Itemgruppen X und Y. Alle Items in Gruppe X korrelieren stark miteinander und alle Items in Gruppe Y korrelieren stark miteinander. Die Items in Gruppe X und die Items in Gruppe Y korrelieren jedoch gering miteinander.
Wichtig hierbei ist, dass der Diagnostiker eine große repräsentative Stichprobe und ein großes Itempool braucht. Außerdem geht er blind analytisch vor. Er sucht erstmal Items. Danach gruppiert er die Items nach Kategorie. Anschließend beantworten die Versuchspersonen die in Kategorien geordneten Items. Zu guter Letzt bewertet er die Ergebnisse und alle Items in einer Kategorie müssten stark korrelieren. Und alle Items zwischen den Kategorien müssten wenig korrelieren.
Der induktive Ansatz könnte bei Items von Persönlichkeitsmerkmalen hilfreich sein. Somit könnte man die Items jeweils in Persönlichkeitsmerkmale kategorisieren wie z.B. die Big-Five-Inventare. Items die auf einen Faktor hochladen sollten auf andere Faktoren niedrig laden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

siehe Galerie X2 19/20 1.Termin

A

a) intervallskaliert
- Pi= Summer der erreichten Punkte / maximal mögliche Punktsumme
-> Antwortstufe 1 wird zu 0, da k-1 (2->1; 3->2; 4->3; 5->4; k Antwortstufen: kodiert 0 bis k-1)
-> Pi (Item1)= 03 + 13 + 21 + 312 + 42/ n(k-1)
-> Pi (Item1)= 03 + 13 + 21 + 312 + 42/ 25(5-1)
->Pi (Item1)= 0,49
-> Pi (Item2)= 0,51
b)
- Schwierigkeitsindex geht von 0 bis 1
-> hoher Schwierigkeitsindex = leichtes Item
-> niedriger Schwierigkeitsindex = schweres Item
-> Item 1 ist schwieriger
c)
Item 1 ist problematisch, da es zweigipflig ist -> 7 und 12
🡪 Die Frage könnte zweideutig gestellt sein oder doppelte Verneinung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

. Sie haben eine Skala zur Erfassung von Anschlussmotivation entworfen und diese in mehreren Überarbeitungen optimiert. Ihre finale Skala umfasst 10 Items und erreicht in einer Stichprobe von 100 Personen ein Cronbachs Alpha von .92.
Nun plant Ihr Kollege Boris Bündig eine großangelegte Längsschnittstudie. Weil er von Ihrer Skala begeistert ist, möchte er sie gerne in seine Studie mitaufnehmen. Er stellt jedoch eine Bedingung: Da aus Platzgründen nur noch wenige Items aufgenommen werden können, sollen Sie Ihre Skala bitte auf 5 Items zusammenkürzen. Eine Reliabilität von unter .70 halten Sie jedoch nicht für akzeptabel.
Kommen Sie der Bitte von Boris Bündig nach? Berechnen Sie das Cronbachs Alpha, das für eine auf 5 Items gekürzte Skala zur Anschlussmotivation zu erwarten wäre (zeigen Sie dabei den Rechenweg!) und begründen Sie auf dieser Basis Ihre Antwort. (4 Punkte)

A

Rel (k mal x) = 0,5 mal 0,92 / 1 + (0,5 - 1) mal 0,92
= 0,46 / 0,54
= 0,852

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Nennen und beschreiben Sie kurz (jeweils 1 bis 2 Sätze) zwei konkrete Anwendungen, bei denen man sich im Rahmen der Item Response-Theorie (IRT) die Item-Informations-Funktion zunutze macht. (2 Punkte) VL 08

A

Durch das Betrachten der Itemschwierigkeit in Bezug mit der Personenfähigkeit, kann man herausfinden, ob ein Item zu schwer oder zu einfach ist. Und je nachdem kann das Item im Test bleiben oder rausgenommen werden. Außerdem kann man mit der Item-Informations-Funktion Rückschlüsse auf die latenten Variablen (z.B. Fähigkeit) ziehen und somit eine Testauswertung durchführen, was der wichtige Punkt bei der Item-Response-Theorie IRT ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

siehe Galerie Parallel Analysis Scree Plots

A

a)
Bei der Parallelanalyse guckt man sich die rote Linie an und alle Faktoren über der roten Linie werden extrahiert. In diesem Fall wären es 3 Faktoren. Falls die Grafik ungenau ist, kann man auch eine Parallelanalyse in R durchführen.
b)
Bei dem Kaiserkriterium guckt man sich den Eigenwert an und alle Faktoren, die einen Eigenwert von größer als 1 haben werden extrahiert. In diesem Beispiel würde man nur Faktor 1 extrahieren.
c)
Alle Variablen bzw. Faktoren, die einen Eigenwert größer als 1 haben, erklären mehr Varianz als eine manifeste Variable beiträgt. In diesem Beispiel würde nur Faktor 1 mehr Varianz erklären als die gemessene manifeste Variable. D.h. es kann als Instrument dienen, die “Obergrenze”, d. h. die maximal zu rechtfertigende Faktorenanzahl zu bestimmen.
d)
Bei dem Scree-Test guckt man sich den Knick an und alle Faktoren über dem Knick werdenextrahiert. In diesem Beispiel würde man die ersten zwei Faktoren extrahieren. Da der Knick bei Faktor 3 ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was versteht man unter Tendenz zur Mitte? Und wie kann mit diesem Problem umgegangen werden? (3 Punkte)

A

Tendenz zur Mitte: Beschränkung auf die mittlere Kategorie
* Lösungsmöglichkeiten
● – keine neutrale Antwortkategorie
● – keine extrem formulierten Bezeichnungen der Antwortpole
● – „Weiß nicht“-Kategorie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Worin unterscheiden sich Speed- und Powertests? Gehen Sie auf mindestens zwei Aspekte ein und stellen Sie gegenüber, wodurch sich Speed- und Powertests in jedem der Aspekte jeweils auszeichnen. (2 Punkte) X2 19/20 2.Termin

A

-Speedtests
-Erfasst man, wie viele Aufgaben die Person in einer vorgegebenen Zeit lösen kann, kommt auf Schnellsein an

-Powertests
-Keine strikte Zeitbegrenzung gegeben, Zeit reicht meistens aus, wenn man dazu prinzipiell in der Lage ist
-Geprüft wird, bis zu welcher Schwierigkeit Personen Aufgaben zu lösen vermögen, kommt also auf das individuelle Leistungsniveau an

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

siehe Galerie X4 19/20 1.Termin; 19/20 2.Termin; 16/17 1.Termin; 15/16 1.Termin

A

a) Der Itemparameter liegt bei 1
b) Da der Itemparameter größer als der Personenparameter ist, liegt die Wahrscheinlichkeit bei p < 0.50 also unter 50%
c) Der Personenparamter von Person 2 müsste kleiner als 1 sein, also kleiner als der Itemparameter sein. Also es müsste asuf der X Achse weiter links liegen.
d) lila
e) lila und blau, da die Kurven sich schneiden und nicht parallel verlaufen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Ein Item weist eine Schiefe von 1.03 auf. Welche Grafik entspricht den Items?

A

– Schiefe > 0: linkssteile Verteilung (rechtsschief)
– Schiefe < 0: rechtssteile Verteilung (linksschief)
– Schiefe = 0: symmetrische Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Erklären sie die externale Testkonstruktion und ein Anwendungsgebiet.

A

Bei der externalen Testkonstruktion wird die Skala nach dem Kriterium entwickelt. Danach werden 2 Personengruppen die Items vorgelegt und diese müssen die Items beantworten. Nach der Datenanalyse werden die Items selektiert, die am besten zwischen den Gruppen differenzieren z.B. MMPI- Minnesota Multiphasic Personality Inventory. Der MMPI ist einer der weltweit am häufigsten verwendeten Persönlichkeitstests in der klinischen Psychologie und Psychiatrie. Er dient als Hilfsmittel bei der Untersuchung der Persönlichkeitsstruktur, insbesondere bei psychischen Störungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Bei der externalen Testkonstruktion wird die Skala nach dem Kriterium entwickelt. Danach werden 2 Personengruppen die Items vorgelegt und diese müssen die Items beantworten. Nach der Datenanalyse werden die Items selektiert, die am besten zwischen den Gruppen differenzieren z.B. MMPI- Minnesota Multiphasic Personality Inventory. Der MMPI ist einer der weltweit am häufigsten verwendeten Persönlichkeitstests in der klinischen Psychologie und Psychiatrie. Er dient als Hilfsmittel bei der Untersuchung der Persönlichkeitsstruktur, insbesondere bei psychischen Störungen.

A

2 mal eine einfache Minderungskorrektur
r = 0,40 / Wurzel 0,95 = 0,41
r = 0,30 / Wurzel 0,60 = 0,39
🡪 neue Skala korreliert besser als alte Skala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Itemschwierigkeit berechnen; Welches Item ist schwieriger und welches ggf. kritisch?

A
  • dichotomes Antwortformat (z.B. ja/nein)
  • Pi = NR / N Pi: Schwierigkeitsindex; NR: alle Vpn die richtig geantwortet haben; - N: alle Vpn
  • hoher Schwierigkeitsindex = niedrige Schwierigkeit (leichtes Item)
  • geringer Schwierigkeitsindex = hohe Schwierigkeit (schweres Item)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

In welcher Zeitform sollten die Untersuchungsergebnisse eines Befundes geschrieben sein und warum? X3 16/17 1.Termin; 15/16 1.Termin

A

Im Untersuchungsbericht werden die verwendeten Methoden und erzielten Ergebnisse dargestellt. Es handelt sich um eine Sammlung von Ergebnissen, die im Präteritum und unpersönlich formuliert sind. So soll deutlich gemacht werden, dass es sich um einmalige Testleistungen in der Vergangenheit handelt, die erst dann Rückschlüsse auf die Person zulassen, wenn sich entsprechende Hinweise verdichten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Klara Klett hat eine neue Skala zur Messung von Anschlussmotivation entwickelt und diese in mehreren Überarbeitungsrunden optimiert. Die Kennwerte der 20 Items umfassenden Skala sehen vielversprechend aus: Sie erreicht eine Reliabilität von Cronbachs Alpha .82 und hängt mit dem Kriterium Größe des sozialen Netzwerks zu r = .40 zusammen. Eine ältere Skala zur Anschlussmotivation vermochte die Größe des sozialen Netzwerkes lediglich zu r = .25 vorherzusagen. Die Reliabilität der älteren Skala, wiederum ermittelt als Cronbachs Alpha, betrug .80.

a) Wie könnte Klara Klett vorgehen, um die Zusammenhänge der neuen und der alten Skala zur Messung von Anschlussmotivation mit der Größe des sozialen Netzwerkes direkter zu vergleichen? Machen Sie einen Vorschlag, der konkrete Berechnungen umfasst (1 Satz). (1 Punkt)
b) Wenden Sie Ihren obigen Vorschlag an. Zeigen Sie dabei die Rechenwege!
Stützen die Ergebnisse den Eindruck, dass Klara Kletts neue Skala zur Anschlussmotivation die Größe des sozialen Netzwerkes um einiges deutlicher vorhersagen kann? Neben Sie hierzu Stellung (2 Sätze). (3 Punkte)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

In der Klassischen Testtheorie (KTT) gilt: X=T+e (Testwert gleich wahrer Wert plus Fehler). Ferner gilt folgende Varianzzerlegung: VAR(X) = VAR(T) + VAR(e) (Varianz der Testwerte gleich Varianz des wahren Wertes plus Fehlervarianz). (2 Punkte) X2 19/20 2.Termin
a) Welche Varianzkomponente fehlt in der zweiten Gleichung laut Kovarianz-Algebra?
b) Was ist die Rechtfertigung für ihr Fehlen in der KTT?

A

a) Welche Varianzkomponente fehlt in der zweiten Gleichung laut Kovarianz-Algebra?
-> Die Kovarianz-Algebra besagt nun, dass sich die Varianz zweier Werte aus der Summe ihrer Varianzen und zweimal ihrer gemeinsamen Kovarianz zusammensetzt. Da sich der beobachtete Wert (X) aus dem wahren und einem Fehlerwert (T + e) zusammensetzt, folgt:
Kovarianz-Algebra: VAR(X) = VAR (T) + VAR (e) + 2 * COV (T,e)
- Kovarianz: Gibt die Richtung des Zusammenhangs zweier Variablen an, nicht aber die Stärke des Zusammenhangs
b) Was ist die Rechtfertigung für ihr Fehlen in der KTT?
Korrelation zwischen T + e ist 0, d.h. man braucht die Kovarianz nicht aufnehmen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Erklären Sie den sogenannten Prototypenansatz der Testkonstruktion. Beschreiben Sie dazu die einzelnen Schritte, die der Diagnostiker geht, in kurzen Stichpunkten. Nennen Sie zusätzlich noch einen Anwendungskontext, in dem ein solches Vorgehen empfohlen werden kann. (2 Punkte) X2 19/20 1.Termin

A

Bei dem Prototypenansatz ist das Alltag- und Expertenwissen von Bedeutung. Der Experte erinnert sich an bestimmte Verhaltensweisen, die durch fragliche Charaktereigenschaften zustande kommen. Anschließen müssen andere Personen beurteilen, wie prototypisch die Items für das jeweilige Konstrukt sind. Somit werden die Items mit höchster Prototypizität ausgewählt. Der Prototypenansatz ist atheoretisch, aber sinnvoll für neue, wenig erforschte Konstrukte. Der Ansatz wird z.B. im Handlungshäufigkeits-Ansatz angewandt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

siehe Galerie Output1

A
  • Die P-Werte der Variablen Extraversion, Neurotizismus und Verträglichkeit sind kleiner als 0,05 und somit signifikant. D.h., dass diese 3 Variablen signifikant mit Eitelkeit zusammenhängen. Die Verträglichkeit hängt negativ mit Eitelkeit zusammen, da der T-Wert negativ ist. D.h. je niedriger die Verträglichkeit ist, desto höher ist die Eitelkeit. Die Extraversion und der Neurotizismus hängen positiv miteinander zusammen, da die T-Werte positiv sind. D.h. je höher die Extraversion und der Neurotizismus sind, desto höher ist die Eitelkeit.
  • Durch den multiple R-squared können wir sehen, dass 0,4862 Varianz aufgeklärt wird.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Test auf Haupt- und Nebengütekriterien bewerten; Zwei heterogene Konstrukte wurden mit 100 Items gemessen…. /
Es war Text gegeben anhand dessen man den darin beschriebenen Test auf seine Haupt- und Nebengütekriterien bewerten sollte (positive und negative Aspekte, 8 Stück raussuchen) X2 19/20 2.Termin

A
  • 3 Hauptgütekriterien: Objektivität, Reliabilität und Validität
  • 6 Nebengütekriterien: Normierung, Vergleichbarkeit, Ökonomie, Nützlichkeit, Testfairness und Akzeptanz
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Ein Item in einem Test hat eine negative Trennschärfe → wieso problematisch, woran kann es liegen und was kann man dagegen machen?

A

Die Trennschärfe erlaubt eine Einschätzung, wie gut das Item Personen mit unterschiedlich hohen Merkmalsausprägungen voneinander trennt. Wenn die Trennschärfe negativ ist, hat man höchstwahrscheinlich vergessen das Item umzupolen. Dies ist problematisch, da man somit fehlinterpretiert und Fehler bei weiteren Berechnungen macht. Mit der Trennschärfe hängen viele anderen Sachen zusammen z.B. wie die Reliabilität oder Korrelation. Somit kann eine ganze Studie falsche Ergebnisse aufweisen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Tabelle mit Mittelwerten und SDs von 6 Items gegeben, man sollte die 2 problematischen raussuchen und sagen warum sie problematisch sind X3 16/17 1.Termin; 15/16 1.Termin Seminar 6. Woche; Folie 9-10

A
  • Mittelwert: sehr niedrige Werte deuten auf Bodeneffekt
  • Mittelwert: sehr hohe Werte deuten auf Deckeneffekt hin
  • Standardabweichung: niedrige SD deutet auf niedrige Varianz hin; starke Streuung von 0 deutet auf Bimodalität hin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q
  1. Erläutern Sie die klinische und die statistische Urteilsbildung anhand eines Beispiels. X2 15/16 1.Termin
A
  • klinische Urteilsbildung:
    • ist der statistischen Urteilsbildung häufig unterlegen
    • intuitiv, erfahrungsbasiert, Einzelfallorientierung
    • Besonderheiten des Patienten/ Klienten einbeziehen + erlaubt präzise vorhersagen
      -> z.B. kommt ein Psychotherapeut nach einigen Sitzungen zu einem Urteil z.B. Depression
  • statistische Urteilsbildung:
    • Algorithmen (mehrere Tests zusammenfügen)
    • Möglichkeit der Anwendung statistischer Analysemethoden; objektiver
      -> z.B. löst Patient Fragebögen und anhand dessen wird eine Analyse durchgeführt und man kommt zu einem Urteil -> die Analyse muss strikte Regeln haben
      🡪 beide sind gut; am Besten Kombinationsstrategien
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Erläutern Sie die Status- und die Prozessdiagnostik. VL 02; Folie 19

A
  • Statusdiagnostik
  • aktueller Ist-Zustand
  • eigenschaftsorientiert (z.B. Intelligenz eines Schülers messen, um zu gucken, ob er Förderunterricht braucht)
  • verhaltensorientiert (z.B. Schüler hat Aggressionen -> man guckt sich Freunde an)
  • stabile Eigenschaften, Verhaltensrepertoire, Kontingenzen
  • traits -> stabile Eigenschaften
  • Prozessdiagnostik
  • Verlaufsmessung bzw. Prozessmessung
  • änderungssensitive Verfahren (z.B. Instrumente geschickt wählen)
  • Zustandsdiagnostik
  • states -> aktuelle Zustand
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Nennen und beschreiben Sie zwei Verfahren zur Reliabilitätsmessung, die mit einer Testung realisiert werden können.

A
  • Retest-Reliabilität
  • zweimalige Vorgabe eines Tests zur Ermittlung des Zusammenhangs zwischen erster und zweiter Messung
  • Split-Half:
  • Testung des Tests in zwei Hälften und Bestimmung des Zusammenhangs dieser beiden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Bei welcher Schwierigkeit haben Items die geringste Trennschärfe?

A

Die höchste Trennschärfe liegt bei p=0,50. Somit würde die geringste Trennschärfe bei sehr leichten oder sehr schweren Aufgaben am geringsten sein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Warum ist die Annahme der Merkmalskonstanz bei der KTT problematisch? X2 15/16 1.Termin

A
  • eigentlich nur bei kurzen Zeiträumen und nur für bestimmte Merkmalsbereiche gültig
  • Messung von States
  • besonders bei Messung von stimmungs-, müdigkeits- und tätigkeitsabhängigen Variablen nicht haltbar
  • Persönlichkeitsmerkmale sind nicht nur in Kindheit und Jugend, sondern auch im Erwachsenenalter veränderlich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Was ändert sich bei einer orthogonalen Rotation bei der exploratorischen Faktorenanalyse? VL 04; Folie 29 u.F.

A

Die Rotation ist eine mathematische Transformation, welche die Ladungen der Faktoren umverteilt. Ziel: jede Variable soll nur auf einen Faktor eine hohe Ladung haben
Bei der exploratorischen Faktorenanalyse bei der orthogonalen Rotation wird jede Variable einem Faktor zugeordnet, aber die Faktoren korrelieren nicht untereinander. Eigenwert, Komplexität, Ladung der Variable auf Faktor, Varianzaufklärung Faktor (%) verändern sich

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q
  1. statistische Werte (Cronbachs Alpha für Gesamttest und jedes Item, wenn dieses weggelassen, Mittelwert der Antworten für jedes Item, Item-Gesamttestkorrelation (oder so ähnlich → Trennschärfe) VL 05; Folie 22 gute Abb.
    . Bestimmung des leichtesten Items
    a. Bestimmung der internen Konsistenz des gesamten Tests
    b. Bestimmung des Items, bei dem Rausnehmen zu höchster interner Konsistenz führt
A

. Bestimmung des leichtesten Items
-> wenn die Trennschärfe niedrig ist, ist das Item leicht
a. Bestimmung der internen Konsistenz des gesamten Tests
-> Je höher die Inter-Item-Korrelation ist, desto höher ist das Cronbachs alpha und somit auch die interne Konsistenz. Bei Skalen psychometrischer Verfahren sollte für eine zufriedenstellende Reliabilität ein Cronbachs-Alpha-Wert von 0,7 erreicht werden. Werte unter 0,5 gelten als nicht akzeptabel, Werte ab 0,8 als gut. Wenn man ein negatives Cronbachs alpha hat, hat man höchstwahrscheinlich vergessen ein Item zu invertieren oder das Item misst etwas gegensätzliches zum Konstrukt.
b. Bestimmung des Items, bei dem Rausnehmen zu höchster interner Konsistenz führt
-> man sollte alle Items rausnehmen, die ein Cronbachs alpha unter 0,7 haben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q
  1. Unterschied zwischen Verhaltensbeobachtung und Verhaltensbeurteilung X2 16/17 1.Termin
A
  • beobachten umfasst nur in Zahlen protokollieren, wie häufig und wie lange ein Verhalten wie Lächeln auftrat,
  • Beurteilen erfordert kognitive Verarbeitung der Beobachtung und ist subjektiv, man rated, kategorisiert ein Merkmal, zB. wie intensiv war das Lächeln? war es gefaked oder echt? Einstufung auf ratingskala → Intensität, Dauer, Häufigkeit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q
  1. Was sind Methodeneffekte beim Assessment Center? Warum sind sie problematisch?
A
  • Das Assessment Center ist ein häufig eingesetztes Verfahren bei der Bewerbebeurteilung in Organisationen. Mehrere Bewerber werden von mehreren trainierten Beobachtern beobachtet und beurteilt.
  • Ein Problem ist beispielsweise, dass zwar prognostische Validität gegeben, die Konstruktvalidität aber problematisch ist. Beobachter wenig zwischen den einzelnen Eigenschaften differenzieren, sondern ihren Gesamteindruck stark in die einzelnen Urteile einfließen lassen.
  • die Korrelationen zwischen Urteilen bezüglich eines bestimmten Konstruktes (z. B.
    Durchsetzungsfähigkeit) über die Methoden hinweg sind relativ gering (konvergente Validität ist also nicht gegeben).
59
Q
  1. Zwei Qualitätsstandards der DIN33430 VL 01; Folie 40
A

● Ausschluss projektiver Verfahren,
● Test soll aufgrund einer Testtheorie konstruiert sein,
● Gütekriterien sollen erfüllt sein und statistisch-methodische Grundlagen
● stat. methodische Grundlagen

60
Q
  1. Bei welcher Itemschwierigkeit ist die Trennschärfe am höchsten?
A

● bei Items mittlerer Schwierigkeit also p=0.50 am größten

61
Q
  1. Wie kann man die Auswertungsobjektivität erhöhen? Beispiel nennen VL 10; Folie 27 u.F.
A

● Höchte Objektivität bei maschinellen Auswertungsmethoden: computergestütze Testauswertungsprogramme
● Manuelle Auswertungsmethoden: Auswertungsschablonen benutzen, oder Testmanual zur Hilfe nehmen

62
Q
  1. Was kann die Beurteilerübereinstimmung verringern? 2 Faktoren nennen
A
  • Es ist möglich, dass verschiedene Beurteiler auch unterschiedliche Vorstellungen von dem Konstrukt haben, das sie beurteilen sollen. Zum Beispiel könnte eine Beurteilerin unter »verbaler Begabung« eine flüssige Ausdrucksweise verstehen,
    wohingegen eine andere Beurteilerin vor allem auf den Umfang des Wortschatzes achtet.
  • Beurteiler verfügen häufig über unterschiedliche Schwellen in ihrer Entscheidung, ob ein bestimmtes Merkmal bei der Testperson vorliegt oder nicht. Beispielsweise liegt die Schwelle einer im Strafvollzug tätigen Psychologin bei der Bezeichnung von Verhalten als »aggressiv« vermutlich höher als die einer in der Erziehungsberatung tätigen Kollegin. Die Psychologin in der Erziehungsberatung würde eventuell bereits
    gewisse verbale Abwertungen als aggressiv bezeichnen, während die im Strafvollzug tätige Diagnostikerin diese z. B. als derben Humor interpretiert.
  • Außerdem könnten die Abstufungen der Ratingskala, auf der das Verhalten beurteilt werden soll, von verschiedenen Beurteilern unterschiedlich interpretiert werden.
  • Zudem ist die Beurteilung auch davon abhängig, in welchen Situationen die Beurteiler das Verhalten beobachtet und schließlich beurteilt haben. Aus diesem Grund sollte die Beurteilerübereinstimmung stets aus standardisierten Beurteilungssituationen erhoben werden.
63
Q

Welche Aussage über Zusammenhänge diagnostischer Gütekriterien bei psychometrischen Tests ist falsch?
Nur wenn Objektivität hoch ist, kann die Reliabilität hoch sein
Wenn die Reliabilität niedrig ist, ist auch die Validität niedrig
Wenn die Reliabilität hoch ist, ist auch die Validität hoch
Wenn die Reliabilität hoch ist, kann die Validität hoch sein

A

Wenn die Reliabilität hoch ist, ist auch die Validität hoch

64
Q

Wie unterscheidet sich das Modell tau-kongenerischer Modell von den anderen Modellen der KTT?
keine Äquivalenz der Fehlervarianzen
keine Äquivalenz von true score Variablen und latentem Merkmal
keine kontinuierlichen latenten & manifesten Variablen
keine unabhängigen Fehler

A

keine Äquivalenz von true score Variablen und latentem Merkmal (!?)

65
Q

Welche der Aussagen über Power- und Speedtests ist falsch?
beide sehr leichte bis sehr schwere Aufgaben
bei beiden zählt Anzahl der richtigen Antworten als Testergebnis
bei beiden die Instruktion, möglichst viel richtig zu antworten
bei beiden erfolgt die Interpretation der Testergebnisse nach Normen

A

beide sehr leichte bis sehr schwere Aufgaben

66
Q

Ein Wert liegt zwei Standardabweichungen über dem Mittelwert. Was passt?
z = 2, T = 60, IQ = 115, Prozentrang = 90,1%
z = 2, T = 60, IQ = 130, Prozentrang = 95,2%
z = 2, T = 70, IQ = 120, Prozentrang = 92,5%
z = 2, T = 70, IQ = 130, Prozentrang = 97,7%

A

z = 2, T = 70, IQ = 130, Prozentrang = 97,7%

67
Q

Welche Form der Validität spielt bei psychometrischen Tests keine Rolle?
Interne Validität
Kriteriumsvalidität
Konstruktvalidität
Inhaltsvalidität

A

Interne Validität

68
Q

Welche Variable des Cronbach-Brogden-Gleser-Modells verringert den Nutzen des Auswahlverfahrens?
mehr ausgewählte Personen
mehr Bewerber*innen
längere Verweildauer im Unternehmen
höheres Einkommen für die zu besetzende Position

A

mehr Bewerber*innen

69
Q

Welche der angegebenen Grafiken ist die richtige, wenn die Kurtosis -0.78 und die Schiefe 0.51 sind?
rot
gelb
blau
grün

70
Q

Was ist kein Axiom der KTT?
e = X - T [→ X = T + e]
VAR(X) = VAR(T) + VAR(e)
Rel(X)= (Var(X) / VAR(T))
Kov(T,e) = 0

A

Rel(X)= (Var(X) / VAR(T))

71
Q

Konfirmatorische Faktorenanalyse: Was ist nicht im Faktor-Stufenmodell festgelegt?
Uniqueness
Zuordnung manifester Variable zu latentem Faktor
Zahl der Faktoren
Beziehung der Faktoren

A

Uniqueness

72
Q

An welche Personengruppe wird nach DIN[Zahl] keine Anforderungen gestellt?
Beobachter bei Verhaltensbeurteilung
Beobachter bei Befragungen
Bewerber*innen
Eignungsdiagnostiker

A

Bewerber*innen

73
Q

Was ist kein legitimer Grund, ein Item aus einem Testentwurf zu entfernen?
Hohe Reliabilität
Niedrige Reliabilität
Hohe Trennschärfe
Niedrige Trennschärfe

A

Hohe Reliabilität

74
Q

Welche Definition von PPV ist korrekt?
Wahrscheinlichkeit, dass das Kriterium vorliegt, wenn der Test positiv ist.
Wahrscheinlichkeit, dass das Kriterium vorliegt, wenn der Test negativ ist.
Wahrscheinlichkeit, dass der Test positiv ist, wenn das Kriterium nicht vorliegt.
Wahrscheinlichkeit, dass der Test positiv ist, wenn das Kriterium vorliegt.

A

Wahrscheinlichkeit, dass das Kriterium vorliegt, wenn der Test positiv ist.

75
Q

Welches Item hat das höchste Rateparameter?
siehe Galerie
grün
blau
rot
grün und rot

76
Q

Was verändert sich nicht bei der Rotation bei der explorativen Faktorenanalyse?
erklärte Varianz der einzelnen Faktoren
Kommunalitäten
Eigenwerte
keine der Optionen

A

Kommunalitäten

77
Q

Welche Aussage zur Reliabilität ist falsch?
Reliabilität sinkt mit sinkender Varianz der wahren Werte (bei konstanter Varianz der Fehler)
Die Bestimmung mittels Cronbachs alpha stellt eine Verallgemeinerung der Testhalbierungsmethode dar
Reliabilität steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte)
Die Reliabilität eines Tests bezeichnet den Grad der Genauigkeit, mit der eine Eigenschaft erfasst wird

A

Reliabilität steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte)

78
Q

Welche der folgenden Aussagen zur Trennschärfe ist richtig?
Trennschärfe gibt an, wie verlässlich ein Item misst.
Zwischen Itemschwierigkeit und Trennschärfe besteht ein kurvilinearer Zusammenhang.
An der Reliabilität lässt sich die Redundanz der Items erkennen
Wenn Voraussetzungen überprüft, Itemhomogenität ist Trennschärfe

A

Zwischen Itemschwierigkeit und Trennschärfe besteht ein kurvilinearer Zusammenhang.

79
Q

Nenne 2 aus den 4 Prinzipien der ethischen Richtlinien, die es nach DGP und BDP gibt und beschreibe in Stichpunkten, was sie bedeuten.

A

Verantwortung
Kompetenz
Achtung vor den Rechten und der Würde der Menschen
Integrität

80
Q

Nennen Sie zwei Anwendungen der Iteminformationskurve in der Praxis.

A

Adaptives Testen
Optimierung von Instrumenten
Vergleich von Instrumenten
(Könnte man nicht auch sagen: Bestimmung Diskriminationsfähigkeit & Standardfehler??)

81
Q

Eine Kaufhauskette hat ein sehr komplexes Auswahlverfahren für Führungskräfte, die direkt nach dem Bachelor rekrutiert werden. Dafür verwenden sie folgende Verfahren: Einsicht in Lebenslauf und Zeugnisse, drei Zoom-Interviews mit Führungskräften, Assessment-Center mit Fallbeispiel, Gruppenübungen, Präsentation, Verkaufsübung & Stresstest. Wie kann man das Modell sinnvoll reduzieren? Wie würden Sie vorgehen, was würden Sie analysieren und welche Kriterien würden Sie in Ihrer Entscheidung berücksichtigen? Begründen Sie mit mindestens zwei Aspekten.

A

ggf. mehrstufiges Vorgehen: erst Ausschluss ungeeigneter Bewerberinnen über Lebenslauf, Zeugnisse und ggf. 1 strukturiertes Interview
anschließend verkürztes Assessment Center mit den wichtigsten Bausteinen für Führungskräfte (Lösung von schwieriger Situation/Dilemma, Führungsqualitäten im Rollenspiel und Gruppenarbeit) der geeignetsten Bewerber
innen
unbedingt die Gütekriterien erwähnen!

82
Q

Reliabilitätsanalyse mit Output gegeben.
Output für das Protokoll wurde aus den Folien genommen und einige Werte so verändert, wie sie in der Klausur waren. Ich kenne natürlich nicht mehr alle Zahlen auswendig, aber die relevanten Punkte sollten stimmen. Also nicht verwirren lassen, wenn manche Werte keinen Sinn ergeben :)
Was bedeutet der eingerahmte Koeffizient bei item2?
Welche Items sollten am ehesten entfernt werden? Nennen Sie zwei Begründungen.
siehe Galerie

A

Was bedeutet der eingerahmte Koeffizient bei item2?
die Veränderung der Reliabilität (raw_alpha) der Gesamtskala, wenn dieses Item ausgeschlossen wirdv (reliability if an item is dropped)
Welche Items sollten am ehesten entfernt werden? Nennen Sie zwei Begründungen.
item1: Reliabilität der Gesamtskala wird signifikant größer als oberes 95%-Konfidenzintervall bei Ausschluss (0.72 > 0.71) und Trennschärfe (r.drop) ist zu gering (<0.30, zu weit entfernt von 0.50)

83
Q

Es kursiert ein Grippewelle, die hoch ansteckend ist und sich gerade schnell verbreitet. Ein Autobaubetrieb möchte die Verbreitung unter seinen Mitarbeitenden verhindern. Ziel ist, dass zumindest eine von den drei Produktionslinien aufrecht erhalten wird. Nach Infektion tauchen ziemlich schnell Kopf- und Nackenschmerzen auf, allerdings kann dieses Symptom auch bei anderen Ursachen auftreten. Es gibt zwei Testverfahren. Testverfahren A hat eine hohe Sensitivität und eine mittlere Spezifität. Testverfahren B hat eine hohe Spezifität und eine mittlere Sensitivität. Beide kosten den Betrieb 1 Euro pro Tag pro Person bei 3000 Mitarbeitenden. Welches Verfahren würden Sie empfehlen? Begründen Sie Ihre Wahl. Soll ein einstufiges oder mehrstufiges Verfahren verwendet werden und wenn mehrstufig, dann mit welchen Bestandteilen? Begründen Sie.

A

besser: klare Aufteilung der Antwort in Teilaufgaben
Option 1: Annahme einer relativ hohen Basisrate durch “schnelle Verbreitung“ und Testung ggf. ausschließlich an symptomatischen Mitarbeitenden. Ausschließlich Verfahren A, da hohe Sensitivität wichtiger bei hoher Basisrate, kein mehrstufiges Verfahren notwendig. Risikoreiches, aber kostengünstiges Vorgehen. Sollte zur Aufrechterhaltung von wenigstens einer Produktionslinie reichen.
Option 2: Ausfall einer Produktionslinie würde viel mehr Kosten verursachen, als eine doppelte Testung aller Mitarbeitenden, um deren Gesundheit und die Produktion zu schützen. Testung aller Mitarbeitenden in einem mehrstufigen Verfahren zur Absicherung. Zuerst Verfahren B mit hoher Spezifität zur Filterung aller falsch-positiven und Erhöhung der Basisrate. Anschließend Testverfahren A mit hoher Sensitivität zur sicheren Erkennung der TPs.
Option 3: Wenn möglich Aufteilung der Mitarbeitenden auf die drei Produktionslinien je nach Testergebnis: 1. ziemlich sicher negativ, 2. geringes Risiko von falsch-negativ und 3. eine Produktionslinie mit positivem Testergebnis.(!?!?!)

84
Q

ICC Kurve gegeben
siehe Galerie

Wie lautet die Itemschwierigkeit?

Wie ist die Wahrscheinlichkeit der Person P1, das Item zu lösen?

Zeichnen Sie eine weitere Person P2 ein, die das Item mit höherer Wahrscheinlichkeit lösen wird.

Zeichnen Sie die ICC eines weiteren Items mit besserer Trennschärfe ein.

Gilt spezifische Objektivität? Begründen Sie kurz.

A

Wie lautet die Itemschwierigkeit?
ca. 2 (ablesen der x-Achse des Items bei 0.5 auf y-Achse der Kurve)
Wie ist die Wahrscheinlichkeit der Person P1, das Item zu lösen?
ca. 0.3
Zeichnen Sie eine weitere Person P2 ein, die das Item mit höherer Wahrscheinlichkeit lösen wird.
Personenparameter weiter rechts auf der x-Achse
Zeichnen Sie die ICC eines weiteren Items mit besserer Trennschärfe ein.
Item mit (identischer Schwierigkeit und) steilerer Kurve
siehe Galerie
Gilt spezifische Objektivität? Begründen Sie kurz.
Nein, da keine Parallelität (keine Rasch-Konformität) der Kurven gegeben ist: Ungleiche Abstände zwischen den Kurven, abhängig von/je nach Ausprägung des Personen-Parameters

85
Q

ROC Grafik gegeben

Beschriften Sie die X- und Y-Achsen und nennen sie die Wertebereiche.

Zeichnen Sie eine zweite ROC-Kurve, eines valideren Verfahrens ein.

A

Beschriften Sie die X- und Y-Achsen und nennen sie die Wertebereiche.
x-Achse: P(FP); y-Achse: P(TP); beide Wertebereich von 0 bis 1 (0 bis 100%)
Zeichnen Sie eine zweite ROC-Kurve, eines valideren Verfahrens ein.
höhere Kurve darüber, deren Spitze näher an (0|1) liegt
siehe Galerie

86
Q

Verteilung von Personen, bei denen das Kriterium vorliegt und Personen, wo es nicht vorliegt

siehe Galerie

Setzen Sie einen Cut-Off, der den Fehler der FP minimiert. Es sollen aber noch TP vorhanden sein.

Markieren Sie die Bereiche der TP und TN und beschriften Sie diese.

A

Setzen Sie einen Cut-Off, der den Fehler der FP minimiert. Es sollen aber noch TP vorhanden sein.
Cut-Off rechts von der linken Kurve: fast vollständiger Ausschlus von FP aber noch viele/fast alle TP vorhanden
Achtung: cut-off so setzen, dass NICHTS mehr von den FP da ist egal wie wenig TP dann noch da sind, aber ist richtig laut Klausureinsicht)
Markieren Sie die Bereiche der TP und TN und beschriften Sie diese.
TP rechts vom Cut-Off in rechter Kurve, TN ganz links von Cut-Off in linker Kurve (überschneidende Bereiche in der Mitte wären FN und FP)
siehe Galerie

87
Q

Welche Disziplin trug nicht zur Entwicklung der psychologischen Diagnostik bei? a) Differenzielle Psychologie
b) Experimentelle Psychologie
c) Psychoanalyse
d) Psychiatrie

A

c) Psychoanalyse

88
Q

Welche Aussage ist richtig bezüglich Fragen bei Interviews?
a) offene Fragen sind gut bei ausschweifenden Rednern
b) geschlossenes Format ist gut, um Beispiele oder Zusammenhänge zu erfragen c) offene Fragen sind gut, um gehemmte Personen zum Reden zu bringen d) geschlossene Fragen sind gut, um Detailaspekte zu klären

A

d) geschlossene Fragen sind gut, um Detailaspekte zu klären

89
Q

Welches ist kein Axiom der KTT?
a) r(X1, X2) = 0
b) r(T, e) = 0
c) r(e1, e2) = 0
d) r(T1, e2) = 0

A

a) r(X1, X2) = 0

90
Q

Welche Aussage ist falsch, wenn die Itemschwierigkeit p = .10 beträgt? a) schwieriges Item
b) geringe Trennschärfe
c) hohe Varianz
d) Bodeneffekt

A

c) hohe Varianz

91
Q

Wenn sich die Fehlervarianz erhöht…
a) steigt die wahre Varianz
b) steigt die Reliabilität
c) sinkt die Reliabilität
d) steigt die beobachtete Varianz

A

d) steigt die beobachtete Varianz (?)

92
Q

Was ist kein Verfahren, mit dem man Reliabilität messen kann? a) Korrelation zwischen Tests, die unterschiedliche Konstrukte messen sollen b) Beschreibung Split-Half-Reliabilität
c) Beschreibung Retest-Reliabilität
d) Beschreibung Paralleltest-Reliabilität

A

a) Korrelation zwischen Tests, die unterschiedliche Konstrukte messen sollen

93
Q

Welche Validität wird nicht mit MTMM gemessen?
a) Konstruktvalidität
b) Inhaltsvalidität
c) divergente Validität
d) konvergente Validität

A

b) Inhaltsvalidität

94
Q

Beim dichotomen Rasch-Modell: Wie ist die Lösungswahrscheinlichkeit, wenn PP > IP? a) = 0.5
b) > 0.5
c) < 0.5
d) = 0

95
Q

Bei welchen Aufgaben ist die Ratewahrscheinlichkeit am geringsten?
a) dichotomes Aufgabenformat
b) Ergänzungsaufgabe
c) Mehrfachwahl-Aufgabe
d) Zuordnungsaufgabe

A

b) Ergänzungsaufgabe

96
Q

Rasch-skalierte Items: Wie ist der Zusammenhang zwischen den Items, wenn die Fähigkeitsausprägung auf einer Stufe konstant gehalten wird?
a) r = 0
b) r = 1
c) r = 0.5
d) r = -1

97
Q

Was trifft nicht zu?
a) psychometrische Verfahren sind objektiver als projektive Verfahren
b) Auswerter*innen von projektiven Verfahren brauchen ein intensives Training c) psychometrische Tests sind aufwändiger in der Auswertung
d) projektive Verfahren verwenden offen gestaltete Reizmuster

A

c) psychometrische Tests sind aufwändiger in der Auswertung

98
Q

Die Arbeitsprobe ist eine Methode der…
a) Eigenschaftsdiagnostik
b) Verhaltensdiagnostik
c) Situationsdiagnostik
d)

A

b) Verhaltensdiagnostik

99
Q

In welcher Zeitform sollte der Ergebnisteil eines Gutachtens erstellt werden und warum?

A

Der Ergebnisteil sollte im Präteritum erstellt werden. Dadurch wird betont, dass es sich um ein evtl. messfehlerbehaftetes, einmaliges Testergebnis handelt.
6) Was sind Methodeneffekte beim Assessment Center?

100
Q

Bei welcher Itemschwierigkeit ist die Trennschärfe am höchsten?

A

Die Trennschärfe ist am höchsten bei Items mittlerer Schwierigkeit. Es besteht ein kurvilinearer Zusammenhang zwischen Itemschwierigkeit und Trennschärfe.

101
Q

Wie kann die Auswertungsobjektivität erhöht werden? Erläutern Sie ein Beispiel.

A

Die Auswertungsobjektivität kann durch eine standardisierte Auswertung erhöht werden. Ein Beispiel dafür wäre, dass die Beurteilenden klar definierte Kriterien und Bewertungsskalen verwenden, die im Vorfeld festgelegt und den Beurteilenden bekannt gemacht werden. Dadurch wird sichergestellt, dass die gleichen Kriterien für alle Bewerberinnen und Bewerber angewendet werden und die Bewertungen somit vergleichbar sind. Auch eine unabhängige und geschulte Auswertungsperson kann dazu beitragen, dass die Auswertungsobjektivität erhöht wird.

102
Q

Welche Korrelationen müssen für Konstruktvalidität im Multitrait-Multimethod Ansatz vorliegen? a) niedrige Monotrait-Monomethod Korrelation
niedrige Multitrait-Monomethod Korrelation
hohe Monotrait-Multimethod Korrelation
niedrige Multitrait-Multimethod Korrelation
b) niedrige Monotrait-Monomethod Korrelation
niedrige Multitrait-Monomethod Korrelation
hohe Monotrait-Multimethod Korrelation
hohe Multitrait-Multimethod Korrelation
c) hohe Monotrait-Monomethod Korrelation
niedrige Multitrait-Monomethod Korrelation
hohe Monotrait-Multimethod Korrelation
niedrige Multitrait-Multimethod Korrelation
d) niedrige Monotrait-Monomethod Korrelation
hohe Multitrait-Monomethod Korrelation
niedrige Monotrait-Multimethod Korrelation
hohe Multitrait-Multimethod Korrelation

A

c) hohe Monotrait-Monomethod Korrelation
niedrige Multitrait-Monomethod Korrelation
hohe Monotrait-Multimethod Korrelation
niedrige Multitrait-Multimethod Korrelation

103
Q

Wie verändert sich die Reliabilität eines Tests, wenn die Länge des Tests mit der Spearman-Brown Formel verdoppelt wird?
a) sie verdoppelt sich
b) sie steigt weniger stark, je höher die Reliabilität des Tests vorher war
c) sie steigt umso stärker, je höher die Reliabilität des Tests vorher war
d)

A

b) sie steigt weniger stark, je höher die Reliabilität des Tests vorher war

104
Q

Was ist kein Vorteil der Selbstbeobachtung?
Kann zu jedem Zeitpunkt erfolgen
Einfluss von Motivation auf die Ergebnisse
Qualitative Merkmale können erfasst werden
Kann ereignis-abhängig erfasst werden

A

Einfluss von Motivation auf die Ergebniss

105
Q

Was enthält das Brogden-Cronbach-Gleser Modell zur Berechnung des Nutzens nicht?
Reliabilität
Validität
Streuung des externen Kriteriums
Anzahl der Bewerber*innen

A

Reliabilität

106
Q

Was ist die Definition von negative predictive value (NPV)?
Kriterium liegt vor, Test sagt ja
Kriterium liegt vor, Test sagt nein
Kriterium liegt nicht vor, Test sagt nein
Kriterium liegt nicht vor Test sagt ja

A

Kriterium liegt nicht vor, Test sagt nein

107
Q

Was ändert sich durch Rotation einer EFA nicht? (War die Fragen nicht positiv formuliert!? Also: Was ändert sich? Und es waren irgendwie die Eigenwerte oder so?)
Kommunalität
Varianzaufklärung der einzelnen Faktoren
Eigenwerte
nichts der obigen

A

Kommunalität

108
Q

Welche der folgenden Aussagen zur Reliabilität ist falsch?
Die Reliabilität eines Tests bezeichnet den Grad der Genauigkeit, mit dem der Test (irgend-)eine Eigenschaft erfasst.
Die Bestimmung der Reliabilität mittels Cronbachs Alpha stellt eine Verallgemeinerung der Testhalbierungsmethode dar.
Die Reliabilität eines Tests steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte).
Die Reliabilität eines Tests sinkt mit sinkender Varianz der wahren Werte (bei konstanter Varianz der Fehler).

A

Die Reliabilität eines Tests steigt mit steigender Varianz der Fehler (bei konstanter Varianz der wahren Werte).

109
Q

Bei der Regression findet man oft heraus, dass ein Test beim Anwenden in neuen Stichproben nicht mehr zuverlässige Vorhersagen treffen kann. Mit welcher Strategie kann man diesem Problem nicht begegnen?
Bestimmung der Güte des Vorgehens in einer neuen Stichprobe
Erfassung der Reliabilität durch Maximum Likelihood Schätzung statt kleinste Quadrat-Abweichung (r²)(!?) (→ Maximum Likelihood ist stichprobenabhängig)
Test mit vielen ähnlichen Personen und Schätzung & Integration der Koeffizienten
Ausschließlich Beurteilung der Vorzeichen der Koeffizienten ohne deren Werte/Stärke

A

Erfassung der Reliabilität durch Maximum Likelihood Schätzung statt kleinste Quadrat-Abweichung (r²)(!?) (→ Maximum Likelihood ist stichprobenabhängig)

110
Q

Was stimmt in Bezug auf den Zusammenhang zwischen Itemschwierigkeit und Trennschärfe nicht?
Mithilfe der Trennschärfe können Items auf Redundanz untersucht werden
Trennschärfe und Itemschwierigkeit haben einen linearen Zusammenhang
Itemhomogenität ist die Voraussetzung zur Untersuchung der Trennschärfe
Die Trennschärfe ist bei mittlerer Itemschwierigkeit am höchsten

A

Trennschärfe und Itemschwierigkeit haben einen linearen Zusammenhang

111
Q

Welches Item hat die höchste Ratewahrscheinlichkeit?
—> hier War eine Abbildung mit 3 items und wobei item 1 und 3 nicht bei 0 anfangen also eine Ratewahrscheinlichkeit möglich wäre, aber Item 3 hatte den höchsten Rate-Parameter/ die höchste Ratewahrscheinlichkeit mit ca. 0.20/0.30

Item 1
Item 2
Item 1 und 2
Item 3

112
Q

Was ist bei der Konfirmatorischen Faktorenanalyse (CFA) kein Teil des Strukturgleichungsmodells?
Anzahl der Faktoren
Zuordnung der Variablen zu den Faktoren
Kommunalität
Korrelationen zwischen den Faktoren

A

Kommunalität

113
Q

Über welches Verfahren gibt die DIN Norm 33430 zur Eignungsdiagnostik keine Vorschriften?
algorithmische/algorithmierende Modelle
Dokumentenanalyse
Verhaltensbeobachtung
Fragebögen

A

algorithmische/algorithmierende Modelle(!?)

114
Q

Welches der folgenden ist kein Axiom der KTT?
E(e) = 0
r(T, e) = 0
r(e1, e2) = 0
X = T + E(e) → (richtig wäre: X = T + e)

A

X = T + E(e) → (richtig wäre: X = T + e)

115
Q

Eine Person erreicht bei einem normalverteilten Leistungstest einen Wert, der 2 Standardabweichungen über dem Mittelwert der Normstichprobe liegt. Welche der folgenden Werte passen dazu?
Z = 2; T = 60; IQ = 120; Prozentrang = 64,4
Z = 2; T = 64; IQ = 130; Prozentrang = 94,4
Z = 2; T = 60; IQ = 130; Prozentrang = 94,4
Z = 2; T = 70; IQ = 130; Prozentrang = 97,7

A

Z = 2; T = 70; IQ = 130; Prozentrang = 97,7

116
Q

Welcher Kennwert beschreibt, wie viel Varianz einer manifesten Variable durch alle Faktoren aufgeklärt wird?
Faktorladung
Eigenwert
Kommunalität
Uniqueness

A

Kommunalität

117
Q

Was ist kein Bestandteil von Powertests?
Instruktionen: beantworten Sie möglichst viele richtig
Großzügige Zeitbegrenzung
Maximal mittelschwere Aufgaben
Ergebnisvariable ist ausschließlich Anzahl richtiger Antworten

A

Maximal mittelschwere Aufgaben

118
Q

Was ist kein Vorteil von Beurteilungsaufgaben?
objektive und ökonomische Auswertung
Daten/Messung auf Intervallskalenniveau
Erfordern keine Distraktoren
differenzierte(re!?) Antworten/Informationen

A

Daten/Messung auf Intervallskalenniveau

119
Q

Geben Sie drei Ziele von Diagnostik an und erklären Sie diese (anhand einer Anwendung!?).

A

Klassifikation
Deskription (Beschreibung)
Erklärung
Prognose
(Be-)Handlungsplanung

120
Q

Die Chefin eines Handwerksbetriebs mit 25 Mitarbeiter:innen möchte kein Geld für das Auswahlverfahren zur Einstellung neuer Mitarbeiter:innen ausgeben, weil es sowieso nur eine geringe Anzahl an Bewerber:innen gibt. Warum ist das keine gute Idee? Nennen Sie zwei Gründe und erläutern Sie diese(!?).

A
  • die Kosten für ein effizientes & ökonomisches Auswahlverfahren sind deutlich geringer, als die Personalkosten bei einem so kleinen Unternehmen wären, wenn die eingestellte Person doch ungeeignet für die Arbeit ist
  • Motivationsverlust der anderen Mitarbeiter:innen – insbesondere in einem so kleinen Betrieb
  • neben dem finanziellen Schaden auch ein möglicher Image-Schaden/-Verlust für einen so kleinen Betrieb, wenn eine unqualifizierte Person eingestellt wird
  • selbst das günstigste & einfachste Auswahlverfahren ist immer deutlich besser in der Auswahl von neuen Mitarbeiter:innen, als per Zufall oder nach Bauchgefühl zu entscheiden …
121
Q

Test in Pandemie mit hoch ansteckender Krankheit und wenig betroffenen Personen. Validität und Reliabilität des Tests sind eher mittelmäßig/mittelhoch(!?). Welche Diagnostische Strategie würden Sie vorschlagen? Ist Sensitivität oder Spezifität bedeutender? Begründen Sie.

A

Erst hohe Spezifität aufgrund geringer Basisrate → höherer positive predictive value. Sonst extrem viele/mehr falsch positive Ergebnisse → Testergebnis hätte kaum einen Wert. Grundrechtseinschränkungen durch Quarantäne aufgrund eines schlecht begründeten positiven Ergebnisses sind rechtlich schwierig. Anschließend ggf. einen zweiten Test mit hoher Sensitivität für alle Personen mit positivem Ergebnis → höherer positive predictive value aufgrund der höheren Basisrate

Alternative Antwort: hochansteckende Krankheit bedeutet, dass wir lieber viele falsch-positive Testergebnisse in Kauf nehmen, Hauptsache erkrankte Leute werden erkannt und können die Krankheit nicht weiter verbreiten. Deshalb: Test mit hoher Sensitivität für möglichst hohen negative predictive value

122
Q
  1. a) gegeben waren die TP/TN Kurven und wir sollten ROC Kurven der beiden Tests einzeichnen + Achsenbeschriftungen b) Wie bestimmt man die Güte? Welche Werte?
A

→ Area under the curve (AUC), Integral der Funktion, Werte von 0 bis 1

123
Q

Eine ICC ist gegeben. Wie ist der Itemparameter des Items? Wie ist die Lösungswahrscheinlichkeit des Items von Person 1? Zeichnen Sie eine Person ein, die das Item mit niedrigerer Wahrscheinlichkeit löst als Person 1. Zeichnen Sie ein Item mit einer geringeren Trennschärfe ein. Ist spezifische Objektivität gegeben und warum?

A
  • Itemparameter Item 1 = ca. 2(!?)
  • Lösungswahrscheinlichkeit von Person 1 = ca. 0.30(!?)
  • zweites Personenparameter = weiter links auf der x-Achse als Person 1
  • zweites Item mit geringerer Trennschärfe = flachere Kurve mit derselben Itemschwierigkeit
  • keine spezifische Objektivität, weil das Verhältnis der Schwierigkeit der Aufgaben nicht objektiv ist, sondern von der Fähigkeit der Personen abhängt: Je nach Personenparameter ist die Lösungswahrscheinlichkeit von Item 1 oder 2 höher = nicht Rasch-Modell konform
124
Q

Wofür verwendet man die Item-Informations-Funktion? Nennen Sie zwei konkrete Anwendungsbereiche.

A
  • Adaptives Testen (schrittweise Vorgabe von Items)
  • Anpassung des Tests an Subpopulationen (z.B. Hochbegabung)
125
Q

Auf einer Skala zur Messung von Neurotizismus hat ein Item eine negative Trennschärfe. Warum ist das problematisch? Woran könnte es liegen? Was könnte unternommen werden?

A
  • problematisch weil negativer Zusammenhang (negative Korrelation) mit der Gesamtskala: je neurotischer eine Person laut Gesamtskala ist, desto geringer sind die beobachteten Werte dieses Items → Hinweis auf fehlende/mangelhafte Item-Homogenität, die eine Voraussetzung für die Skalenanalyse ist
  • mehrere mögliche Gründe: möglicherweise Rekodierung eines negativ/invertiert formulierten Items vergessen; missverständliche oder mehrdeutige Formulierung des Items; versehentlich ein falsches Item in der Skala, das eigentlich ein anderes Konstrukt misst (z.B. ein Item für Extraversion in einer Skala für Neurotizismus ;) )
  • Überprüfung der möglicherweise fehlenden Rekodierung des Items und anschließend ggf. Rekodierung; Überprüfung auf missverständliche Formulierung und ggf. Umformulierung des Items und Testung der neuen Formulierung in einer erneuten Durchführung des Tests (in einer neuen Stichprobe); notk
126
Q

Was ist kein Unterschied von Persönlichkeitstests und Projektiven Verfahren?
Mehrdeutige Reize
Erfassung eines latenten Merkmals
Auswertung anhand einer Schablone
quantitative Messung/Daten

A

Erfassung (Messung!?) eines latenten Merkmals

127
Q

Wie ist der Positive Predictive Value (PPV) definiert?
Anteil an Personen, bei denen das Kriterium vorliegt, wenn der Test positiv ist.
Anteil an Personen, bei denen das Kriterium nicht vorliegt, wenn der Test negativ ist.
Anteil an Personen, bei denen der Test positiv ist, wenn das Kriterium vorliegt.
Anteil an Personen, bei denen der Test negativ ist, wenn das Kriterium nicht vorliegt.

A

Anteil an Personen, bei denen das Kriterium vorliegt, wenn der Test positiv ist.

128
Q

Welche Aussage über die KTT ist falsch?
Beachtet die Messgenauigkeit
Beachtet die Konstruktvalidität
Nimmt an, dass es keinen Zusammenhang zwischen den wahren Werten und den Fehlern gibt

A

Beachtet die Konstruktvalidität

129
Q

Welche Aussage zu Cronbachs Alpha ist richtig?
Der Kennwert ist robust gegenüber Item-Heterogenität
Ein hohes Cronbach Alpha ist nicht automatisch mit Eindimensionalität gleichzusetzen

A

Ein hohes Cronbach Alpha ist nicht automatisch mit Eindimensionalität gleichzusetzen

130
Q

Numerischer Output der ICCs von 4/5 Items. Welches Modell liegt vor?
Rasch Modell Konformität
1 PL
2 PL
3 PL

131
Q

Welche Art von Validität wird häufig nicht bei der Testkonstruktion(!?) beachtet?
Konstruktvalidität
konvergente/divergente Validität
Kriteriumsvalidität
Ökologische Validität

A

Ökologische Validität

132
Q

Was ist beim Strukturgleichungsmodell der konfirmatorischen Faktorenanalyse gegeben?
Eigenwerte der Faktoren
Zusammenhänge/Korrelationen zwischen den Faktoren
Zuordnung der latenten Variablen zu den Faktoren
Kommunalität

A

Zusammenhänge/Korrelationen zwischen den Faktoren
Zuordnung der latenten Variablen zu den Faktoren (!?)

133
Q

Welche der folgenden Aussagen zur Item-Schwierigkeit/Trennschärfe ist richtig?


Zwischen Item-Schwierigkeit und Trennschärfe besteht ein kurvilinearer Zusammenhang

A

Zwischen Item-Schwierigkeit und Trennschärfe besteht ein kurvilinearer Zusammenhang

134
Q

Ein Item hat eine negative Kurtosis (-0.52) und eine positive Schiefe (1.53). Welches der Diagramme entspricht dieser Beschreibung?
Histogramm von linksschiefem/rechtssteilem + normalgipfeligem Item
Histogramm von rechtsschiefem/linkssteilem + normalgipfeligem Item
Histogramm von rechtsschiefem/linkssteilem + flachgipfligem Item
Histogramm von linksschiefem/rechtssteilem + spitzgipffligem Item

A

Histogramm von rechtsschiefem/linkssteilem + flachgipfligem Item
(Bei dieser Aufgabe sind die Diagramme unterschiedlich. Unbedingt auf die y-Achse achten, um ein flach-gipfliges Item zu erkennen)

135
Q

Was ist kein Vorteil von Multiple-Choice Fragen?
Erfassung von Wissen
objektive & ökonomische Auswertung
Erfassung von Wiedererkennen

A

Erfassung von Wiedererkennen

136
Q

Was ist keine Möglichkeit zur Überprüfung der Reliabilität?
2 Hälften eines Tests korrelieren
2 Tests die verschiedene Konstrukte untersuchen korrelieren
Items eines Test korellieren die das selbe messen
Test 2 mal durchführen und Korrelieren

A

2 Tests die verschiedene Konstrukte untersuchen korrelieren

137
Q

Was vergrößert nicht den Nutzen einer Eignungsdiagnostik?
Mehr Bewerber*innen
Mehr Ausgewählte
Höheres Jahreseinkommen
Mehrstufiges Verfahren

A

Mehr Bewerber*innen

138
Q

Eine Person erreicht bei einem normalverteilten Leistungstest einen Wert, der 1 Standardabweichungen unter dem Mittelwert der Normstichprobe liegt. Welche der folgenden Werte passen dazu?
Z = -1; T = 45; IQ = 90; Prozentrang = 64,4
Z = -1; T = 30; IQ = 100; Prozentrang = 94,4
Z = -1; T = 40; IQ = 85; Prozentrang = 15,x
Z = -1; T = 45; IQ = 90; Prozentrang = 25,x

A

Z = -1; T = 40; IQ = 85; Prozentrang = 15,x

139
Q

Welcher Kennwert führt eher/normalerweise(!?) nicht zum Aussortieren eines Items
hohe Reliabilität
niedrige Reliabilität
hohe Trennschärfe
niedrige Trennschärfe

A

hohe Reliabilität

140
Q

Worauf kann bei der Auswahl eines psychometrischen Tests am ehesten verzichtet werden?

theoretische Fundierung
Gütekriterien
Normierung für die betroffene Stichprobe

A

theoretische Fundierung

141
Q

Zur Qualifikation welcher beteiligten Personen(gruppe) macht die DIN 33430 keine Vorschriften?
Eignungsdiagnostikerinnen
Bewerber
innen
Beobachterinnen bei Verhaltensbeobachtungen
Beobachter
innen bei Befragungen

A

Bewerber*innen

142
Q

Nennen Sie drei Kennwerte, die sich bei einer Rotation nicht ändern.

A

Anzahl der Faktoren
Kommunalität (h2)
Uniqueness (u2)
aufgeklärte Gesamtvarianz
(kommunale Varianz!?)

143
Q

Output einer Faktorenanalyse. Wie viel Varianz wird durch alle Faktoren aufgeklärt? Welche Items sind problematisch und warum?

A

cum. var. im Output = 0.45 → 45% Varianz werden aufgeklärt
Item B2(!?) hatte eine Doppelladung auf Faktor ML2 und ML3
item N4(!?) hatte eine negative Faktorladung auf Faktor ML1 → Rekodierung von invertiert/negativ formuliertem Item, sonst Ausschluss
Ein Item hatte nur auf einer Skala geladen, auf der nur ein weiteres Item geladen hat. Deswegen sollte es ausgeschlossen werden.