Reaktivierung Flashcards

Question

Unterarten der Inhaltsvalidität

Answer 1

1. Übereinstimmungsvalidität/ konkurrente Validität 2. Vorhersagevalidität/ Prognostischevalidität 3. Inkrementelle Validität

Answer 2

1. konvergente Validität 2. diskiminante Validität

Answer 3

= Unter Inhaltsvalidität versteht man, wie repräsentativ die Items/Aufgaben eines Tests/Fragebogens für das zu messende Merkmal sind.

Answer 4

= Unter Kriteriumsvalidität versteht man den Zusammenhang zwischen dem Testergebnis und konkreten Leistungen oder Verhaltensweisen außerhalb der Testsituation.

Answer 5

= Unter Konstruktvalidität versteht man empirische Belege dafür, dass ein Test das [theoretische] Konstrukt erfasst, welches er messen soll – und nicht ein anderes.

Answer 6

= Inhaltsvalidität

Answer 7

= Übereinstimmungsvalidität/ konkurrente Validität

Answer 8

= Vorhersagevalidität/ prognostische Validität

Answer 9

= inkrementelle Validität

Answer 10

= konvergente (Konstrukt-)Validität

Answer 11

= diskriminante (Konstrukt-)Validität

Answer 12

Richtige Aussagen zu Normen

Answer 13

- Äquivalentnormen - Abweichungsnormen (= Variabilitätsnormen) - Prozentrangnormen

Answer 14

= Bsp für Äquivalentnormen

Answer 15

= Abweichungsnormen

Answer 16

= Prozentrangnormen

Answer 17

= Ein Verfahren kann nur reliabel/zuverlässig sein, wenn es objektiv ist

Answer 18

= Ein Verfahren kann nur valide sein, wenn es zuverlässig ist (ein unzuverlässiger Test misst bei wiederholten Messungen Verschiedenes – er misst also nicht nur das, was er messen soll) => Nur wenn möglichst wenig Messfehler in den Testwerten enthalten sind (hohe Reliabilität), dann enthalten die Testwerte viel wahre Information, die bestenfalls dem zu messenden Konstrukt entspreche (= Validität eines Tests)

Answer 19

= Nur ein valider Test misst, was er messen soll und eignet sich entsprechend zur Vorhersage von Kriterien. Sind diese praktisch relevant, dann hat ein Test auch einen Nutzen.

Answer 20

- Testverlage (Testverfahren) - Repositorien (Open-Source angebote für Testverfahren)

Answer 21

= Testothek

Answer 22

Im weiten Sinne ist das ein Oberbegriff für alle psychologisch-diagnostischen Verfahren, die beim psychologischen Diagnostizieren eingesetzt werden.

Answer 23

- Es werden auf standardisierte Art und Weise Leistungsmerkmale (Fähigkeiten, Fertigkeiten und/oder Wissen) erfasst. - Es gibt richtige und falsche Antworten. - Es wird maximal mögliches Verhalten erfasst (im Gegensatz zu Persönlichkeitsfragebogen, in denen typischerweise gezeigtes Verhalten erfasst wird).

Answer 24

- Speed- vs. Power-/Niveautests - Tests zur Erfassung von Fähigkeiten vs. Fertigkeiten vs. Wissen - Aufmerksamkeitstests vs. Konzentrationstests vs. Intelligenztests

Answer 25

- frei/unsystematisch vs. systematisch - direkt vs. indirekt - in natürlicher Umgebung/im Feld vs. im Labor - verdeckt vs. offen - teilnehmend vs. nicht teilnehmend - Selbst- vs. Fremdbeobachtung

Answer 26

- systematisch (Erklärung: Es wird Ratingverfahren verwendet.) - direkt (Erklärung: Die Beobachter*innen raten in der Beobachtungssituation und nicht anhand von Videoaufnahmen.) - im Labor (Erklärung: Ein Assessment Center ist eine Laborsituation.) - offen (Erklärung: Die Bewerber*innen wissen, dass sie an einem Assessment Center teilnehmen und von den Beoachter*innen im Raum bewertet werden.) - nicht teilnehmend (Erklärung: Die Beobachter*innen nehmen nicht an den Aufgaben teil.) - Fremdbeobachtung (Erklärung: Die Beobachter*innen beobachten die Bewerber*innen.)

Answer 27

- Implizite/indirekte Maße - Projektive Verfahren

Answer 28

- apparative Tests: siehe Folie 35 in den Vorlesungsfolien zur Sitzung 09 - psychophyiologische Methoden: siehe Folie 37 in den Vorlesungsfolien zur Sitzung 09

Answer 29

- Psychometrische Einzelfalldiagnostik behandelt die Frage, in welchem Bereich der wahre Wert einer Person in einem Merkmal liegt. - Zentrale Begriffe der psychometrischen Einzelfalldiagnostik sind beispielsweise Standardmessfehler und Sicherheitswahrscheinlichkeit. - Im Rahmen der psychometrischen Einzelfalldiagnostik werden individuelle Befunde zufallskritisch beurteilt.

Answer 30

- Konfidenzintervall = Das Konfidenzintervall gibt den Bereich an, in dem der wahre Testwert einer Person bei einer zuvor festgelegten Sicherheits- bzw. Irrtumswahrscheinlichkeit liegt. - kritische Differenz = Nötig zum Vergleich zweier Testwerte innerhalb einer Person (z.B. eines multidimensionalen Intelligenztests -> verbal, figural, numerisch) oder zwischen mehreren Personen (z.B. Auswahlverfahren) = > Gibt an, wie groß eine Differenz sein muss, um nicht alleine mit dem Messfehler erklärt werden zu können

Answer 31

- Je höher die Reliabilität eines Tests, desto enger das Konfidenzintervall und desto kleiner die kritische Differenz. (Erklärung: Bei einer höheren Reliabilität ist der Messfehler entsprechend geringer, sodass das Konfidenzintervall schmaler und die kritische Differenz kleiner sein können.) - Je geringer die Sicherheitswahrscheinlichkeit, desto enger das Konfidenzintervall und desto kleiner die kritische Differenz. (Erklärung: Je weniger sicher man sich sein "möchte", dass der wahre Wert im Konfidenzintervall liegt und die gefundene Differenz signifikant [also nicht durch Messfehler verursacht ist], desto schmaler kann das Konfidenzintervall und kleiner kann die kritische Differenz sein.) - Je höher die Irrtumswahrscheinlichkeit, desto enger das Konfidenzintervall und desto kleiner die kritische Differenz. (Erklärung: Irrtumswahrscheinlichkeit ist das Gegenstück zur Sicherheitswahrscheinlichkeit. Die Irrtumswahrscheinlichkeit beträgt beispielsweise 5% bei einer 95% Sicherheitswahrscheinlichkeit und 10% bei einer 90% Sicherheitswahrscheinlichkeit. Es gilt im Prinzip die gleiche Erklärung wie bei einer geringeren Sicherheitswahrscheinlichkeit.)

Answer 32

1. Überprüfung der Profilreliabilität: Wenn diese mindestens .50 beträgt, kann man mit der Profilinterpretation fortfahren. Einflussgrößen sind die Reliabilitäten der einzelnen Subtests, die im Profil vorkommen und die Interkorrelationen der Subtests im Profil. Je höher die Reliabilitäten der Subtests und je geringer die Interkorrelationen der Subtests, desto höher ist die Profilreliabilität. 2. Berechnung der Profilhöhe (Mittelwert der Profilpunkte) und zufallkritische Absicherung der Profilhöhe (Konfidenzintervall der Profilhöhe; Einflussgrößen sind die Reliabiltät der Subtests und die gewählte Sicherheitswahrscheinlichkeit), um einen Überblick über die mittlere Höhe/Lage des Profils zu bekommen. 3. Zufallkritische Absicherung der Profilstreuung: Hier wird überprüft, ob die in einem Profil gefundene Streuung „echt“ ist oder ob sie vor allen auf Messfehler basiert (geprüft wird mittels Chi-Quadrat-Test). Ist der empirische Chi-Quadrat-Wert größer als der kritische Chi-Quadrat-Wert, liegt ein echtes Profil vor und der nächste Schritt der Profilinterpretation kann durchgeführt werden. 4. Überprüfung der Profilgestalt: Mittels paarweiser Vergleiche einzelner, ausgewählter Profilpunkte (je nach Fragestellung und psychologischer Fragen) können unter Verwendung der kritischen Differenz besonders hoch oder gering ausgeprägte Profilwerte identifiziert werden.

Answer 33

- klinische Urteilsbildung - mechanische Urteilsbildung - statistische Urteilsbildung

Answer 34

= klinische Urteilsbildung

Answer 35

= mechanische Urteilsbildung

Answer 36

= statistische Urteilsbildung

Answer 37

- Nutzen für Institution (das Unternehmen) - Annahmequote ist festgelegt (es ist eine offene Stelle) - Behandlung ist multipel (verschiedene Maßnahmen werden durchgeführt) - Ablehnungen sind möglich (ja, es finden Ablehnungen von Bewerber*innen statt) - multivariate Informationsdimension (mehrere Informationsdimensionen werden genutzt; z.B. fachliche Qualifikation, Intelligenz, Teamfähigkeit) - investigatorische Entscheidung (es ist ein mehrstufiges Entscheidungsverfahren)

Answer 38

- Nutzen für Individuum (die Klient*innen) - Annahmequote ist variabel (allen Klient*innen wird in dieser Form geholfen) - Behandlung ist multipel (verschiedene Maßnahmen werden durchgeführt) - Ablehnungen sind nicht möglich (allen Klient*innen wird in dieser Form geholfen; niemand wird abgewiesen) - multivariate Informationsdimension (z.B. multidimensionalen Intelligenztests, Beruflichen Interessenstests und Erfahrungen an verschiedenen Schnupperarbeitstagen) - investigatorische Entscheidung (es ist ein mehrstufiges Entscheidungsverfahren)

Answer 39

- kompensatorisches Modell mit Gleichgewichtung der Prädiktoren - kompensatorisches Modell mit Un-Gleichgewichtung der Prädiktoren - kompensatorisches Modell mit Oder-Strategie - konjuktives Modell (Und-Strategie)

Answer 40

- einstufiges (terminales) Vorgehen: nichtsequentielle Batterie - einstufiges (terminales) Vorgehen: Single Screen (Einzeltest) - Sequentielles (mehrstufiges, investigatorisches) Vorgehen: Vorauswahl-Strategie (Pre-reject-Strategie) - Sequentielles (mehrstufiges, investigatorisches) Vorgehen: Vorentscheidungs-Strategie (Pre-accept-Strategie) - Sequentielles (mehrstufiges, investigatorisches) Vorgehen: Vollständige sequentielle Strategie

Answer 41

- Entscheidungsmodell = kompensatorisches Modell mit Gleichgewichtung der Prädiktoren - Entscheidungsstrategie = nichtsequentielle Batterie

Answer 42

- Relativer Anteil der Personen, die tatsächlich das Kriterium erfüllen, gemessen an der Gesamtzahl der Personen - Grundrate, [natürlicher] Eignungsquotient, Eignungsquote

Answer 43

- Relativer Anteil an Personen, der ausgewählt wird, gemessen an der Gesamtzahl an Personen - Anteil an Personen, die den Grenzwert im Test überschreiten

Answer 44

- Anteil richtiger Entscheidungen an allen Entscheidungen

Answer 45

- Trefferquote - Anteil der „richtig“ Positiven in der Gruppe der Geeigneten/Kranken

Answer 46

- Anteil der „richtig“ Negativen in der Gruppe der Ungeeigneten/Gesunden

Answer 47

- Anteil der „richtig“ Positiven an den als positiv/geeignet/krank Diagnostizierten

Answer 48

- Anteil der „richtig“ Negativen an den als negativ/ungeeignet/gesund Diagnostizierten

Answer 49

= Alle gelisteten Verfahrensgruppen fallen unter diesen Oberbegriff.

Answer 50

= Testtheorien bieten eine Erklärung bzw. ein Grundprinzip, wie gezeigtes Verhalten in einem Test mit dem dahinterliegenden Konstrukt in Beziehung steht

Answer 51

= Die Summe bzw. der Mittelwert der Itemantworten entspricht der Schätzung des wahren Wertes einer Person in einem gemessenen Merkmal.

Answer 52

1. Testplanung 2. Konstruktion der Items 3. Erstellung der vorläufigen Testversion 4. Überprüfung der vorläufigen Testversion inkl. Revision(en) 5. Empirische Überprüfung inkl. Revision(en) 6. Normierung und/oder Bestimmung Cut-Off-Wert

Answer 53

1. Sicherstellung relevanter Vorbedingungen 2. Adaptation des Tests (Items, Instruktion und Antwortanker) 3. Erstellung der vorläufigen Testversion 4. Überprüfung der vorläufigen Testversion inkl. Revision(en) 5. Empirische Überprüfung inkl. Revision(en) 6. Normierung und/oder Bestimmung Cut-Off-Wert

Answer 54

1. Eingrenzen des Konstruktes (Definition, Indikatoren, Merkmalsart) 2. Testart festlegen 3. Testanwendungsbereich bestimmen 4. Geltungsbereich und Zielgruppe festlegen 5. Strukturellen Aufbau überlegen 6. Testlänge und -zeit 7. Administration

Answer 55

- Ein nomologisches Netz stellt ein Beziehungsgeflecht zwischen (latenten) Konstrukten und beobachtbaren Testvariablen dar. Die beiden Ebenen werden mit theoretischen Annahmen bzw. empirischen Evidenzen beschrieben und durch Korrespondenzregeln miteinander verbunden - Unter einem nomologischen Netzwerk werden Aussagen oder Gesetze verstanden, die die Beziehung zwischen (a) beobachtbaren Merkmalen, (b) theoretischen Konstrukten und Beobachtbarem oder (c) verschiedenen theoretischen Konstrukten beschreiben. Es kann sich dabei um feste, deterministische Zusammenhänge handeln oder auch um statistische. - Ein nomologisches Netz beschreibt also, welche Anknüpfungspunkte und Überlappungsbereiche das interessierende Konstrukt mit anderen Konstrukten hat. Es zeigt, welche anderen Konstrukte "verwandt" mit dem interessierenden Konstrukt sind bzw. Ähnlichkeiten aufweisen, aber dennoch inhaltlich verschieden sind.

Answer 56

- Das nomologische Netz gibt Hinweise darauf, wo das interessierende Konstrukt "anfängt und aufhört". - > Damit erhält man im Rahmen der Testentwicklung wichtige Hinweise für die Validierung eines Tests. Beispielsweise soll ein Intelligenztest Intelligenz erfassen, aber nicht Konzentration, obwohl Konzentration natürlich einen Einfluss auf die Testleistung haben kann. In der Validierungsstudie würde man also zwischen einem Intelligenztest und einem Konzentrationstest positive Korrelationen erwarten, die aber nicht allzu hoch sein dürfen.

Answer 57

- qualitativ vs. quantitativ - unidimensional vs. multidimensional - zeitlich stabil vs. veränderbar

Answer 58

- Breite des gemessenen Merkmals/der gemessenen Merkmale - Menge an vorhergesagten Kriterien

Answer 59

- Je breiter der Geltungsbereich, desto mehr Informationen müssen erfasst werden und desto schwieriger wird es, alle Informationen in einem unidimensionalen Testwert auszudrücken. - Es ist testtheoretisch besser, den Geltungsbereich eng zu definieren und auf nur ein Kriterium zu fokussieren.

Answer 60

= Auswertungsobjektivität kann umso mehr eingeschränkt sein, je länger die Antworten sind.

Answer 61

- Aufgabenart 1: Ordnungsaufgaben Unterart 1: Zuordnungsaufgaben Unterart 2: Umordnungsaufgaben - Aufgabenart 2: Auswahlaufgaben Unterart 1: dichotome Aufgaben Unterart 2: Mehrfachwahlaufgaben - Aufgabenart 3: Beurteilungsaufgaben Unterart 1: Analogskala-Aufgaben Unterart 2: Ratingskala-Aufgaben

Answer 62

- Vorteil - Ergänzungsaufgaben verlangen hauptsächlich die Reproduktion von Wissen. RICHTIG: Vorteil - Ergänzungsaufgaben verlangen hauptsächlich die Reproduktion von Wissen - Nachteil - Ordnungsaufgaben verlangen nur eine Wiedererkennensleistung.

Answer 63

- Intuitiv - Rational/deduktiv - External/kriteriumsorientiert/ kriteriumsbezogen - Internal/faktorenanalytisch/induktiv - Prototypenansatz

Answer 64

_ Rational/deduktiv (Erklärung: Das Messinstrument wurde basierend auf einer Theorie/einem Modell zu Intelligenz entwickelt.)

Answer 65

= External/kriteriumsorientiert/ kriteriumsbezogen (Erklärung: Es wurden diejenigen Items ausgewählt, die zwischen den im Beispiel relevatem Personengruppem diskriminieren können.)

Answer 66

Prototypenansatz (Erklärung: Es wurde der Act-Frequency-Approach verwendet.)

Answer 67

- RICHTIG: Oftmals werden im Rahmen einer Testkonstruktion mehrere Konstruktionsstrategien angewendet. (Erkärung: Um die verschiedenen Vorteile der einzelnen Konstruktionsstrategien zu nutzen und die verschiedenen Nachteile auszugleichen, lohnt es sich mehrere Strategien miteinander zu kombinieren. In unterschiedlichen Konstruktionsphasen können also unterschiedliche Strategien zur Anwendung kommen. Siehe auch Ausführungen im Video zur Folie 27 der Vorlesung 2 Sitzung 4) - RICHTIG: Keine der Konstruktionsstrategien ist grundsätzlich besser als die anderen. (Erklärung: Je nach spezifischer Sachlage während der Entwicklung eines Tests können einzelne Strategien mehr oder weniger geeignet sein [z.B. Vorliegen einer Theorie oder neues Forschungsfeld].)

Answer 68

= Doppelte Verneinung (Erklärung: "nicht" und "kein" kombiniert, um auszusagen, dass man häufig gut zuhören kann.)

Answer 69

= Unklare Zeitspanne (Erklärung: "in letzter Zeit" wird von unterschiedlichen Personen unterschiedlich lang verstanden [z.B. in den letzten 4 Wochen, in den letzten 3 Monaten].)

Answer 70

= Komplizierte Satzkonstruktion (Erkärung: zu viele Kommata und Verschachtelungen)

Answer 71

= soziale Erwünschtheit

Answer 72

= Akquieszenz/ja-Sage-Tendenz/ Zustimmungstendenz

Answer 73

= Tendenz zur Mitte

Answer 74

= Tendenz zum extremen Urteil

Answer 75

= Ankereffekte

Answer 76

= Konsistenzeffekte/Assimilationseffekte

Answer 77

= Kontrasteffekte

Answer 78

= Substraktionseffekte

Answer 79

= Testlet-Effekte

Answer 80

- Aufklärung über Untersuchungsgegenstand und Belohnung von Ehrlichkeit (z.B. Feedback ist nur dann sinnvoll nutzbar) - Zusicherung der Anonymität (keine Weitergabe personalisierter Daten an Dritte)

Answer 81

- Invertierung von Items (ABER: Methodeneffekte [artifizielle Faktorstruktur] möglich) - mehr Antwortalternativen als nur ja/nein - Pausen einplanen, um Ermüdung der Testpersonen zu vermeiden - Befragung so persönlich wie möglich und sinnvoll gestalten

Answer 82

- Keine neutrale [Mittel-]Kategorie - Nicht zu extreme Bezeichnungen der Pole - „Weiß nicht“-Kategorie anbieten - auf gut passende Antwortalternativen achten

Answer 83

- Items verschiedener Dimensionen randomisieren - Pufferaufgaben - Ausbalancierung der Reihenfolge

Answer 84

- Reihenfolge der Items beachten (erst allgemein, dann spezifisch) - Items nicht direkt nacheinander

Answer 85

- oft nicht direkt zu vermeiden, aber: Kontrolle des Effekts mittels entsprechender psychometrischer Testlet-Modelle - erst leichte Items, dann schwierigere Items präsentieren

Answer 86

= retrospektive Befragung

Answer 87

= Debriefing

Answer 88

= Verhaltenskodierun/behavior decoding

Answer 89

= Kognitives Vortesten - Think aloud method

Answer 90

= Kognitives Vortesten - Probing

Answer 91

= Itemschwierigkeit, Itemvarianz, Trennschärfe

Answer 92

- Itemschwierigkeit gibt den Anteil von Personen an, die ein Item lösen. - Itemschwierigkeit ist stichprobenabhängig.

Answer 93

Die Itemvarianz hängt eng mit der Itemschwierigkeit zusammen.

Answer 94

- Extrem trennscharfe Items führen zu hoch reliablen Skalen, deren Validität jedoch beeinträchtigt sein kann.

Answer 95

- Die Trennschärfen sollten Werte zwischen .40 und .70 haben.

Answer 96

- Reliabilität, Testwerteverteilung und Validität der Skala/Skalen des neuen Tests

Answer 97

- Mittelwert (M), Standardabweichung (SD), Minimum (Min) und Maximum (Max), Schiefe (S) und Kurtosis (K; bzw. Exzess) der Skala/Skalen des neuen Tests

Answer 98

- Mittelwert (M): nahe dem Skalenmittelwert, denn das bedeutet, dass der Test insgesamt im mittleren Schwierigkeitsbereich liegt und somit potenziell sehr gut zwischen Personen unterschiedlicher Merkmalsausprägungen gut differenzieren kann (das gilt aber nur, wenn man sicher stellt, dass die Items unterschiedliche Schwierigkeitsindices aufweisen, die in einem Bereich zwischen 20 und 80 liegen) - Standardabweichung (SD): abhängig vom Antwortformat, im Vergleich zu ähnlichen Messinstrumenten möglichst gleich hoch oder höher; wir wollen ja viel Varianz in den Daten, da dies darauf hinweist, dass sich die Versuchspersonen in ihrer Merkmalsausprägung unterscheiden - Minimum (Min) & Maximum (Max): entsprechend kleinster & größter Antwortalternative; stellt sicher, dass keine Varianzeinschränkung (z.B. Bodeneffekte, Deckeneffekte, Tendenz zur Mitte) vorliegt; wir wollen ja, dass der potenziell mögliche Wertebereich unser Testwerte ausgeschöpft ist - Schiefe (S) & Kurtosis (K; K-3 = Exzess): S/SDS & K/SDK = ±2 bzw. S & K = ±1; bei normalverteilten Merkmalen möchten wir auch normalverteilte Daten und diese Kennwerte weisen auf normalverteilte Daten hin

Answer 99

- Überprüfung der Konstruktvalidität (faktorielle Validität) - Kritik an KTT: Trennschärfe reicht nicht aus, um zu überprüfen, ob Items eines Tests das gleiche Merkmal messen und ob sich mehrere Skalen auch empirisch voneinander trennen lassen - Das prüft aber die Faktorenanalyse

Answer 100

= Faktorladung

Answer 101

= Kommunalität

Answer 102

= Eigenwert

Answer 103

= Faktorwert

Answer 104

= Bei der PFA wird angenommen, dass Variablen wahre Varianz und Fehlervarianz aufweisen.

Answer 105

- Je feinstufiger die Norm sein soll, desto größer muss die Stichprobe sein. - Je höher die Reliabilität ist, umso feinstufiger können die Normen sein.

Answer 106

= Für jeden potentiellen Schwellenwert werden Sensitivität und Spezifität berechnet. Mit Hilfe des Youden-Index kann man den optimalen Schwellenwert identifizieren.

Answer 107

= Rater*innen müssen die Wahrscheinlichkeit einschätzen, mit der eine MAP eine Aufgabe richtig löst.

Answer 108

- Es ist unklar, ob es gerechtfertigt ist, die Reaktionen auf verschiedene Items zu einem Testwert zusammenzufassen, denn dies setzt voraus, dass alle Items dasselbe Merkmal messen und kein anderes. Diese Voraussetzung ist erfüllt, wenn Itemhomogenität vorliegt. Die Analysen entsprechend der KTT im engen Sinne überprüfen das Vorliegen von Itemhomogenität nicht. Es wird nur geprüft, ob die Items miteinander korrelieren. - Die Axiome der KTT sind nicht überprüfbar. Aufgrund der Verwendung mathematischer Gleichungen/Funktionen zur Abbildung der Annahmen über die Beziehung zwischen dem manifesten Antwortverhalten in den Items und der Ausprägung im latenten Trait im Rahmen der IRT, liegen empirisch überprüfbare Annahmen vor.

Answer 109

= RICHTIG: Itemhomogenität bedeutet, dass das Antwortverhalten in verschiedenen Items eines Tests ausschließlich von der zugrunde liegenden latenten Variablen systematisch beeinflusst wird.

Answer 110

= Der individuelle Testwert wird im Rahmen der Analysen in Form des Personenparameters iterativ geschätzt

Answer 111

= RICHTIG: Auf Basis sich wiederholender Personenfähigkeitsschätzungen wird aus einer großen Zahl kalibrierter Items dasjenige Item vorgegeben, das die höchste Iteminformation enthält.

Answer 112

= Es liegen Daten vor zu einem Testverfahren, das von vielen Probanden ausgefüllt wurde. Im Ausgangsdatensatz sind die Personen in den Zeilen und die Items in den Spalten.

Answer 113

- Mittels der in der vorherigen Frage/Antwort beschriebenen Stichprobe (oder auch für Substichproben) werden die Personen- und Itemkennwerte nach KTT und IRT berechnet. - Die ermittelten Personen- und Itemkennwerte aus KTT und IRT werden miteinander korreliert; je höher die Korrelation, desto vergleichbarer die Kennwerte.

Answer 114

= RICHTIG: Die gemäß KTT und IRT ermittelten Personenkennwerte sind deutlich vergleichbar.

Answer 115

- Immer dann, wenn ein Test entwickelt werden soll, für dessen Überprüfung der Qualität die Vorteile der IRT unabdingbar sind. - Das heißt, wenn man mit dem Test adaptive Testen möchte und/oder Paralleltests (z.B. Form A und B) entwickeln möchte und/oder einen Test für internationale Vergleichsstudien entwickeln möchte.