4. VL Testkonstruktion III: Itemformulierung und Itemkonstruktion I: Schwierigkeitsindex und Itemvarianz Flashcards

1
Q

Nenne die 5 Kriterien zur Itemformulierung.

A
  1. Sprachliche Formulierung
  2. Sprachliche Verständlichkeit
  3. Schwierigkeit der Items
  4. Eindeutigkeit des Inhalts
  5. Eindeutigkeit hinsichtlich des Konstruktes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  1. Sprachliche Formulierung: Nenne die 5 Kategorien
A
  • indirekte > direkte Frage
  • tatsächlicher > hypothetischer Sachverhalt
  • konkrete / abstrakte Frage (konkrete sind leider situationsabhängig dafür führen abstrakte zu Fehleinschätzungen)
  • personalisiert > depersonalisiert
  • Stimulusqualität (Extremität, Suggestion, Wertung ect.) & Aktualität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Sprachliche Verständlichkeit: Nenne die 6 Grundsätze
A
  1. Zu komplizierte oder umständliche Satzkonstruktionen vermeiden
  2. Möglichst kurz, aber präzise
  3. Verneinungen (&Doppelverneinungen) vermeiden
  4. Intensitäts- und Häufigkeitsangaben vermeiden
  5. Wichtiges Fettdrucken, Unterstreichen oder Ähnliches
  6. Fachbegriffe & Akronyme möglichst vermeiden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Schwierigkeit der Items: Beschreibe
A

Wichtig: Um Unterschiede in Ausprägungen eines Merkmals zu messen, benötigt es Varianz im Antwortverhalten. Daher sind zu extrem formulierte Items ungeeignet, aber auch solchen, die von allen verneint oder bejaht werden können.
Ausnahme: selten auftretendes Merkmal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. Eindeutigkeit des Inhalts: Nenne die 5 Grundsätze
A
  1. Zu allgemeine oder vage Aussagen vermeiden
  2. Begriffe mit mehreren Bedeutungen vermeiden
  3. Pro Item nur eine Aussage (keine double barrel)
  4. Zeitpunkt oder Zeitspanne eingrenzen
  5. Verallgemeinerungen vermeiden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  1. Eindeutigkeit hinsichtlich des Konstrukts: Welche Hauptfrage stellt sich?
A

Kann man Zustimmung/Ablehnung klar im Sinne einer höheren oder niedrigeren Ausprägung des im Gesamttest erfassten Konstrukts interpretieren?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist bei der Zusammenstellung eines Tests zu beachten? (3)

A
  1. Reihenfolge von Skalen
    - Skalen für Konstrukte nicht auseinander nehmen
    - allgemeine vor spezifischen Konstrukten testen
    - thematisch gruppieren
    - counterbalancing
    - Antwortskalen klar bezeichnen
    - demografische Daten am Anfang oder Ende erfassen
  2. Reihenfolge von Items:
    - bei Leistungsaufgaben: Beginn mit leichteren Items
    - bei psychologischen Untersuchungen: Beginn mit neutralen Items
    - Konsistenz- und Aktualisierungseffekt vermeiden (ähnliche Items trennen, Pufferangaben, Instruktionen)
  3. Hinweise in Instruktion:
    - spontan und wahrheitsgetreu antworten
    - nichts überspringen
    - Antwortmodus erklären
    - Anonymität / Vertraulichkeit betonen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist bei den Übersetzungen oder kulturellen Adaptationen zu beachten und wie arbeitet man damit?

A

Zuerst versuchen, eine übersetzte Skala auf Deutsch zu finden und schauen, ob diese psychometrisch überprüft wurde.

Falls keine Übersetzung vorhanden ist, dann sind verschiedene Vorgehensweisen möglich (auch in Kombination):

a) Übersetzen und dann Rückübersetzen - Nichtübereinstimmung korrigieren
b) Zusammenfügen (merging): 2 Personen übersetzen gleichzeitig und man vergleicht dann
c) in Gruppe von Fachexperten übersetzen, diskutieren und sich einigen

–> Dann: Neue Übersetzung psychometrisch überprüfen und in neuer Stichprobe validieren

Merke: Die Person, welche übersetzt muss nicht nur sprachliche Kompetenzen haben, sondern muss auch das Konstrukt verstehen. (Liam und nicht Erin)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was bedeutet Evaluation der Items?

Was ist und was beinhaltet die Itemanalyse im Rahmen der KTT?

A

Evalutation der Items auf Itemebene und dann und auf Testebene.

Itemanalyse: Selektion der Testitem mittels Evaluation auf deskriptiv-statistischer Ebene.

  • psychometrische Item-Eigenschaften als Kennwert bestimmen und anhand vorgegebenen Qualitätsmerkmalen beurteilen.
  • Ziel: Items mit besten psychometrischen Eigenschaften auswählen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was umfasst die Itemanalyse?

Was resultiert aus der Itemanalyse?

A
  • Schwierigkeitsanalyse (Schwierigkeitsindex)
  • Itemvarianz
  • Trennschärfe (VL5)
  • Homogenität (VL5)
  • Analyse der Testwertverteilung (ggf. Normalisierung) (VL5)

–> daraus resultieren Itemselektion und Testrevision

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Warum ist die Schwierigkeit eines Items für einen Test so bedeutend?

Was versteht man unter “symptomatischer Richtung”?

Was ist das Ziel dabei?

A

Ein Test soll Probanden mit hoher Merkmalsausprägung von Probanden mit einer geringen Merkmalsausprägung unterscheiden.
Items, die von allen Probanden richtig gelöst werden werden in symptomatischer Richtung beantwortet und diese tragen dem Ergebnis nichts bei. Ebenso wenig die Items, die von niemandem richtig gelöst werden.

Ziel: Kreieren von Items mit mittlerer Schwierigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Definiere den Schwierigkeitsindex:

A

Der Schwierigkeitsindex einer Aufgabe ist definiert durch die prozentuale Häufigkeit, mit der sie von einer repräsentativen Stichprobe von Probanden richtig beantwortet wird.

Eigentlich ein Leichtigkeitsindex. Denn je grösser der Index ist, desto mehr Personen konnten die Aufgabe richtig beantworten und desto leichter ist das Item.

(Wertebereich: 0-100)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie wird der Schwierigkeitsindex berechnet?

A

NR / Ntotal * 100

NR: N Punkte eines Items (Spaltensumme)
Ntotal: Npersonen * NAntwortmöglichkeiten

(p.15)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Erkläre den Schwierigkeitsindex bei Leistungstests z.B bei einem Speedtest.

Welche Antwortformate gibt es?

Was ist das Problem dabei?

Was ist die Lösung?

A
mögliche Antwortformate: 
R = Richtig
F = Falsch
A = Ausgelassen 
U = Unbearbeitet (keine Zeit mehr gehabt)

Probleme der fehlenden Antworten.
Maximal mögliche Punktzahl sollte nicht im Nenner sein, da sonst die Schwierigkeit überschätzt wird.

Lösung: Inangriffnahme-Korrektur!
Pi: (Nr / Nb) * 100

Nb: Bearbeitet. Dabei werden die A-Antworten dazu gezählt, aber die U-Antworten nicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Erkläre den Schwierigkeitsindex bei einem Niveautest.

Welche Antwortformate gibt es?

Wie wird es berechnet?

Was ist das Problem?

A

mögliche Antwortformate:
R = Richtig
F = Falsch
(keine Zeitbegrenzung und deshalb keine unbearbeiteten)

Daher Formel wieder: (Nr / N) * 100

Problem: Raten
Lösung: Ratekorrektur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Beschreibe die Ratekorrektur:

Was ist die Formel?

Wann muss man sie nicht anwenden?

A

Schwierigkeitsindex muss bei Niveautests für das Raten korrigiert werden, damit die Schwierigkeit nicht unterschätzt wird.
Im Zähler zieht man von den richtigen Antworten die Zahl der richtigen Antworten durch zufälliges Raten ab. (Schätzung)

Pi: Nr - (Nf / k-1) / N * 100

Nicht nötig bei Persönlichkeitstests oder bei MC-Fragen mit mehr als 4 Antwortmöglichkeiten.

17
Q

Erkläre den Schwierigkeitsindex bei einem Persönlichkeitstest.

Wie wird er berechnet?

A

Schwierigkeitsindex bei Persönlichkeitstests: Grad der symptomatischen Antwort, welcher für eine hohe Ausprägung des untersuchten Merkmals spricht.

  1. Schritt: Alle Items in die gleiche Richtung polen
  2. Schritt: S-Index berechnen: erreichte Punkte / max. Punkte *100
18
Q

Exkurs: Was ist Varianz?

Was ist die Standardabweichung?

A

Varianz ist die Summe der quadrierten Abweichungen aller Messwerte vom arithmetischen Mittelwert, dividiert durch die Anzahl aller Messwerte.
Frage: Wie gut beschreibt ein Mittelwert die Daten?
Die Varianz ist der durchschnittliche Fehler zwischen dem Mittelwert und den Beobachtungen.

Problem: Einheiten sind quadriert, daher:
Die Standardabweichung ist die Wurzel aus der Varianz.

19
Q

Wie ist die Itemvarianz definiert?

Bei welcher Schwierigkeit findet man die grösste Differenzierung?

A

Itemvarianz ist die Differenzierungsfähigkeit eines Items hinsichtlich der Probandenstichprobe.

Bei mittlerer Schwierigkeit findet man die grösste Differenzierung.

20
Q

Was ist der gewünschte Schwierigkeitsindex?

A
  • Allgemein grösste Differenzierungsfähigkeit bei mittlerer Schwierigkeit
  • Oft Items mit unterschiedlichen Schwierigkeiten gewünscht, da dadurch die Diskriminierung auf verschiedenen Stufen möglich ist (5 95)
  • Spezialfall: Erfassung von Probanden mit exteremer Merkmalsausprägung
21
Q

Wenn man mehrere Items mit der gleichen Schwierigkeit hat, wie wählt man aus?

A

Bei Items mit derselben Schwierigkeit wählt man dasjenige, mit der höheren Trennschärfe! (hinreichende Trennschärfe ist wichtig)
Aber auch auf menschliche Faktoren achten.

22
Q

Was begünstigen grosse Merkmalsstreuungen?

A

Grosse Merkmalsstreuungen begünstigen hohe Korrleationen, also günstige Voraussetzungen für Trennschärfe und Homogenität der Skala.

23
Q

Was ist weiter bei Speed- und Powertests zu beachten?

A

Speedtest: grosse Anzahl leichter Items

Powertest: manchmal Anordnung nach ansteigender Schwierigkeit