VL 3: Itemkennwerte Flashcards
P: Definition Schwierigkeitsindex
Der Schwierigkeitsindex P gibt an, wie viel % der Probanden einer
Stichprobe ein Item im Sinne einer höheren Merkmalsausprägung
(also korrekt bzw. positiv) beantwortet haben.
P: Formel
P= (N(R)/N) * 100
- N(R)= Anzahl VPn, die pos. Antworten
- N= Anzahl VPn
P: Wie sollte P sein?
- bei P=100 bzw 0 –> keine Differenzierung, da keine Varianz
- bei P=50 –> max. Differenzierung im mittleren Ausprägungsbereich
- bei P=5 bzw. 95 –> Differenzierung im oberen / unteren Ausürägungsbereich
==> breite Streuung von P anstreben
P: Probleme (Überblick)
- auf P kann nur geschlossen werden, wenn Leistungniveau der VPn bekannt bzw. SP repräsentativ
- Zufallseinfluss muss ausgeschlossen/herausgerechnet werden
- alle Items müssen beantwortet sein (Probl. bei Zeitbegrenzung)
- nur für dichtotome Items
P: Probleme Zeitbegrenzung
- Problem: nicht alle Pbn haben Aufgaben überhaupt bearbeitet –> P nicht einfach bestimmbar
- Lösung: Relativierung der richtigen Antworten an der Anzahl der Pbn, welche Aufg. überhaupt bearbeitet haben
P: Unterschied Speedtest / Powertest
Speedtest (= Geschwindigkeitstest, Schnelligkeitstest)
• Alle Items eines Tests sind so leicht, dass sie bei unbegrenzter
Zeitvorgabe auch gelöst werden können
• Differenzierungen zwischen Probanden erfolgen durch Begrenzung
der Bearbeitungszeit
• Werden häufig bei Konzentrationstests eingesetzt
Powertest (= Niveautest)
• Einige der Items eines Test sind so schwer, dass sie auch bei
unbegrenzter Zeitvorgabe nicht von allen Probanden gelöst werden
können.
• Test misst das intellektuelle Niveau bzw. die „Denkkraft“ (power)
P: Problem Zufallseinfluss
- Problem: Pbn raten, wenn sie die Antwort nicht wissen –> Einfluss vom Zufall muss herausgerechnet werden
- Lösung: Zufallskorrektur –> Abziehen der Pbn, welche nur durch Zufall richtig geraten haben
P: Problem Bewertungsskala
- Problem: ursprüngliche Formel nur bei dichtotomen Variablen anwendbar
- Lösung: niedrigste kategorie muss auf 0 gesetzt werden –> P = (von allen erreichte Punktzahl / von allen erreichbare Punktzahl) *100
r: Definition Trennschärfe
Korrelation zw. Itemscore und Testscore der zugehörigen Skala –> r ist Kennwert für die Übereinstimmung zw. Item und Skala bezüglich der Differenzierunmg der Pbn.
r: wie sollte r sein?
möglichst hoch, da dies für eine hohe Übereinstimmung zw. Item und ganzer Skala steht –> Item ist “besser für den Test”
r: Berechnung
abhängig vom Skalenniveau des Items:
- dichotomes Item –> punkt-biseriale Korrel.
- künstlich dichotomes Item –> biseriale Korrel.
(im Zweifel punkt-biseriale Korrel, da diese konservativer)
- intervallskaliertes Item –> Punkt-Moment-Korrel.
r: Teil-Ganz-Korrektur (part whole correction)
Da ein Item zur Gesamtpunktzahl der Skala beiträgt ist r teilweise eine Korrel. mit sich selbst –> Überschätzung!
–> korrigiert: nur Korrel. zw. Item und Summe restlicher Items.
H: Def. Homogenität
Ausmaß der formalen und inhaltlichen Einheitlichkeit der Items
H: Berechnung
H_Item: mittl. Korr. eines Items mit den anderen Items der Skala
H_insgesamt: mittl. Korr. aller Items einer Skala
(kann häufig auch durch Augenschein abgeschätzt werden)
H: Wie soll H sein?
- Skala soll eng umschriebenes Merkmal erfassen –> homogen –> großes H
- Skala soll breites Merkmal erfassen –> heterogen –> kleines H