W8: Empirische Überprüfung Testentwurf, Schwierigkeitsanalyse, Trennschärfe Flashcards

Question

Beschreibe das Beispiel aus den Folien Vergleich Eichstichprobe (verschiedene Personen) vs. psychiatrische Vergleichsgruppe mit den Items Klossgefühl, Kurzatmigkeit, Schwächegefühl etc. mit Antwortformat 3=stark, 2=mässig, 1=kaum, 0=gar nicht

Answer 1

Die Werte (Mittelwerte, Standardabweichung und Trennschärfte) sind bei der psych. Vergleichgruppe allg. höher. Höhere Mittelwerte: die Personen aus der psych. Vergleichsgruppe haben erwartungsgemäss stärkere, öftere und höhere Klossgefühle als die Eichstichprobe. Die Schwierigkeiten werden psychometrisch höher, sprich die psych. Gruppe konnte den Items leichter zustimmen. Höhere Standardabweichungen: Innerhalb der psych. Gruppe gibt es grössere "Schwankungen". D.H. es gibt Personen, welche keine Klossgefühle haben, einige aber sehr stark. Wir haben hier eine grössere Varianz. Höhere Trennschärfe (Korrlationskoeffizient): Die Varianzen in den psych. Gruppe sind grösser.

Answer 2

Aussage über Items der eigenen Skala. Wie gut misst ein einzelnes Item die angestrebte Fähigkeit oder Eigenschaft?

Answer 3

Berechnung der Korrelation zwiscen dem einzelnen Item und der Summe aller anderen Items der entsprechenden Skala. Part-Whole-Korrektur: das eigene Item muss bereinigt werden resp. darf nicht eingerechnet werden, ansonsten würde dies das Resultat verzerren. Korrigiert man das nicht, kommt es zu einer Überschätzung.

Answer 4

Das Item repräsentiert das Konstrukt oder die Skala perfekt - guter Repräsentator Angestrebt werden möglichst hohe Trennschärfekoeffizienten. Unter .30 sind sie sehr niederig.

Answer 5

Grad der Gemeinsamkeit dessen, was durch die Aufgabe durch den gemeinsamen Test gemessen wird (Aufgaben müssen so gestaltet sein, dass sie eine sinnvolle Unterscheidung zwischen Testpersonen ermöglichen) Zahl der möglichen interindividuellen Differenzierungen, die eine Aufgabe treffen kann (n+1)

Answer 6

Hohe Trennschärfen begünstigen hohe Reliabilitäten

Answer 7

Bei mittleren Schwierigkeiten bei den Aufgaben

Answer 8

Bei Aufgaben mittlerer Schwierigkeit können mehr Unterscheidungen gemacht werden als in den extremen Bereichen, dies begünstigt (aber garantiert nicht!!!) höhere Trennschärfekoeffizienten: N = 100 Personen haben einen Test bearbeitet Aufgabe A: von 50% der Personen gelöst = 50 x 50 = 2'500 Unterscheidungen Aufgabe B: von 20% der Personen gelöst = 20 x 80 = 1'600 Unterscheidungen Aufgabe C: von 5% der Personen gelöst = 5 x 95 = 475 Unterscheidungen Aufgabe D: von 1% der Personen gelöst = 1 x 99 = 99 Unterscheidungen

Answer 9

- Varianz: ist dann ein Problem, wenn ein Teil der Stichprobe Items anders beantwortet als der andere Teil. Bei dichtomen Items ist die Varianz direkt abhängig von der Itemschwierigkeit - Ausreisserwerte: können Korrelation unnatürlich in die Höhe treiben - Verteilungen: Angesprochen sind v.a. Items in den Randbereichen der Verteilung. Wir können aber nicht auf Items mit unterschiedlichen Verteilungen verzichten, da wir in der Diagnostik auch in extremen Bereichen messen wollen - Homogenität: in homogenen Stichproben (Leute sind sich sehr ähnlich) ist die Varianz der Messwerte eingeschränkt - Selektionskennwert: bei dichotomen Items spielt der Schwierigkeitsindex eine wichtige Rolle. Bestimmung des Selektionswert, dadurch wird die Trennschärfe von Items mit extremer Schwierigkeit nach oben korrigiert - Schwierigkeit!

Answer 10

Können vorkommen, bspw. bei ungeeigneten Items. Z.b. wenn Items nich umgepolt werden (geht oftmals vergessen)

Answer 11

Aussage über Beziehung eines Items zu einem (externen) Kriterium. Eine niedrige Fremtrennschärfe kann auch bedeuten, dass die Items besonders schwierig (von wenig Teilnehmer*innen gelöst) sind, ggf. kann es dann sinnvoll sein, diese weiterhin beizubehalten, um im oberen Leistungsbereich gut differenzieren zu können

Answer 12

- obwohl mittlere Itemschwierigkeiten optimal sind - sollte ein Test dennoch leichte und schwierige Items enthalten (z.B.: wenn ein Test kreieren und nur sagen wollen, ob jemand bestanden oder nicht bestanden hat - dann sind mittlere Itemschwierigkeitne ok. Aber wenn wir Noten verteilen wollen, müssen wir leichte und schwierige Items abfragen. - gleiche Itemschwierigkeit gehen nicht zwangsweise mit denselben Trennschärfen einher