5. VL Itemanalyse II: Trennschärfe, Itemselektion und Testwertverteilung Flashcards

1
Q

Was ist der wichtigste Itemkennwert?

A

Trennschärfe.
Drückt inhaltlich aus, wie gut ein Item das gleiche Merkmal (Eigenschaft oder Fähigkeit) misst, wie der Rest des Tests.
d.h. hohe Trennschärfe: wenn eine Person gut im Gesamttest ist, dann ist sie auch gut in diesem Item.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie wird die Trennschärfe berechnet?

A

Korrelation zwischen Item- und Testscore: rit

  • Produkt-Moment-Korrleation als Trennschärfe (Item und Skala intervallskaliert)
  • Punktbiserale Korrelation als Trennschärfe (Item dichotom, Skala intervall skaliert)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist eine Korrelation und was ist die Kovarianz?

A

Korrelation beschreibt den Zusammenhang zwischen zwei intervallskalierten Items/Variablen X und Y.

Die Kovarianz beschreibt das Ausmass der gemeinsamen Variation zwischen zwei Variablen oder Items

(Korrelation ist die Standardisierung der Kovarianz)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist die Voraussetzung für eine Produkt-Moment-Korrleation?

A
  • intervallskalierte Items und Skala
  • intervallskalierte Item-Score
  • lineare Beziehung zwischen Item-Score und Test-Score
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Beschreibe das Problem der Autokorrelation.

A

Problem der Autokorrelation bei der Berechnung der Trennschärfe: der Wert des Items geht zweimal in dir Berechnung ein, d.h. die Trennschärfe wird erhöht.

Lösung: Teil-Ganz-Korrektur (Part Whole Korrektur)
Dabei wird der Wert des jeweiligen Items vom Testscore subtrahiert, dieser korrigierte Testscore geht in die Berechnung ein.

Der Einfluss dieser Korrektur ist umso geringer, je grösser die Anzahl der Items und je homogener die Skala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ist die Trennschärfe nach der Teil-Ganz-Korrektur grösser oder kleiner als unkorrigiert?

A

Tiefere Trennschärfe, wenn die Teil-Ganz-Korrektur angewendet wurde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie verhält sich die Trennschärfe bei dichotomen Items?

Was muss man dabei beachten?

A

Wenn es sich um dichotome Items handelt, dann ist die Punkt-Biserale-Korrelation zu wählen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die gewünschte Höhe und Richtung der Trennschärfe?

A

Fisseni für Part-Whole-Korrigierte Trennschärfe:
.50 hoch

Moosbrugg und Kelava: Trennschärfe zwischen .40 - .70 ist “gut”. (allg. Daumenregel: >.50 klar gut)

Je höher die Trennschärfe eines Items, desto mehr wird das Item von Probanden mit hohem Testwert gelöst / symptomatisch beantwortet (und von denen mit tiefem Testwert nicht).

Negative Trennschärfe bedeutet, dass das Item von Probanden mit niedrigem Testwert gelöst / symptomatisch beantwortet wurde (und von denen mit einem hohen TW nicht).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wann ist die beste Differenzierung zwischen Probanden zu erreichen?

A

Unabhängig von seiner Schwierigkeit (ausser P=0 und P=100) könnte jedes Item eine Trennschärfe (rit) von 1 erreichen.
Praktisch treten aber nicht alle Trennschärfen gleich häufig auf.
Am effizientesten sind Items mit P=50 und rit=1, da sie die beste Differenzierung zwischen Probanden ermöglichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind Boden- bzw. Deckeneffekte?

A

Reichen die Itemschwierigkeiten an den Rand der Antwortskala, entstehen Boden- und Deckeneffekte. D.h. man kann nicht mehr differenzieren!

Bodeneffekte: Niemand hat es richtig gelöst
Deckeneffekte: Alle haben es richtig gelöst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie hängen Itemvarianz und Trennschärfe zusammen?

A

Eine hohe Itemvarianz begünstigt eine hohe Trennschärfe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was setzt eine hohe Trennschärfe voraus?

A

Eine hohe Trennschärfe setzt eine hohe Item-Interkorrelation voraus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erkläre die Homogenität:

A

Ziel: Items eines Test erfassen dasselbe Merkmal. Aber verschiedene Items erfassen unterschiedliche Facetten.
Homogenität = Überlappung dieser Facetten.

Die Homogenität ist ein Mass dafür, inwiefern die Items eines Tests dieselbe Eigenschaft erfassen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wo liegt der Unterschied zwischen Homogenität und Trennschärfe?

A

Homogenität: Bezug der Items “unter sich”
Trennschärfe: Bezug eines Items zum Gesamttest

Homogenität ist die Voraussetzung für eine hohe Trennschärfe (aber nicht für einen Test).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Beschreibe die Homogenität im Sinne von…
…Interkorrelation
…Faktorenanalyse
…Rasch-Modell

A

Interkorrelation: Homogenität = Mittelwert der Korrelation, berechnet über Fischer’s z-Transformation.

Faktorenanalyse: basiert auf der Interkorrelationsmatrix. Ordnet Variablen gemäss ihrer korrelativen Beziehung in Gruppen. Jedes Item erhält eine Faktorenladung auf jedem Faktor. Homogene Items laden auf demselben Faktor vergleichsweise hoch.

Im Rasch-Modell kann getestet werden, ob den beobachteten Variablen genau nur ein latentes Konstrukt zugrunde liegt = Homogenität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Itemselektion: Was ist das Ziel und welche Perspektiven gibt es?

A

Ziel: Die “guten” Items für einen Test identifizieren

Perspektiven:

  • Konstrukt (Inhalt): Misst das Item was es messen soll?
  • Durchführung (Zumutbarkeit): Könnte man den Test von 100 z.B auf 20 Items reduzieren?
  • Kosten-Nutzen (Effizienz): Wie differenziert müssen wir ein Konstrukt erfassen?
17
Q

Itemselektion: Was sind die Kriterien?

A

(diese beiden sind 50/50 zu bewerten)

  1. Statistische Kriterien der Itemselektion (Reliabilität, Validität, Schwierigkeitsindex, Trennschärfe)
  2. Inhaltliche Kriterien der Itemselektion (z.B ist ein Zusammenhang sichtbar?)
18
Q

Itemselektion: Erkläre die Statistischen Kriterien der Itemselektion etwas genauer.

A

Ein Item ist in der Regel (jedoch nicht ohne reifliche inhaltliche Überlegung) zu eliminieren bei:

  • einer Trennschärfe unter 0.30 oder im negativen Bereich
  • einer zu hohen oder zu niedrigen Schwierigkeit
  • einer deutlich niedrigeren Streuung als derjenigen der anderen Items –> Reliabilität und Validität

Weitere Überlegungen:
- Häufen sich Items in Schwierigkeitsbereichen an, wo sie gegebenenfalls unerwünscht sind? (z.B 60

19
Q

Itemselektion: Beschreibe die Inhaltlichen Kriterien der Itemselektion etwas genauer.
bzw.
Wann sollte man Items trotz gutem/schlechtem Kennwert beibehalten vs. streichen?

A

Trotz weniger guten Itemkennwerten BEHALTEN wenn..

  • Items als Eisbrecher dienen
  • es das Merkmal besonders anschaulich präsentiert
  • man keine Alternativen mit besseren statistischen Kennwerten hat
  • wenn es extreme Merkmale erfasst

Trotz gutem Itemkennwert STREICHEN:

  • Verzicht auf Items weil genügend andere Items mit gleichem Inhalt vorhanden sind
  • theoretische Einordnung ungenügend
  • Verletzung ethischer Normen
  • Verzerrungstendenzen (soziale Erwünschtheit)
20
Q

Testwertermittlung: Wie kann ein Testwert eines Probandens ermittelt werden?

A

Itemrohwert wird je nach Test aufsummiert oder gemittelt.
Persönlichkeitstest: Skalen- oder Untertestwerte bilden
Leistungstests: Anzahl richtig gelöster Aufgaben

Ratekorrektur (bei Leistungstest): Bei Mehrfachauswahlaufgaben kann ein Item auch durch Raten richtig gelöst werden, hier kann ein Probandenrohwert durch Zufallskorrektur berechnet werden.
(vgl. Formel p- 32)

21
Q

Zähle auf & beschreibe die 3 Masse der zentralen Tendenz!

A
  • Median (Md): Teilt die Stichprobe in 2 gleiche Hälften (50/50)
  • Modalwert (Mo): Der häufigste Wert einer Verteilung (Modus)
  • Arithmethisches Mittel (M): Die an der Stichprobengrösse relativierte Summe der Messwerte
22
Q

Welches sind die 4 Streuungs-/Dispersionsmasse?

A
  • Varianz
  • Standardabweichung
  • Spannweite (Range)
  • Interquartilsabstand
23
Q

Verteilungsanalyse: Was sind die Eigenschaften der Normalverteilung?

A
  • Glockenförmiger Verlauf (Symmetrie)
  • M, Md, Mo sind nahezu identisch
  • zwischen einer Standardabweichung links und rechts vom Mittelwert liegen ca. 95% der Probanden
24
Q

Verteilung: Schiefe

Erkläre die Schiefen und deren Auswirkung

A
Linksschiefe Verteilung (Sch  0): Schwieriger Test!
Reihenfolge: Mo - Md - M
25
Q

Beschreibe den Exzess (kurtosis)!

A

Exzess: Mass für die Schmal- oder Breitgipfligkeit einer Verteilung im Vergleich zur Normalverteilung

Exz. 0 = (pos) schmalere / spitzere Verteilung

26
Q

Wofür sind Schiefe und Exzess wichtig?

A

Schiefe und Exzess sind wichtig um die Verteilungsvoraussetzungen von Items zu prüfen, wenn sie weiteren statistischen Analysen unterzogen werden sollen

27
Q

Was sind Ursachen für die Abweichung von der Normalverteilung?

A
  1. Mangelhafte Konstruktion des Tests:
    - Linksschief = Items zu einfach = Deckeneffekt
    - Rechtsschief = Items zu schwer = Bodeneffekt
    - -> Korrektur mit Hilfe von: Ergänzung von Items im unterrepräsentierten Schwierigkeitsbereich oder Normalisierung
  2. Heterogene Stichprobe (Unterstichprobe)
  3. Merkmal ist nicht normalverteilt in der Population (dann wollen wir es auch nicht normalisieren)
28
Q

Erkläre die Normalisierung!

A

Die Testwerte werden so transformiert, dass die Testwertverteilung sich der Normalverteilung annähert.
Damit wird der Einfluss von Ausreissern reduziert.
Annahme: Merkmal ist normalverteilt

Ausgangspunkt bildet hier also eine Testwertverteilung, welche fälschlicherweise (z.b aufgrund von Mängel in der Konstruktion) von der Normalverteilung abweicht.

Achtung: Normalisierung und Normierung sind voneinander abzugrenzen!
Normierung befasst sich mit der Interpretation einer Testwertgruppe im Bezug auf einen Rahmen (normalverteilt)

29
Q

Mit welchen Verfahren bzw. Nichtlinearen Transformationen kann man die Normalisierung machen?

A
  • Square Roots
  • Logarithmisierung
  • Flächentransformation (verteilungsfrei)