05 Itemanalyse und Item-Response-Theorie Flashcards

1
Q

Was drückt die Itemschwierigkeit aus?

A

drückt aus, wie schwer oder leicht eine Aufgabe ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist mit Lösungs- bzw. Zustimmungsrate gemeint und wie formuliert man sie als Formel?

A

= Anteil an Personen, die ein Item i richtig lösen

pi = Ri / Ni

Ri = Anteil richtiger Antworten
Ni = Gesamtzahl der Antworten

Bsp: 15 von 20 SuS haben Aufgabe richtig beantwortet:

pi = 15/20 = 0.75

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was bedeuten die Werte 0 und 1 bei der Lösungs- bzw. Zustimmungsrate?

A

0 = niemand konnte Aufgabe lösen
1 = alle konnten die Aufgabe lösen

–> kleine Werte = schwer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie berechnet sich die Itemschwierigkeit bei Aufgaben, in denen mehr als ein Punkt erreicht werden kann?

A

pi = x bar / xmax

x bar = Mittelwert des Items
x max = maximale Anzahl von Punkten, die erreicht werden kann

Beispiel:
In einer Klausur kann man für eine Aufgabe maximal 3 Punkte erreichen. In einer Klassenarbeit war die durchschnittlich erreichte Punktzahl 2.4.

pi = 2.4/3 = 0.8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Itemschwierigkeit sollte in Tests verwendet werden?

A
  • sehr leichte oder schwere Items sind wenig informativ
    –> p = 0.5 optimal
  • hier werden Fähigkeitsausprägungen besonders differenziert erfasst
  • Test sollte breite Streuung von Itemschwierigkeiten umfassen (0.2-0.8)
  • Dadurch ist es möglich, im unteren und oberen Fähigkeitsbereich zu differenzieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie sieht eine Item-charakteristische Funktion in Bezug auf die Lösungswahrscheinlichkeit und die Information aus?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was gibt die Steigung der Kurve bei einer Item-charakteristischen Funktion an?

A

Gibt an, wie informativ das Item an verschiedenen Stellen des Fähigkeitsspektrums ist.

Je trennschärfer ein Item ist, desto steiler steigt seine item-charakteristische Funktion an

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie ist die Trennschärfe definiert?

A

Trennschärfe = Ausmaß, in dem ein Item das Gesamtergebnis des Tests repräsentiert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wozu ist die Trennschärfe gut?

A

Sie ermöglicht eine Einschätzung, wie gut ein Item zwischen Personen mit hoher und niedriger Fähigkeitsausprägung “trennt”

Items mit geringer Trennschärfe werden von Personen unabhängig von ihrem Fähigkeitsgrad gelöst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Worüber wird die Trennschärfe üblicherweise bestimmt? Wie kann man das als Formel darstellen?

A

Über die Item-Gesamt-Korrelation

Das ist die Korrelation der Itembeantwortung mit dem Gesamttestwert:

rit = r(Xi, Xges-i)

Xi = die Antwort von Item i
Xges-i = der Testwert der Person auf allen anderen Items außer Item i

(Zur Erinnerung: Die mittlere Item-Gesamt-Korrelation ist ein Index für die Reliabilität (interne Konsistenz ) eines Tests -> Cronbachs alpha

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist der Wertebereich der Trennschärfe?

A

-1 bis 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie wird die Trennschärfe interpretiert?

A
  • Bei einer hohen positiven Trennschärfe erfasst das Item etwas ähnliches wie der Gesamttest.

-Eine Trennschärfe von Null bedeutet, dass das Lösungsverhalten bei dem Item nichts mit dem Antwortverhalten bei den anderen Aufgaben zu tun hat.

  • Eine negative Trennschärfe bedeutet, dass eine Aufgabe von fähigen Personen seltener gelöst.
  • Dies kann darauf hinweisen, dass in der Aufgabe ein Fehler ist oder die Aufgabe mehrdeutig gestellt worden ist.

–> Hohe Trennschärfe gut (> .4)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie sind die Trennschärfe und die Schwierigkeit miteinander verbunden?

A
  • Je schwieriger oder leichter, desto geringer die Trennschärfe
  • Je mehr Personen ein Item lösen (oder nicht lösen), desto geringer wird die Variabilität der Antworten
  • Das item kann deswegen nicht mehr stark mit dem Gesamtwert eines Tests kovariieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was gibt die Dimensionalität eines Tests an?

A

Gibt an, ob der Test nur ein Merkmal bzw. Konstrukt erfasst (eindimensionaler Test) oder ob mit den Testitems mehrere Konstrukte bzw. Teilkonstrukte erfasst werden (mehrdimensionaler Test)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was setzt das Konzept der Trennschärfe und Homogenität voraus?

A

Dass ein Test nur einen einheitlichen Aspekt abdeckt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist eine Faktorenanalyse und was wird dabei gemacht?

A

Die Faktorenanalyse ist ein statistisches Verfahren, die auf der Interkorrelationsmatrix aller Items basiert

In einer Faktorenanalyse werden mehrere manifeste Items auf wenige latente, zugrunde liegende Faktoren reduziert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was wird bei der Item-charakteristischen Funktion gegeneinander aufgetragen?

A

Die Lösungswahrscheinlichkeit des Items (Schwierigkeit) gegen die Personenfähigkeit

18
Q

Woran kann man die Trennschärfe in einer Item-charakteristischen Kurve ablesen?

A

an der Steigung der Funktion

19
Q

Wie geht man bei der Faktorenanalyse vor?

A

Gruppen von Items werden identifiziert, die untereinander hoch, aber gering mit anderen Items korrelieren

20
Q

Worauf können die Gemeinsamkeiten zwischen den Items bei der Faktorenanalyse zurückgeführt werden?

A

Auf die latenten Faktoren

21
Q

Was gibt die Faktorladung an und welcher anderen Größe entspricht sie?

A
  • Wie sehr eine Aufgabe zu dem latenten Faktor beiträgt
  • entspricht der Trennschärfe des Items und kann zur Gewichtung verwendet werden
  • Items mit niedrigen Faktorladungen (< .4) zeigen, dass das ein Item nicht gut zu einem Faktor passt.
22
Q

Wodurch werden die inhaltsbezogenen Aspekte von Items bei der Faktorenanalyse repräsentiert?

A

Durch aufgaben-spezifische Fehler

23
Q

Können verschiedene latente Faktoren miteinander korrelieren?

A

Ja –> sog. latente Korrelation

24
Q

Wie prüft man die Dimensionalität eines Tests?

A

Mit einer explorativen oder konfirmatorischen Faktorenanalyse

  • Ein Test ist eindimensional, wenn es nur einen Faktor gibt.
  • Bei mehrdimensionalen Tests wird für jeden Faktor eine separate Skala gebildet.
25
Q

Was ist die Explorative Faktorenanalyse?

A

o bei der explorativen Faktorenanalyse trifft man keine Vorannahmen darüber, welche Aufgaben zu welchem Faktor gehören.
o man betrachtet die Faktorenstruktur korrelierter Variablen

26
Q

Was ist die konfirmatorische Faktorenanalyse?

A

o Hypothesentestend.
o Testet, ob die Daten zu einer theoretisch angenommen Faktorenstruktur passen.

27
Q

Was beschreibt die Item-Response-Theorie?

A

Beschreibt die Beziehung zwischen latentem Merkmal und einzelnen Items

Sie spezifiziert, bei welcher Ausprägung des zu messenden Merkmals welche Wahrscheinlichkeit für die Lösung eines Items resultiert.

28
Q

Was ist die Grundannahme der Item-Response Theorie?

A

Die Wahrscheinlichkeit, ein bestimmtes Item zu lösen, hängt von einer latenten Merkmalsdimension ab

”Fähigere” Personen lösen ”schwierigere” Items

29
Q

Von welchen Faktoren ist die Lösungswahrscheinlichkeit nach der Item-Response-Theorie abhängig?

A

o Personenmerkmalen (Fähigkeit, θ)
o Itemmerkmalen (Schwierigkeit, β)

30
Q

Wie berechnet sich die Lösungswahrscheinlichkeit nach der Item-Response-Theorie ?

A

Differenz zwischen Personen- und Itemparameter:
p (X = 1) = θ–β

sog. ”subtraktive Parametrisierung”

31
Q

Welche Personen werden eine Aufgabe nach der Item-Response Theorie wahrscheinlich (nicht) lösen?

A

Personen, deren Fähigkeit (θ) größer ist als die Schwierigkeit β, werden die Aufgabe wahrscheinlich lösen:
o θ–β > 0 → p > .5

Personen, deren Fähigkeit (θ) kleiner ist als die Schwierigkeit β, werden die Aufgabe wahrscheinlich nicht lösen:
o θ–β < 0 → p < .5

32
Q

Welcher Punkt in der Auftragung der Itemcharakteristischen Funktion beschreibt die Itemschwierigkeit?

A

Der Punkt, an dem die Lösungswahrscheinlichkeit 50% ist

33
Q

Was kann mit einer Wright-Map beurteilt werden?

A

die Passung des Tests
(Vergleich Personen- und Itemparameter)

34
Q

Was sind die Vorteile der Item-Response-Theorie? (4 Stück)

A
  • Spezifische Objektivität: Messung ist unabhängig von Itemauswahl und der untersuchten Stichprobe.
  • Kriteriumsorientierte Messung: Am Fähigkeitswert ist direkt abzulesen, welche Aufgaben gelöst werden können.
  • Multi-Matrix-Design: Nicht alle Schüler:innen müssen alle Aufgaben bearbeiten, sondern Teil der Aufgaben ausreichend.
  • Adaptives Testen: Individuelle Auswahl von Items, die optimale Testung für eine:n Schüler:in ermöglicht.
35
Q

Was ist PISA und wer organisiert sie und was wird gemessen?

A
  • Internationale Schulleistungstudie
  • organisiert von OECD
  • Kompetenzen am Ende der Pflichtschulzeit (15 Jahre)
36
Q

Wann war die erste PISA-Erhebung, was ist der Zyklus und welche “Fächer” werden abgeprüft?

A
  • 2000 erste Erhebung
  • Zyklus alle 3 Jahre
  • rotierender Schwerpunkt: Lesen, Mathe, Naturwissenschaften
37
Q

Wie viele Länder haben im ersten Zyklus bei PISA mitgemacht und wie viele waren es 2018?

A

erster Zyklus: 30 Länder
2018: ca. 90 Länder

38
Q

Wie ist die PISA-Studie designt?

A
  • Konstrukte sollen möglichst breit erfasst werden, gleichzeitig ist Testzeit pro Schüler:in begrenzt → Multi-Matrix-Design.
  • Items sind in sog. Units organisiert, d.h. Itemstamm mit 3-4 Aufgaben, diese werden Clustern zugewiesen.
  • Testeinheiten werden auf verschiedene Testversionen verteilt, um Positions- und Carry-over-Effekte zu kontrollieren.
39
Q

Auf welcher Ebene kann die PISA Studie (keine) Aussagen machen?

A

Keine Aussagen auf Individual-Ebene möglich, sondern nur auf Aggregatebene

40
Q

Wie funktioniert die Adaptive Testung der PISA-Studie?

A
  • Am Anfang bearbeiten die Schüler:innen eine von 8 Basis-Units
  • Abhängig von ihrer Leistung wurde in einem zweiten Schritt eine Unit mit einfachen/schweren Aufgaben zugewiesen.
  • In einem dritten Schritt wurde das Vorgehen wiederholt und leistungsabhängig eine einfache oder schwere Unit bearbeitet.
41
Q

Wie wird die PISA-Studie ausgewertet?

A
  • Bestimmung von Itemparametern, Bericht auf eindimensionaler Skala
  • Auswertung zunächst nur auf Populationsebene (d.h. ein Wert pro Land)
  • Zusätzliche Schätzung von individuellen Personen-Parametern für Schüler:innen.
  • Hierfür ist ein Hintergrundmodell notwendig, das Eigenschaften der Schüler:innen und des verwendeten Testheftes mit einbezieht.
  • Auf dieser Grundlage werden aus der Populationsverteilung Individualwerte (sog. Plausible Values) gezogen.
42
Q

KLAUSURFRAGE: Welche der folgenden Itemschwierigkeiten ist optimal? 0.2; 1.0; 0.5; 0.8 ?

A

0.5