Normwerte und Testtheorie Flashcards
Standardmessfehler - Definition
gibt an, wie stark die Messfehler um die wahren Werte der Person(en) streuen
Standardmessfehler in der KTT
- Laut der KTT weichen beoachtete Testwerte vom wahren Wert ab (durch den Einfluss von Messfehlern) –> Idee: wenn wir neben dem Testwert die Größe des Messfehlers kennen würden, könnten wir den wahren Wert einer Person bestimmen
ABER: exakte Bestimmung der Größe des Messfehler nicht möglich, aber: Streuung (um den wahren Wert) der Messfheer bei sehr vielen wiederholten Messungen = Standardmessfehler
sE = sX * Wurzel(1 - Rel)
s. F. 6
Standardmessfehler: Konfidenzintervall - Definition
- Bereich, in dem die beobachteten Testwerte um den wahren Wert streuen (beeinflusst durch den Standardfehler)
Standardmessfehler: Konfidenzintervall - Berechnung
Aus dem beobachteten Testwert, dem Stanadrdmessfehler und der Irrtumswahrscheinlichkeit (Alpha-Fehler i.d.R. auf 5% definiert, ~ p-Wert als siginikanzgrenze)
95% Konfidenziinterall (festgelegte Sicherheitswahrscheinlichkeit, 1 - alpha)
Formel s. F: 8, 9 & 10 –> Unbedingt auf Fallbeispiel der Sitzung anschauen
Welche Bedingung müssen zwei parallele Tests NICHT erfüllen?
1. Sie messen dasselbe Merkmal
2. sie haben den gleichen Eerwartungswert (T)
3. Sie haben die gleiche Korrelation mit einer anderen Variable
4. sie haben den gleichen Testwert (X)
- sie haben den Gleichen Testwert
–> bei unterschiedlichen Messungen kann der Testwert abweichen
Welche der Folgenden Aussagen stimmt NICHT mit de Annahmen der KTT überein?
a) Der wahre Wert beträgt bei jeder Ausprägung des Messfehlers 0
b) Der mittlere Erwartungswert des Messfehlers beträgt 0
c) Wahre Werte und Messfehler sind unkorreliert
d) Die Varianz beobachteter Messwerte lässt sich additiv zerlegen in die Varianz der wahren Werte und die Varianz der Messfehler
a) –> Der wahre Wert ist unabhängig vom Messfehler, er kann, muss aber nicht gleich 0 sein
- Warum sollten mehrere Messungen durchgeführt werden, um die wahre Leistungsfähigkeit eines Probanden zu ermitteln?
Da man von einen unsystematischen Messfehler ausgeht, dessen Mittelwert über (unendlich) viele Messungen 0 ist, also kommt man so näher an den wahren Wert
Was besagt ein Reliabilitätskoeffizient von 1 im Sinne der Klassischen Testtheorie?
Ein WErt von 1 besagt, dass die Testwertvarianz nur aus Varianz des wahren Werts besteht und der Test fehlerfrei misst ( 1 = Maximalwert)
Abgebildet sind die Itemcharakteristikkurven(ICCs) für drei Items mit unterschiedlicher Schwierigkeit. Welches Item ist das schwierigste? Welches das leichteste? s. F. 20
Item 3 ist das schwierigste (IP = 2) und Item 1 ist das leichteste (IP= -2)
Abgebildet ist die ICC für ein Item. Ihr lasst zwei Personen das Item bearbeiten. Die Lösungswahrscheinlichkeit von Person A liegt bei 20%, die Lösungswahrscheinlichkeit von Person B liegt bei 80%. Wie hoch sind die Personenparameter der beiden Personen? Zeichnet sie ein.
s. F. 21
Bei Person A liegt der Personenparamter ca. bei -2 und bei Person B ca. bei 2
Welche beiden zentralen Annahmen werden beim Rasch-Modell vorausgesetzt und überprüft?
Lokale stochastische Unabhängigkeit (Itemhomogenität) und spezifische Objektivität (Stichrobenunabhängigkeit)
Wie hoch sollte die Korrelation zwischen Items eines Tests sein, wenn alle Personen die gleiche Fähigkeit haben?
Die Korrelation sollte 0 sein. Da alle Personen die gleiche Fähigkeit haben , haben sie alle die gleiche Ausprägung auf der latenten Variable. Die Zusammenhänge zwischen der Beantwortung ver. Items durch eine Person lassen sich alleine auf die latente Variable (=Fähigkeit) zurückführen, d.. nach Berücksichtigung der Ausprägung der latenten Variable sind die Antworten auf ver. Items unabhängig (lokale Stochastische Unabhängigkeit)
Abgebildet sind die Itemcharakteristikkurven(ICCs) für drei Items mit unterschiedlicher Schwierigkeit. Liegt hier spezifische Objektivität vor?
s. F. 22
Nein, die Itemfunktionen haben unterschiedliche Diskriminationsparamter, die Kurven sind nicht parallel = Die Wahrscheinlichkeit ein item zu lösen ist nicht für jeden Person gleichermaßen höher als die Wahrscheinlichkeit ein anderes Items zu lösen