VL 3: Der wahre Wert und seine Schätzungen, Kritische Würdigung der KTT Flashcards
Testwert xv
• Punktschätzer für den wahren Wert einer Person
xv = tv
• empirische Schätzung nicht sicher, daher Vertrauensintervall für τv bilden
-> dazu: Standardmessfehler betrachten…
Standardmessfehler SD (ε)
Der Standardmessfehler SD(ε) eines Tests resultiert aus der Unreliabilität des Tests und errechnet sich als Wurzel aus der Fehlervarianz eines Tests. Der Standardmessfehler ist bei höherer Reliabilität kleiner und bei niedrigerer Reliabilität größer.
- Standardmessfehler sinkt mit zunehmender Reliabilität und…
- steigt mit abnehmender Reliabilität
Vertrauensintervall für τv
„Das Konfidenzintervall umfasst denjenigen Bereich eines
Merkmals, in dem sich 95% bzw. 99% aller möglichen wahren Werte τv befinden, die den Stichprobenschätzwert erzeugt haben können.“
„Dabei kommt der wahre Wert τv mit einer Wahrscheinlichkeit von
(1-α) in diesem Intervall zu liegen (α = 0,05 bzw. 0,01).“
- umfasst Bereich einer Merkmals, indem sich 95% oder 99% aller möglichen wahren Werte befinden
Obere Grenze: tv+za/2SD(x)wurzel1-Rel
Untere Grenze: tv-za/2SD(x)wurzel1-Rel
Voraussetzungen/ Annahmen
• Fehler sind normalverteilt • große Stichprobe (n ≥ 60)
Fazit
- mit sinkender Reliabilität wird das Konfidenzintervall sehr breit: ungenaue Messung
- Tests mit Rel. < .80 sollten für die Individualdiagnostik nicht verwendet werden
Kritische Würdigung der KTT
+ bewährter Ansatz zur Reliabilitätsbeurteilung von Tests
+ ökonomisch und praktisch in der Umsetzung
+ meist verbreitete psychometrische Messtheorie
- einige Annahmen sind nicht überprüfbar/ schwer haltbar, z.B.
… Testwert setzt sich aus wahrem Wert und Fehlerwert zusammen … erfassen die Items das definierte Konstrukt?
… Unabhängigkeit der Fehler zw. Person und Situation
- Rechtfertigung des Testwerts ergibt sich erst durch Eindimensionalität, die in der KTT nicht explizit überprüft wird
- Daten müssen Intervallskalenniveau haben
- Stichprobenabhängigkeit der Kennwerte
Validität
Validität = Gültigkeit
Ein Test ist valide, wenn er das misst, was er zu messen vorgibt (-> Inhaltsvalidität).
Misst der Test, was er vorgibt zu messen?
Inhalts-, Kriteriums- und Konstruktvalidität
Inhaltsvalidität
„logische Validität“, „Augenscheinvalidität“ (Michel & Conrad, 1982)
Kriteriumsvalidität
Vorhersagevalidität (=prädiktive Validität) Übereinstimmungsvalidität (=konkurrente Validität) Retrospektive Validität
Inkrementelle Validität
Konstruktvalidität
Konvergente Validität
DiskriminanteValidität (=DivergenteValidität) Faktorielle Validität
Kann ein Test objektiv sein, aber nicht reliabel?
ja
Kann ein Test reliabel sein aber nicht objektiv?
nein
Kann ein Test valide sein, aber nicht reliabel?
nein
Kann ein Test reliabel sein, aber nicht valide?
ja
Kann ein Test objektiv sein, aber nicht valide?
ja
Kann ein Test valide sein, aber nicht objektiv?
nein