VL 3: Der wahre Wert und seine Schätzungen, Kritische Würdigung der KTT Flashcards

1
Q

Testwert xv

A

• Punktschätzer für den wahren Wert einer Person

xv = tv

• empirische Schätzung nicht sicher, daher Vertrauensintervall für τv bilden
-> dazu: Standardmessfehler betrachten…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Standardmessfehler SD (ε)

A

Der Standardmessfehler SD(ε) eines Tests resultiert aus der Unreliabilität des Tests und errechnet sich als Wurzel aus der Fehlervarianz eines Tests. Der Standardmessfehler ist bei höherer Reliabilität kleiner und bei niedrigerer Reliabilität größer.

  • Standardmessfehler sinkt mit zunehmender Reliabilität und…
  • steigt mit abnehmender Reliabilität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vertrauensintervall für τv

A

„Das Konfidenzintervall umfasst denjenigen Bereich eines
Merkmals, in dem sich 95% bzw. 99% aller möglichen wahren Werte τv befinden, die den Stichprobenschätzwert erzeugt haben können.“
„Dabei kommt der wahre Wert τv mit einer Wahrscheinlichkeit von
(1-α) in diesem Intervall zu liegen (α = 0,05 bzw. 0,01).“

  • umfasst Bereich einer Merkmals, indem sich 95% oder 99% aller möglichen wahren Werte befinden

Obere Grenze: tv+za/2SD(x)wurzel1-Rel
Untere Grenze: tv-za/2SD(x)wurzel1-Rel

Voraussetzungen/ Annahmen
• Fehler sind normalverteilt • große Stichprobe (n ≥ 60)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Fazit

A
  • mit sinkender Reliabilität wird das Konfidenzintervall sehr breit: ungenaue Messung
  • Tests mit Rel. < .80 sollten für die Individualdiagnostik nicht verwendet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Kritische Würdigung der KTT

A

+ bewährter Ansatz zur Reliabilitätsbeurteilung von Tests
+ ökonomisch und praktisch in der Umsetzung
+ meist verbreitete psychometrische Messtheorie
- einige Annahmen sind nicht überprüfbar/ schwer haltbar, z.B.
… Testwert setzt sich aus wahrem Wert und Fehlerwert zusammen … erfassen die Items das definierte Konstrukt?
… Unabhängigkeit der Fehler zw. Person und Situation
- Rechtfertigung des Testwerts ergibt sich erst durch Eindimensionalität, die in der KTT nicht explizit überprüft wird
- Daten müssen Intervallskalenniveau haben
- Stichprobenabhängigkeit der Kennwerte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Validität

A

Validität = Gültigkeit

Ein Test ist valide, wenn er das misst, was er zu messen vorgibt (-> Inhaltsvalidität).

Misst der Test, was er vorgibt zu messen?

Inhalts-, Kriteriums- und Konstruktvalidität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Inhaltsvalidität

A

„logische Validität“, „Augenscheinvalidität“ (Michel & Conrad, 1982)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Kriteriumsvalidität

A

Vorhersagevalidität (=prädiktive Validität) Übereinstimmungsvalidität (=konkurrente Validität) Retrospektive Validität
Inkrementelle Validität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Konstruktvalidität

A

Konvergente Validität

DiskriminanteValidität (=DivergenteValidität) Faktorielle Validität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Kann ein Test objektiv sein, aber nicht reliabel?

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Kann ein Test reliabel sein aber nicht objektiv?

A

nein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Kann ein Test valide sein, aber nicht reliabel?

A

nein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kann ein Test reliabel sein, aber nicht valide?

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Kann ein Test objektiv sein, aber nicht valide?

A

ja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kann ein Test valide sein, aber nicht objektiv?

A

nein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hauptgütekriterien sind hierarchisch verbunden

A

Validität
Reliabilität
Objektivität

17
Q

Nebengütekriterien

A
  • Skalierung
    (Messwertverrechnung dem Skalenniveau angemessen?)
  • Nomierung
    (solide Normierung vorhanden?)
  • Vergleichbarkeit
    (Parallelform vorhanden? Mehrfachtestung möglich?)
  • Ökonomie
    (Zeit-, Materialaufwand)
  • Nützlichkeit
    (Test von Nutzen?)
  • Zumutbarkeit
    (Aufwand/Belastung für Probanden)
  • Fairness
    (werden einzelne Probanden ungewollt benachteiligt?)
  • Unverfälschbarkeit
    (Faking good/bad möglich bzw. erkennbar?)