VL 5: Reliabilität Flashcards

1
Q

KTT: Def. Truescore

A

Untersucht man eine VP mehrmals auf die gleiche Weise, ergeben sich leicht unterschiedliche Werte –> intraindividuelle Verteilung.
Der Erwartungswert dieser Werte der VP heißt Truescore.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

KTT: Def. Fehlerwerte

A

Abweichung der Messwerte vom Truescore

Fehlerwert_i= Y_i - Truescore_i

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Def. Reliabilität

  • beschreibend
  • mathematisch nach der KTT + Formel
A

BESCHREIBEND
Rel. = das Ausmaß der Verlässlichkeit bzw. Genauigkeit einer Messung

MATEMATISCH NACH DER KTT
Rel.= der Anteil der Varianz, welche auf den Truescore zurückgeht
Rel (Yi) = Var(tau_i) / Var(Y_i)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie wird nach dem Modell 1 (essentiell tau-äqivalente Variablen) die Reliabilität geschätzt?

  • Vorgehen
  • Annahmen
  • Formel
A

doppelte Messung

  • -> Annahmen
    1. tau ist in beiden Messungen gleich
    2. Fehler sind unkorreliert (keine personenspezifischen Fehler)
  • -> es ergibt sich: Rel(Y1) = Cov (Y1,Y2)/Var (Y1)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
Modell 1 (essentiell tau-äqivalente Variablen): Umsetzung
-welche Möglichkeiten gibt es? (3)
A
  1. Retest
  2. Paralleltest
  3. Testhalbierung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Modell 1 (essentiell tau-äqivalente Variablen): Umsetzung: Retest-Methode:

  • Probleme (3)
  • Bewertung
A

PROBLEME
- tau muss zeitlich absolut stabil sein, da sonst Annahme verletzt wird (Rel. wird unterschätzt)

  • Übung-/Lerneffekte müssen ausgeschlossen werden
    → Dilemma: Nicht zu lange Zeit zwischen beiden Tests, da tau sich sonst ändern könnte, aber auch nicht zu kurze Zeit aufgrund Erinnerungs- & Übungseffekten
  • Es dürfen (über beide Tests) keine probandenspezifischen Fehler existieren: Cov ( ε 1 , ε 2 ) = 0 (Rel. wird überschätzt)

BEWERTUNG
- gut geeignet für Persönlichkeitstests –> hohe Stabilität von tau

  • weniger gut geeignet für Leistungstests –> geringe Stabilität
    - für Speedtests aber noch besser geeignet als für Powertests, da Testwiederholungseffekte bei ersterem geringer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Modell 1 (essentiell tau-äqivalente Variablen): Umsetzung: Paralleltest-Methode

  • was ist ein Paralleltest?
  • Probleme (3)
A

WAS IST EIN PARALLELTEST?
Tests, welche das selbe erfassen + identischer Mittelwert und identische Standardabweichung + Korrel. nahe 1 aber unterschiedliche Items

PROBLEME
- tau muss (trotz unterschiedlicher Items) identisch sein –> sonst Verletzung der Annahme “tau-Äquivalenz” –> Rel. wird unterschätzt

  • keine probandenspezifischen Fehler –> sonst Verletzung der Annahme “unkorrelierte Fehler” –> Rel. wird überschätzt
  • Parallelität muss gewährleistet sein –> schwierig vor allem bei Tests, welche enges Merkmal testen, da Universum der Items begrenzt –> meist keine strenk parallelen Testformen
    Ausnahme: Speed-Tests (z.B. “d2”): Paralleltest = Retest
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Modell 1 (essentiell tau-äqivalente Variablen): Umsetzung: Testhalbierungs-Methode

  • Aufteilungsmethoden (5)
  • Probleme (3)
  • Vorteile
A

AUFTEILUNGSMETHODEN
- Split-Half: erste Hälfte und zweite Hälfte des Tests

  • Odd-Even: Items mit gerader Ziffer und Items mit ungerader Ziffer
  • Random: zufällige Aufteilung
  • Nach Itemkennwerten: 1. Paarlinge gleicher Schwierigkeit und Trennschärfe bilden; 2. zufällige Zuweisung der Items aus den Paarlingen zu jeweils einer Testform
  • bei Speedtests: Halbierung nach Testzeit

PROBLEME
- tau muss (trotz unterschiedlicher Items) identisch sein –> sonst Verletzung der Annahme “tau-Äquivalenz” –> Rel. wird unterschätzt

  • keine probandenspezifischen Fehler –> sonst Verletzung der Annahme “unkorrelierte Fehler” –> Rel. wird überschätzt
  • Berechnung der Rel. nur für eine Testhälfte –> Hochrechnung mittels Spearman-Brown-Formel

VORTEILE
zahlreiche Störfaktoren lassen sich ausschließen
- Schwankungen in Leistung, Motivation, Stimmung
- zeitliche Veränderung des Merkmals
–> Methode der Wahl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Modell 1 (essentiell tau-äqivalente Variablen): Terminologie-Probleme (2)

A

1.
Es werden in den genannten Verfahren stets Korrelationen berechnet. Meist
werden diese als „Retest-Reliabilität“, “Paralleltest-Reliabilität” usw. bezeichnet, was irreführend ist, da es nur eine
wahre Reliabilität gibt – es handelt sich nur um verschiedene Schätzer für sie.

2.
Die Retest-Korrelation kann auch als Teststabilität verwendet werden. Eine zeitliche instabile
Messung kann aber dennoch reliabel sein, vor allem wenn es sich um eine situations-
abhängige Variable handelt (state), d.h. tau sich mit der Zeit ändert.
–> Stabilität nichtgleich Reliabilität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Modell 2: “Modell tau-kongenerischer Variablen”

  • Grundlagen
  • Anwendung
A

GRUNDLAGEN
Erweiterung des Modells der essentiellen tau-Äquivalenz
–> Annahme: Y-Variablen werden nicht unbedingt in gleichem Ausmaß von tau beeinflusst –> Gewichtungsfaktoren β für den Einfluss von tau

–> Y 1 = β 1 τ + ε 1
Y 2 = β 2 τ + ε 2
–> Var(Y 1 ) = β 1^2 Var( τ ) + Var( ε 1 )
Var(Y 2 ) = β 2^2 Var( τ ) + Var( ε 2 )
–> Rel(Y 1 )= (β 1^2)/ (Var(Y1))
Rel(Y 2 )= (β 2^2)/ (Var(Y2

ANWENDUNG

  • Mehrfachmessung via Retest, Paralleltest,…
  • Schätzung via Strukturgleichungsmodell
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Konsistenzanalyse: Vorgehen

+ einfaches Konsistenzmaß

A
  • jedes Item bildet eigenen “Testteil” (Erweiterung der Testhalbierungt)
  • Berechnung der Var. der testscores Var(S)
  • Berechnung der Kovarianz der Items untereinander
  • wenn Konsistens hoch, sollte die Kov. der Items einen großen Anteil an der Varianz des Testscores haben
  • -> einfaches Konsistensmaß: ~
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Konsistenzanalyse: Cronbach Alpha

  • Def.
  • Formel
A

Erweiterung des einfaches Konsistenzmaßes um einen Korrekturfaktor
–> ~

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Konsistenzanalyse: K-R-Formula 20

A

Erweiterung des einfaches Konsistenzmaßes (für dichotome Items
–> ~

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Konsistenzanalyse: Interpretation der Konsistenzmaße

A
  • Konsistenzmaße sind eine “hochgerechnete” standardisierte Kovarianz der Items, also eine Korrelation
  • Konsistenzmaße können als Schätzer für die Reliabilität verwendet werden
  • sind konservativ –> untere Schranke der Reliabilität
  • Wertebereich zwischen 0 und 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

KTT: Axiome (3)

A
  1. Ein Messwert besteht aus wahrem Wert und Fehler
    –> Y i = τ i + ε i

2.
Der Erwartungswert des Fehlers ist null:
–> E( ε i ) = 0

3.
Die Fehler sind unkorreliert:
–> Cov( ε i , τ i ) = Cov( ε i , ε k ) = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Spearman-Brown-Formel (prophecy formula)

  • Nutzen
  • Formel
A

NUTZEN
Manchmal muss ein Test verlängert / verkürzt werden. Zur Schätung der neuen Reliabilität bzw. nötigen Verkürzung / Verlängerung kann man die Spearman-Brown-Formel verwenden

FORMEL
~

17
Q

KTT: Kritik + Bewertung

A

• „Axiome der KTT sind empirisch nicht überprüfbar.“
–> Wozu auch? Viele Axiome sind Konsequenzen aus den stochastischen Definitionen und können
nicht falsch sein (s. Steyer & Eid, 1993)
• Die notwendigen Annahmen lassen lassen sich mit SEM überprüfen!

• „Annahme einer absoluten Stabilität von True-Scores ist nur bei kurzen Messintervallen
vertretbar.“
–>Diese Annahme muss nur bei der Retest-Methode gemacht werden; es gibt aber noch weitere
Methoden zur Reliabilitätsschätzung…

• „KTT setzt mindestens Intervallskalenqualität der Testscores voraus.“
–>„stimmt nicht!“ sagen viele mathematische Statistiker

• „Reliabilitätsschätzungen sind stichprobenabhängig (> Problem der Generalisierbarkeit

bzw. der Verbindlichkeit der Resultate).“
- -> ja! aber: Annahme der Repräsentativität

• „Gruppenstatistiken lassen sich logisch nicht auf den Einzelfall übertragen (der True-Score des diagnostischen Einzelfalls ist unbekannt).“
–>ja! aber: Reliabilitätskoeffizienten als heuristische Abschätzung der Messgenauigkeit

==> Bewertung: „Trotz (weniger) theoretischer Schwächen haben sich die nach der KTT entwickelten Tests bewährt.“