Klassische Testtheorie Flashcards
Test - Definitionen nach Lienert (1968)
- ein Verfahren zur Untersuchung eines Persönlichkeitsmerkmals
- Vorgang der Durchführung der Untersuchung
- die Gesamtheit der zur Durchführung nötigen Requisiten
- jede Untersuchung, sofern sie Stichprobencharakter hat
- mathematisch-statistisches Prüfverfahren (z.B. F-Test)
- Test ist wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirischer Persönlichkeitsmerkmale, mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der Merkmalsausprägung.
Test - Definitionen nach Krauth (1995)
Ein psychologischer Test besteht aus
- einer Menge von Reizen mit den zugehörigen zugelassenen Reaktionen, d.h. aus einer Menge von manifesten Variablen und
- einer Vorschrift (Skala), die den Reaktionsmustern der manifesten Variablen Ausprägungen einer oder mehrerer latenter Variablen zuordnet
Tests: Klassifikation Brickenkamp (2002) - Leistungstests
Entwicklungstests (18)
- z.B. Heidelberger Sprachentwicklungstest
Intelligenztests (57)
- z.B. Advanced Progressive Matrices
Allgemeine Leistungstests (17) - z.B. d2-Aufmerksamkeitstest
Tests: Klassifikation Brickenkamp (2002) - Schultests
Schultests (72)
- Einschulungstests (13)
- Spezielle Schuleignungstests (3)
- Mehrfächertests (6)
- Lesetests (8)
- Rechtschreibtests (14)
- Mathematik- und Rechentests (9)
- Sonstige Schultests (19)
Spezielle Funktionsprüfungs- und Eignungstests (29)
Tests: Klassifikation Brickenkamp (2002) - Psychometrische Persönlichkeitstests
- Persönlichkeits-Struktur-Tests
- Einstellungs- und Interessentests
- Klinische Tests
- Fragebogen
- Interviews
- Sonstige klinische Verfahren
Tests: Klassifikation Brickenkamp (2002) - Persönlichkeits-Entfaltungsverfahren
Formdeuteverfahren
- z.B. Rorschach-Test
Verbal-thematische Verfahren
- z.B. Picture Frustration Test
Zeichnerische und Gestaltungsverfahren
- z.B. Familie in Tieren
Bezugsquellen für Tests
Testothek an der Universitätsbibliothek Düsseldorf (ca. 700 Tests)
www.testzentrale.de (Hogrefe Verlag) - nicht unabhängig!
www.pearsonclinical.de (Pearson Verlag)
zis.gesis.org (GESIS, ZIS = Zusammenstellung sozialwissenschaftlicher Items und Skalen)
www.testarchiv.eu (ZPID, Elektronisches Testarchiv)
www.psychometrikon.de (Psychometrikon)
Tests - Unterscheidungsmerkmale
Dimensionalität (Subskalen)
- eindimensional - ->z.B. die sprachfreien Matrizenaufgaben in Ravens Advanced Progressive Matrices (APM)
- mehrdimensional
–> z.B. Test Anxiety Inventory
(Subskalen: Aufgeregtheit, Besorgtheit, Interferenz, Mangel an Zuversicht)
Schnelligkeits- (Speed-)test
–> Aufgaben (bei beliebig viel Zeit) von allen lösbar
Niveau- (Power-)test
–> Aufgaben auch bei viel Zeit nur von manchen lösbar
- direkt interpretierbare (psychometrische, z.B. Intelligenz-) Tests vs. nicht direkt interpretierbare (projektive, z.B. Rorschach-) Tests
- Testmedium: Papier-Bleistift, computergestützt, andere
- Individual- vs. Gruppentests
Beispielitem aus Speedtest: d2-Aufmerksamkeitstest
Markieren Sie so schnell wie möglich alle Zeichen, in denen ein „d“ mit genau zwei Strichen vorkommt!
Beispielitem aus Niveautest: 9-Punkte-Problem
Wie lassen sich die neun abgebildeten Punkte mit maximal vier Strichen verbinden, ohne den Stift abzusetzen?
Dunckers Kerzenproblem
Der Test erfordert vom Probanden, eine brennende Kerze an einem an der Wand hängenden Korkbrett so zu befestigen, dass das Wachs nicht auf den Boden tropft.
Dabei dürfen die Testsubjekte folgende Materialien, die mit der Kerze gereicht werden, verwenden:
- Eine Packung Streichhölzer
- Eine Schachtel mit Reißnägeln darin
Klassische Testtheorie (KTT)
- Kein beobachteter Testwert gibt absolut verlässliche Auskunft über die tatsächliche Ausprägung des erfassten Merkmals
- Innere und äußere Bedingungen einer Testung sind nicht so perfekt standardisiert, dass keine Störquellen wirksam werden
- Mögliche Differenz zwischen beobachtetem und „wahrem“ Testwert wird auf Messfehler zurückgeführt
Erwartungswert des Fehlers = 0
Fehler sind weder mit dem wahren Wert noch untereinander korreliert
→ Durch Hinzunahme weiterer Items mitteln sich die Fehler aus; der wahre Wert wird zunehmend genauer geschätzt.
Axiome der klassischen Testtheorie Gulliksen (1950)
- Jede Messung ist aus einem wahren Wert und einem zufälligen Fehlerwert zusammengesetzt.
- Für jede Testperson stellt der Messfehler eine Zufallsvariable mit dem Erwartungswert (Mittelwert) Null und endlicher Varianz dar.
- Die Fehlerwerte sind unabhängig von den wahren Werten des Tests, und unabhängig von den wahren Werten und Fehlerwerten anderer Tests
Aus diesen Axiomen folgt:
Die Summe der Fehlerwerte einer Person bei unendlich häufiger Messwiederholung ist Null.
Die Summe der Fehlerwerte bei einmaliger Messung an unendlich vielen Personen ist Null.
→ Die klassische Testtheorie kann als
Messfehlertheorie aufgefasst werden
Varianzzerlegung
Aus den Grundannahmen der KTT folgt
s²x = s²w + s²e
s²x = beobachtete Varianz, s²w = wahre Varianz und s²e = Fehlervarianz.
Die Varianz der beobachteten Testrohwerte setzt sich zusammen aus der „wahren“ Varianz und der „Fehler“ – Varianz.
Itemmittelwert, -schwierigkeit und -varianz
Itemmittelwert – xi(Mittelwert) = Σ(xi) / N = pi
Summe aller Messwerte einer Stichprobe, dividiert durch Stichprobengröße
qi = 1 - pi p = Itemschwierigkeit (sic!) -> Anteil richtiger Lösungen q = (1-p) -> Anteil falscher Lösungen
Varianz eines dichotomen Items i
Durchschnittliche quadrierte Differenz aller xi vom Mittelwert des Items; entspricht pi(1-pi). Die Varianz eines Items ist also eine Funktion seiner Schwierigkeit p, und maximale Varianz hat ein Item mit p = 0.5.
s²i = Σ(xi - xi(mw))² / N