03 Praxis der Testkonstruktion Flashcards

Question

Kriterienbezogene Validität

Answer 1

- Zentral, wenn Test als Grundlage für praktische Entscheidungen dient - Idee: Konstrukt wird anhand eines Kriteriums erfasst - > Korrelation des Tests mit dem Kriterium (rtc) - Konzept: Geht davon aus, dass betreffendes Konstrukt durch Kriteriumsmessung direkt sichtbar gemacht werden kann - Beispiel: Test: Schuleignung, Kriterium: Schulnote Unterscheidung Art der Kriterien: - Vorhersagevalidität: Prognose Übereinstimmungsvalidität: Zustand nach zB. einem Jahr - Innere kriterienbezogene Validität: Anderes (etabliertes) Testverfahren, was gleiches Konstrukt erfasst - Äußere kriterienbezogene Validität: Externe Maße (Schulnoten, Arbeitsleistung, usw.) -> Test prinzipiell mehrere Validitäten

Answer 2

Konzept: Bezieht sich auf latente, theoretische Konstrukte Idee: - Zu messendes latentes Konstrukt mit anderen Konstrukten in systematischer Verbindung - Diese Verbindung als Hypothese formulierbar - Hypothesen können empirisch geprüft werden Hypothesenprüfung: - Nur Prüfung von Hypothesen, die als korrekt gesehen werden - Stimmen empirische Ergebnisse mit theoretischen Vorhersagen überein: Hinweis auf Validität des Verfahrens - Keine Übereinstimmung: Gegen Validität des Verfahrens Bsp. Hypothese: Korrelation Intelligenz mit Schulerfolg - Hypothese als korrekt gesehen - Korrelation der IQ-Testergebnisse mit Schulerfolg - Wenn Korrelation gegeben: Test erfasst Intelligenz und ist valide Ziel: - Einbettung des mit Test erfassten Konstrukt in nomologisches Netzwerk anderer teils verwandter oder fremder Konstrukte (konvergent bzw. diskriminant) - Je mehr Hypothesen, Erhebungs- und Auswahlstrategien, desto besser Multitrait-Multimethod-Matrix: - Systematische Vorgehensweise, kann zur Konstruktvalidierung genutzt werden - Erfassung mehrerer Konstrukte (Multitrait) mithilfe mehrerer Methoden (Multimethod) - Ergebnis: Muster an Korrelationen (Matrix), das konvergente und diskriminante Validitäten beinhaltet

Answer 3

- Test soll diagnostisches Urteil verbessern - > Liegen keine Alternativen vor, kann das mit geringen Validitäten schon möglich sein - Lange Vorhersagezeiträume: Geringere Validitäten - Validität sollte besser sein, wenn: Bei bereits vorhandenen Verfahren zum gleichen Merkmalsbereich Je isolierter Test im diagnostischen Bereich steht Je aufwendiger Test ist Je weitreichender Entscheidung für Proband

Answer 4

- Häufig wird einseitig Reliabilität optimiert Aber hohe Reliabilität -> Verminderung der Validität - Reliabilitäts-Validitäts-Dilemma: Je homogener ein Test, desto reliabler, aber valide Erfassung setzt voraus, dass Konstrukt in ganzer Breite erfasst wird - Lösungsversuch: Verwendung in sich homogenen Testbatterien/Subskalen, die Konstrukt aber insgesamt breit abdecken Kriterienbezogene Validität beschränkt durch: - Reliabilitätsindex des Tests (Theoretische Korrelation) - Reliabilitätsindex des Kriteriums (Korrelation Kriterium mit wahrem Wert) Unreliables Kriterium = geringe Validität des Tests? -> Ausgleich durch Minderungskorrektur Einfache Mindesrungskorrektur: - Berücksichtigung und Korrektur der Validitätsbeschränkung durch Reliabilität der Kriteriumsmessung - Sinnvoll, da Test keine "Schuld" für Ungenauigkeit der Kriteriumsmesung trifft Doppelte Minderungskorrektur: - Berücksichtigt zusätzlich beschränkte Reliabilität des Testverfahrens selbst - Kritisch, da maximale Testreliabiität vorgetäuscht wird - > Eher von theoretischer Bedeutung und um Potenzial eines Testverfahrens abzuschätzen

Answer 5

- Testergebnis zunächst als Rohwert: Nicht aussagekräftig und sinnvoller Vergleichsmaßstab zur Beurteilung nötig - Zwei Vergleichsmaßstäbe möglich: Normorientierte oder kriteriumsorientierte Interpretation

Answer 6

- Abgleich mit Testrohwerten anderer Personen -> Abgleich mit "normalem" Wert - Liegt bereits vor, wenn individueller Testwert zum durchschnittlichen Rohwert einer Vergleichsgruppe in Bezug gesetzt wird - Norm muss geschafft werden, um Rohwerte direkt einzuordnen mit Vergleichsgruppe als Grundlage - Normierung üblich an Eichstichprobe, diese muss: Repräsentativ für Stichprobe Hinreichend groß (abhängig von Differenziertheit der Normen und Heterogenität der Population) - Art von Normen: Äquivalenz-, Abweichungsnormen und Prozentränge

Answer 7

- Betrachtung, in welcher Altersgruppe eine Leistung äquivalent ist - Vorteil: Sehr anschaulich - Nachteile: Setzt voraus, dass Altersunterschiede vorhanden sind Evtl. qualitative Unterschiede zwischen Altersstufen -> heute unüblich, eher andere beiden Arten

Answer 8

- Prozentrang PR: Wie viel Prozent der Vergleichspopulation weisen eine geringere oder maximal gleiche Merkmalsausprägung auf? - Bsp.: PR = 40 -> 40% der Population haben geringeren oder gleichen Testwert, 60% höheren - Nichtlineare Flächentransformation -> Flächennorm - Bestimmung über kumulierte Häufigkeitsverteilung - Bei kategorisierten Rohwertklassen bezieht sich PR auf Kategorienmitte - Erstellung der Prozentrangtabelle: Interpretation des Rohwerts mit Prozentrang -> PR i.d.R. über Normwerte bestimmt - Vorteile: Relativ anschaulich Verteilungsunabhängig - Nachteil: PR nicht intervallskaliert -> Unterschied zwischen PR kann nicht ohne weiteres interpretiert werden

Answer 9

- Geben an, wie weit bestimmter Testwert vom Populationsdurchschnitt entfernt ist - Übliche Normskalen: z-Skala, IQ-Abweichungsskala, T-Werte, Stanine-Skala Bestimmung von Abweichungsnormen: - Normierung über Standardnormalverteilung (Werte z-transformieren) - Weitere Transformation in Standardnormskalen (da z-Wert negative Werte besitzt) - Auwahl von Normskala abhängig von: Gewünschtem Differenzierungsfähigkeit Genauigkeit der Messung Größe der Eichstichprobe - Erstellung einer Normtabelle: Für jeden einzelnen Rohwert wird Normwert ermittelt PR wird dann i.d.R. über Normwerte bestimmt - Vorsicht bei nicht normalverteilten Rohwerten: Abweichungsnormen im Rahmen einer Normalisierungstransformation zu bestimmen Andernfalls lediglich PR-Normen verwenden Normalisierungstransformation: - Bei nicht-normalverteilten Rohwerten ist Standardnormierung so nicht durchführbar -> Normalisierung über Flächentransformation - Gründe für Abweichungen: Merkmal nicht normV (Verwendung PR-Normen) Heterogene Analysestichprobe (Erstellung von Subgruppen) Einseitige Itemschwierigkeit (Normalisierung sinnvoll) - Normalisierung über Prozentränge: 1. Berechnung von Prozentrangnormen 2. Überführen der PR- in z-Werte -> Hier Normalisierung 3. Transformation der z-Werte in Standardnormäquivalente (T-, Stanine-Skala)

Answer 10

- Abgleich mit psychologisch-inhaltlichen Beschreibungen, die Bedeutung der Testrohwerte charakterisieren -> Abgleich mit "Soll"-Wert - Beurteilung des Testwerts nicht am Durchschnitt anderer, sondern vorher festgelegtem Kriterium

Answer 11

- Verbreitete psychologische testverfahren meist normorientiert: Fokus auf vergleich einer Personen mit anderen hinsichtlich des Merkmals - Kein grundsätzlicher Gegensatz - Bei Normorientierter Interpretation Trennschärfe wichtiger als bei kriteriumsorientierter