Testgütekriterien Flashcards

Question 1

Q

Nenne die 3 Hauptgütekriterien

Answer

A

Objektivität, Validität und Reliabilität
sind für jedes diagnostische Verfahren von Bedeutung, werden jedoch oft nicht explizit geprüft

Question 2

Q

Nenne und beschreibe die 3 Unterkategorien von Objektivität

Answer

A

Durchführungsobjektivität (Testleiterunabhängigkeit): Selbsterklärend, Problematik: nicht nur Testleiter sondern auch Bedingungen variieren, also ergeben sich auch bei gleichem Testleiter unterschiedliche Ergebnisse - wichtig ist hier die Standardisierung der Durchführung

Auswertungsobjektiivität (Verrechnungssicherheit): Abhängig von der Freihheit der Antworten und Reglementierung bei der Beurteiung

Interpretationsobjektivität (-eindeutigkeit) : verschiedene Beurteiler kommen zu den gleichen Ergebnissen- Sicherstellung durch Normierung

Question 3

Q

Was versteht man unter Objektivität?

Answer

A

die Unabhängigkeit der Untersuchung vom Diagnostiker

Question 4

Q

Was ist Reliabilität und wie wird sie bestimmt?

Answer

A

gilt als Messgenauigkeit des Instruments. Ein Test ist reliabel, wenn er das Merkmal ohne Messfehler misst
Quotient aus wahrer und beobachteter Varianz bzw als Anteil der Varianz der wahren Werte (T) an der Varianz der beobachteten Werte (X), oder auch als Korrelation zweier Paralleltests
Rel=Var(T)/Var(X)

Question 5

Q

Auf welche Weisen kann die Reliabilität bestimmt werden? (4)

Answer

A

Testwiederholung (Retest-Reliabilität)
Paralleltestmethode
Testhalbierung (split-half-Reliabilität)
Interne Konsistenz

Question 6

Q

Beschreibe die Verfahren zur Reliabilitätsbestimmung (4)

Answer

A

Testwiederholung (Retest-Reliabilität): Der Test wird unter möglichst gleichen Bedinungen (mit den selben Probanden) wiederholt. ► Der Korrelationskoeffizient gilt als Schätzung der Messgenauigkeit

Paralleltest: besteht aus gleichen, aber nicht den selben Items ► idealerweise äquivalent (gleiche Mittelwerte und Streuungen) 2 Gruppen: 1. bearbeitet zuerst TestA dann TestB, 2. andersherum| häufig angewendet bei Niveau-/Powertests und Speedtests

Testhalbierung (split-half-Reliabilität): “Quasi-Parallelform”- Test wird in 2 gleiche Hälften aufgeteilt, Testwerte der Testhälften werden korreliert

Interne Konsistenz: Erweiterung der Halbierungsreliabilität, Test wird in so viele Teile geteilt, wie er Items hat. häufigst verwendet, prüft inneren Zusammenhang der Items unter Berücksichtigung der Testlänge, meist Cronbach-α

Question 7

Q

Welches Probleme entstehen bei der Testwiederholung (Retest Reliabilität)

Answer

A

Dilemma bei der Auswahl des Zeitintervalls zwischen den 2 Tests
Es gilt zum einen, Übungs- und Erinnerungseffekte zu vermeiden, zum anderen sollen sich die wahren Werte der Probanden zwischen den Tests möglichst wenig verändern
(Übungseffekte werden durch lange Zeitintervalle vermieden, die höchste Konstanz haben möglichst kleine Zeitintervalle)

Außerdem erhöht sich die Reliabilität, wenn die Probanden absichtlich ähnlich antworten

Question 8

Q

Welche Vor- und Nachteile gibt es bei Paralleltests zur Feststellung der Reliabilität (3/4)

Answer

A

+ keine Lern-/Erinnerungseffekte (weil andere Items)
+ kein langer Testabstand notwendig
+ auch bei instabilen Merkmalen anwendbar

hoher Aufwand bei der Erstellung der Parallelform
teils nicht möglich (zB bei eng begrenzten Merkmalen ohne ““Alternativ-Items””)
Parallelformen sind nie vollkommen äquivalent (mindert Reliabilitässchätzung, idR niedriger als Retest-Reliabilität)
Übungseffekte sind auch bei Paralleltests möglich (zB ähnliche Lösungsstrategien)

Question 9

Q

Welchen Vorteil birgt Testhalbierung (split-half-reliability) gegenüber Paralleltests?

Answer

A

Ein Test muss nur ein mal einer Stichprobe vorgelegt werden und dann in zwei Hälften aufgeteilt werden.

Question 10

Q

Beschreibe Validität und ihre Beziehung zu den anderen Hauptgütekriterien
Welche Arten von Validität gibt es?

Answer

A

Validität ist Objektivität und Reliabilität übergeordnet, und gibt an, ob der Test auch das misst, was er messen soll
Inhaltliche Validität (Augenschein-Validität), Kriterienbezogene Validität, Inkrementelle Validität, Konstruktvalidität, (konvergente Validität, diskriminante Validität)

Question 11

Q

Beschreibe 4 Arten von Validität

Answer

A

Inhaltliche: repräsentieren die Items logisch-inhaltlich das zu erfassende Konstrukt?(für operational definierte Merkmale zB schulische Prüfungen) - für theoretisch definierte Konstrukte (zB Extraversion): inwieweit können mithilfe des Konstrukts unterschiedliche Antworten schlüssig erklärt werden

Kriterienbezogene: “das betreffende Konstrukt kann durch eine Kriteriumsmessung direkt sichtbar gemacht werden” ►Operationalisierung anhand eines Kriteriums (Korrelation Test mit Kriterium)

Inkrementelle: welchen Beitrag vermag ein weiterer Test zur Vorhersage eines Kriteriums zu leisten, zB ein Intelligenztest über das strukturierte Interview hinaus zur Vorhersage des Ausbildungserfolgs beiträgt

Konstruktvalidität: bezieht sich auf latente, theoretische Konstrukte- “diese stehen mit anderen Konstrukten in systematischer Verbindung” - nutzt konvergente Validität und diskriminante Validität

Question 12

Q

Was sind konvergente und diskriminante Validität

Answer

A

konvergent: Validität zwischen Konstrukten, bei denen Zusammenhänge vermutet werden
diskriminant: Konstrukte, die vermutlich nichts miteinander zu tun haben

Question 13

Q

Nenne ein Beispiel für die Anwendung von Konstruktvalidität

Answer

A

Validitätsschätzung des Intelligenz-Struktur-Tests 2000 R (I-S-T 2000 R)
Was spricht für Konstruktvalidität? hohe Korrelationen mit konvergenten Tests und niedrige Korrelationen mit diskriminanten Validitäten (zB einem Konzentrationstests und einem Wortschatztest)

Question 14

Q

Beschreibe die Multitrait-Multimethod-Analyse

Answer

A

Zur Erfassung und Berechnung der (Konstrukt-?) Validität
Ziel der Multitrait-Multimethod-Analyse ist die Isolation von Methodeneffekten anhand der Kontrolle des methodenspezifischen Bias durch die Verwendung unterschiedlicher Messmethoden
mindestens zwei oder drei Traits werden durch min. 2 oder 3 Methoden gemessen ► Erstellung einer Multitrait-Multimethod-Matrix / Korrelationsmatrix

Question 15

Q

Nenne Bestandteile einer Multitrait-Multimethod-Analyse

Answer

A

Reliabilitätsdiagonale (Hauptdiagonale, Reliabilitäten der Verfahren)
Validitätsdiagonalen (monotrait-heteromethod): Ein Merkmal wird mit verschiedenen Methoden gemessen (sollte konvergente Validität zeigen)
“heterotrait-Monomethod-Dreiecke”: Verschiedene Merkmale werden mit der gleichen Methode erfasst (sollte diskriminante Validität zeigen)
“Heterotrait-Heteromethod-Dreieck” alle anderen Felder, verschiedene Merkmale werden mit verschiedenen Methoden gemessen (sollten keinen Zusammenhang zeigen)
die Felder über der Reliabilitätsdiagonale bleiben leer

Question 16

Q

Wie kann die Reliabilität die Validität beeinflussen?

Answer

A

Je höher die Reliabilität, desto höher kann die Validität ausfallen. Jede Abweichung der Reliabilität vom Idealwert 1 resultiert in einer Reduzierung der Korrelation mit einem anderen Kennwert

Question 17

Q

Nenne 7 Nebengütekriterien

Answer

A

Skalierung
Normierung
Testökonomie
Nützlichkeit
Zumutbarkeit
Unverfälschbarkeit
Fairness

Question 18

Q

Beschreibe die 7 Nebengütekriterien
(Skalierung, Normierung, Testökonomie, Nützlichkeit, Zumutbarkeit, Unverfälschbarkeit, Fairness)

Answer

A

☼ Skalierung/ Eindeutigkeit der Messung: wenn Testwerte die empirischen Merkmalsrelationen adäquat abbilden
☼ Normierung (Eichung)
☼ Testökonomie: Aufwand für Probanden und Diagnostiker (Kosten, Material, Zeit, Belastungen)
☼ Nützlichkeit: Test liefert relevante Informationen
☼ Zumutbarkeit: Belastung des Tests für Probanden
☼ Unverfälschbarkeit: bewusster Einfluss des Probanden
☼ Fairness: culture fair Intelligenztest zB, Unabhängig von anderen Einflüssen wie Kultur, Geschlecht, ethnischer Zugehörigkeit

Question 19

Q

Was ist das Testkuratorium und wofür ist es verantwortlich?

Answer

A

von verschiedenen Psychologenvereinigungen (ua- DGP+BDP) gestelltes Gremium mit der Aufgabe die Öffentlichkeit vor unzureichenden- und vor unqualifizierter Anwendung diagnostischer Verfahren zu schützen und verbindliche Qualitätsstandards zu formulieren
konzipiert System zur Beurteilung der Güte von Tests, welches Grundlage für DIN 33430 zur berufsbezogenen Eignungsbeurteilung ist

Question 20

Q

Wofür stehen DGP und BDP?

Answer

A

Deutsche Gesellschaft für Psychologie
Berufsverband Deutscher Psychologinnen und Psychologen

Question 21

Q

Nenne die 8 Besprechungs- und Beurteilungskategorien des Testkuratoriums für die Beurteilung von Tests

Answer

A

1- Allgemeine Informationen über den Test, Beschreibung und diagnostische Zielsetzung
2. Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion
3. Objektivität
4. Normierung (Eichung)
5. Reliabilität (Zuverlässigkeit, Messgenauigkeit)
6. Validität (Gültigkeit)
7. Weitere Gütekriterien (Störanfälligkeit, Unverfälschbarkeit, Skalierung)
8. Abschlussbewertung/ Empfehlung

Question 22

Q

In welchen 3 Schritten erfolgt der Beurteilungsprozess von Tests zur Qualitätssicherung

Answer

A

Prüfung der Verfahrenshinweise auf grundsätzliche Erfüllung der in der DIN 33430 formulierten Anforderungen, wenn ja:
Testkategorisierung nach ZPID (Zentrum für psychologische Information und Dokumentation) und Merkmalen aus EFPA (European Federation of Psychologists Associations) vornehmen und
den Test anhand der Besprechungs- und Beurteilungskategorien des Testkuratoriums bewerten

Question 23

Q

Wie teilt man Validität noch ein?

Answer

A

in externe und interne Validität
extern: in beziehung zu anderen Tests
intern: in bezug zur eigenen aussage?

Question 24

Q

Nenne Vor- und Nachteile vom PFK 9-14

Answer

A

+ breite und gleichzeitig differenzierte Erfassung der kindlichen Persönlichkeit
+ zeitkonstante Erlebens- und Verhaltenscharakteristika und Persönlichkeitszüge werden auf höherem Niveau erfasst
+ eignet sich als Einzel- oder Gruppentest
+ Reliabilität, Validität und Objektivität sind angemessen
+ökonomisch und empirisch gut gestützt

soziale Erwünschtheit
nicht zeitgemäße Formulierung
hoher Materialaufwand
Manual sehr umfangreich, “zu ausführlich”
mangelnde Interpretationsvorschläge für Faktoren 2. Ordnung, zu ausführliche für Primärdimensionen
sind Fragen für 9 und 14 jährige gleichermaßen geeignet