Testgütekriterien Flashcards

1
Q

Nenne die 3 Hauptgütekriterien

A

Objektivität, Validität und Reliabilität
sind für jedes diagnostische Verfahren von Bedeutung, werden jedoch oft nicht explizit geprüft

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nenne und beschreibe die 3 Unterkategorien von Objektivität

A

Durchführungsobjektivität (Testleiterunabhängigkeit): Selbsterklärend, Problematik: nicht nur Testleiter sondern auch Bedingungen variieren, also ergeben sich auch bei gleichem Testleiter unterschiedliche Ergebnisse - wichtig ist hier die Standardisierung der Durchführung

Auswertungsobjektiivität (Verrechnungssicherheit): Abhängig von der Freihheit der Antworten und Reglementierung bei der Beurteiung

Interpretationsobjektivität (-eindeutigkeit) : verschiedene Beurteiler kommen zu den gleichen Ergebnissen- Sicherstellung durch Normierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was versteht man unter Objektivität?

A

die Unabhängigkeit der Untersuchung vom Diagnostiker

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist Reliabilität und wie wird sie bestimmt?

A

gilt als Messgenauigkeit des Instruments. Ein Test ist reliabel, wenn er das Merkmal ohne Messfehler misst
Quotient aus wahrer und beobachteter Varianz bzw als Anteil der Varianz der wahren Werte (T) an der Varianz der beobachteten Werte (X), oder auch als Korrelation zweier Paralleltests
Rel=Var(T)/Var(X)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Auf welche Weisen kann die Reliabilität bestimmt werden? (4)

A

Testwiederholung (Retest-Reliabilität)
Paralleltestmethode
Testhalbierung (split-half-Reliabilität)
Interne Konsistenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beschreibe die Verfahren zur Reliabilitätsbestimmung (4)

A

Testwiederholung (Retest-Reliabilität): Der Test wird unter möglichst gleichen Bedinungen (mit den selben Probanden) wiederholt. ► Der Korrelationskoeffizient gilt als Schätzung der Messgenauigkeit

Paralleltest: besteht aus gleichen, aber nicht den selben Items ► idealerweise äquivalent (gleiche Mittelwerte und Streuungen) 2 Gruppen: 1. bearbeitet zuerst TestA dann TestB, 2. andersherum| häufig angewendet bei Niveau-/Powertests und Speedtests

Testhalbierung (split-half-Reliabilität): “Quasi-Parallelform”- Test wird in 2 gleiche Hälften aufgeteilt, Testwerte der Testhälften werden korreliert

Interne Konsistenz: Erweiterung der Halbierungsreliabilität, Test wird in so viele Teile geteilt, wie er Items hat. häufigst verwendet, prüft inneren Zusammenhang der Items unter Berücksichtigung der Testlänge, meist Cronbach-α

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welches Probleme entstehen bei der Testwiederholung (Retest Reliabilität)

A

Dilemma bei der Auswahl des Zeitintervalls zwischen den 2 Tests
Es gilt zum einen, Übungs- und Erinnerungseffekte zu vermeiden, zum anderen sollen sich die wahren Werte der Probanden zwischen den Tests möglichst wenig verändern
(Übungseffekte werden durch lange Zeitintervalle vermieden, die höchste Konstanz haben möglichst kleine Zeitintervalle)

Außerdem erhöht sich die Reliabilität, wenn die Probanden absichtlich ähnlich antworten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Welche Vor- und Nachteile gibt es bei Paralleltests zur Feststellung der Reliabilität (3/4)

A

+ keine Lern-/Erinnerungseffekte (weil andere Items)
+ kein langer Testabstand notwendig
+ auch bei instabilen Merkmalen anwendbar

  • hoher Aufwand bei der Erstellung der Parallelform
  • teils nicht möglich (zB bei eng begrenzten Merkmalen ohne ““Alternativ-Items””)
  • Parallelformen sind nie vollkommen äquivalent (mindert Reliabilitässchätzung, idR niedriger als Retest-Reliabilität)
  • Übungseffekte sind auch bei Paralleltests möglich (zB ähnliche Lösungsstrategien)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welchen Vorteil birgt Testhalbierung (split-half-reliability) gegenüber Paralleltests?

A

Ein Test muss nur ein mal einer Stichprobe vorgelegt werden und dann in zwei Hälften aufgeteilt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Beschreibe Validität und ihre Beziehung zu den anderen Hauptgütekriterien
Welche Arten von Validität gibt es?

A

Validität ist Objektivität und Reliabilität übergeordnet, und gibt an, ob der Test auch das misst, was er messen soll
Inhaltliche Validität (Augenschein-Validität), Kriterienbezogene Validität, Inkrementelle Validität, Konstruktvalidität, (konvergente Validität, diskriminante Validität)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Beschreibe 4 Arten von Validität

A

Inhaltliche: repräsentieren die Items logisch-inhaltlich das zu erfassende Konstrukt?(für operational definierte Merkmale zB schulische Prüfungen) - für theoretisch definierte Konstrukte (zB Extraversion): inwieweit können mithilfe des Konstrukts unterschiedliche Antworten schlüssig erklärt werden

Kriterienbezogene: “das betreffende Konstrukt kann durch eine Kriteriumsmessung direkt sichtbar gemacht werden” ►Operationalisierung anhand eines Kriteriums (Korrelation Test mit Kriterium)

Inkrementelle: welchen Beitrag vermag ein weiterer Test zur Vorhersage eines Kriteriums zu leisten, zB ein Intelligenztest über das strukturierte Interview hinaus zur Vorhersage des Ausbildungserfolgs beiträgt

Konstruktvalidität: bezieht sich auf latente, theoretische Konstrukte- “diese stehen mit anderen Konstrukten in systematischer Verbindung” - nutzt konvergente Validität und diskriminante Validität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind konvergente und diskriminante Validität

A

konvergent: Validität zwischen Konstrukten, bei denen Zusammenhänge vermutet werden
diskriminant: Konstrukte, die vermutlich nichts miteinander zu tun haben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Nenne ein Beispiel für die Anwendung von Konstruktvalidität

A

Validitätsschätzung des Intelligenz-Struktur-Tests 2000 R (I-S-T 2000 R)
Was spricht für Konstruktvalidität? hohe Korrelationen mit konvergenten Tests und niedrige Korrelationen mit diskriminanten Validitäten (zB einem Konzentrationstests und einem Wortschatztest)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Beschreibe die Multitrait-Multimethod-Analyse

A

Zur Erfassung und Berechnung der (Konstrukt-?) Validität
Ziel der Multitrait-Multimethod-Analyse ist die Isolation von Methodeneffekten anhand der Kontrolle des methodenspezifischen Bias durch die Verwendung unterschiedlicher Messmethoden
mindestens zwei oder drei Traits werden durch min. 2 oder 3 Methoden gemessen ► Erstellung einer Multitrait-Multimethod-Matrix / Korrelationsmatrix

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nenne Bestandteile einer Multitrait-Multimethod-Analyse

A

Reliabilitätsdiagonale (Hauptdiagonale, Reliabilitäten der Verfahren)
Validitätsdiagonalen (monotrait-heteromethod): Ein Merkmal wird mit verschiedenen Methoden gemessen (sollte konvergente Validität zeigen)
“heterotrait-Monomethod-Dreiecke”: Verschiedene Merkmale werden mit der gleichen Methode erfasst (sollte diskriminante Validität zeigen)
“Heterotrait-Heteromethod-Dreieck” alle anderen Felder, verschiedene Merkmale werden mit verschiedenen Methoden gemessen (sollten keinen Zusammenhang zeigen)
die Felder über der Reliabilitätsdiagonale bleiben leer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie kann die Reliabilität die Validität beeinflussen?

A

Je höher die Reliabilität, desto höher kann die Validität ausfallen. Jede Abweichung der Reliabilität vom Idealwert 1 resultiert in einer Reduzierung der Korrelation mit einem anderen Kennwert

17
Q

Nenne 7 Nebengütekriterien

A

Skalierung
Normierung
Testökonomie
Nützlichkeit
Zumutbarkeit
Unverfälschbarkeit
Fairness

18
Q

Beschreibe die 7 Nebengütekriterien
(Skalierung, Normierung, Testökonomie, Nützlichkeit, Zumutbarkeit, Unverfälschbarkeit, Fairness)

A

☼ Skalierung/ Eindeutigkeit der Messung: wenn Testwerte die empirischen Merkmalsrelationen adäquat abbilden
☼ Normierung (Eichung)
☼ Testökonomie: Aufwand für Probanden und Diagnostiker (Kosten, Material, Zeit, Belastungen)
☼ Nützlichkeit: Test liefert relevante Informationen
☼ Zumutbarkeit: Belastung des Tests für Probanden
☼ Unverfälschbarkeit: bewusster Einfluss des Probanden
☼ Fairness: culture fair Intelligenztest zB, Unabhängig von anderen Einflüssen wie Kultur, Geschlecht, ethnischer Zugehörigkeit

19
Q

Was ist das Testkuratorium und wofür ist es verantwortlich?

A

von verschiedenen Psychologenvereinigungen (ua- DGP+BDP) gestelltes Gremium mit der Aufgabe die Öffentlichkeit vor unzureichenden- und vor unqualifizierter Anwendung diagnostischer Verfahren zu schützen und verbindliche Qualitätsstandards zu formulieren
konzipiert System zur Beurteilung der Güte von Tests, welches Grundlage für DIN 33430 zur berufsbezogenen Eignungsbeurteilung ist

20
Q

Wofür stehen DGP und BDP?

A

Deutsche Gesellschaft für Psychologie
Berufsverband Deutscher Psychologinnen und Psychologen

21
Q

Nenne die 8 Besprechungs- und Beurteilungskategorien des Testkuratoriums für die Beurteilung von Tests

A

1- Allgemeine Informationen über den Test, Beschreibung und diagnostische Zielsetzung
2. Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion
3. Objektivität
4. Normierung (Eichung)
5. Reliabilität (Zuverlässigkeit, Messgenauigkeit)
6. Validität (Gültigkeit)
7. Weitere Gütekriterien (Störanfälligkeit, Unverfälschbarkeit, Skalierung)
8. Abschlussbewertung/ Empfehlung

22
Q

In welchen 3 Schritten erfolgt der Beurteilungsprozess von Tests zur Qualitätssicherung

A
  1. Prüfung der Verfahrenshinweise auf grundsätzliche Erfüllung der in der DIN 33430 formulierten Anforderungen, wenn ja:
  2. Testkategorisierung nach ZPID (Zentrum für psychologische Information und Dokumentation) und Merkmalen aus EFPA (European Federation of Psychologists Associations) vornehmen und
  3. den Test anhand der Besprechungs- und Beurteilungskategorien des Testkuratoriums bewerten
23
Q

Wie teilt man Validität noch ein?

A

in externe und interne Validität
extern: in beziehung zu anderen Tests
intern: in bezug zur eigenen aussage?

24
Q

Nenne Vor- und Nachteile vom PFK 9-14

A

+ breite und gleichzeitig differenzierte Erfassung der kindlichen Persönlichkeit
+ zeitkonstante Erlebens- und Verhaltenscharakteristika und Persönlichkeitszüge werden auf höherem Niveau erfasst
+ eignet sich als Einzel- oder Gruppentest
+ Reliabilität, Validität und Objektivität sind angemessen
+ökonomisch und empirisch gut gestützt

  • soziale Erwünschtheit
  • nicht zeitgemäße Formulierung
  • hoher Materialaufwand
  • Manual sehr umfangreich, “zu ausführlich”
  • mangelnde Interpretationsvorschläge für Faktoren 2. Ordnung, zu ausführliche für Primärdimensionen
  • sind Fragen für 9 und 14 jährige gleichermaßen geeignet