Vorlesung 3 Flashcards

1
Q

Drei Hauptgütekriterien

A

Objektivität (Unabhängigkeit)
Reliabilität (Zuverlässigkeit)
Validität (Gültigkeit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Objektivität

A

Gibt an, in welchem Maße die Ergebnisse vom Testanwender abhängig sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Durchführungsobjektivität

A

Durchführungsbedingungen müssen genau spezifiziert sein.
Durchführung unabhängig von Testleiter immer gleich.
Anweisungen zu: Zeitvorgaben, Materialien, Umgang mit Fragen, standardisierte Instruktionen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Auswertungsobjektivität

A

Genaue Angaben, wie eine Antwort zu verstehen ist.
Leistungstest: richtig falsch
Persönlichkeitstest: hoch niedrig
Klinische Diagnose: gegeben nicht gegeben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Interpretationsobjektivität

A

Klare Vorgaben, was individuelle Rohwerte bedeuten.
Test somit unabhängig vom Ort, Zeit, Testleiter:in oder Auswerter:in

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Reliabilität

A

Zuverlässigkeit oder Genauigkeit der Messung
Definiert als das Verhältnis der Varianz der True Scores und der beobachteten Testwerte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Werte der Reliabilität

A

Maximalwert: rel(X) = 1
▶ Die Varianz der Messfehler ist 0.
▶ Die Messung ist frei von Messfehlern.
Minimalwert: rel(X) = 0
▶ Die Varianz der True Scores ist 0.
▶ Die Messung reflektiert nur Messfehler.
Reliabilität sollte > .80 sein; problematisch, wenn < .60

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Retest-Reliabilität

A

Eine Person mehrmals mit demselben Test untersuchen
Bei Zeitstabilen Merkmalen bleibt der wahre Wert einer Person identisch, der Fehleranteil variiert
Probleme: Reliabilität vs. Stabilität, Lerneffekte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Paralleltest-Reliabilität

A

Entwicklung von zwei parallelen Testversionen, die das Merkmal X identisch operationalisieren
Die Korrelation zwischen den Tests dient als Schätzer der Reliabilität
Probleme: Hoher Aufwand, Positionseffekte (Ermüdung)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Testhalbierungs-Reliabilität

A

Man schaut, ob verschiedene Teile des gleichen Tests zu ̈ahnlichen Ergebnissen kommen.
Korrelation zwischen beiden Testhälftem dient als Schätzer der Reliabilität
Probleme: Aufteilung der Items, Testhälften selbst schon mit Fehlern behaftet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Interne-Konsistenz

A

Man schaut, ob die einzelnen Items eines Tests zu dem gleichen Ergebnis kommen.
Jedes Item ist ein eigener kleiner Test und wird mit den anderen korreliert
Mittlere Korrelation zwischen den Items dient als Schätzer der Reliabilität
Probleme: Heterogene Konstrukte, mehrdimensionale Tests

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Cronbachs alpha

A

Variiert zwischen -unendlich und 1
Negative Werte können nicht interpretiert werden
Werte über .6 gelten als akzeptabel, Werte über .8 als gut

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Validität

A

Gibt an, wie gut der Test das misst, was er zu messen vorgibt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Inhaltsvalidität

A

Der Inhalt der Testitems deckt alle relevanten Aspekte des Konstrukts erschöpfend ab
Problem: nicht quantifizierbar, Einschätzung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kriteriumsvalidität

A

Korrelation mit einem relevanten Außenmerkmal
Entweder Konkurrent (gleichzeitige Erfassung) oder prognostisch (spätere Erfassung)
Validitäten zwischen .4 und .6 zufriedenstellend

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Konstruktvalidität

A

Ableitung von Hypothesen, die durch die Testergebnisse bestätigt werden

17
Q

Konstruktvalidität (konvergent)

A

Korrelationen mit Konstrukten, mit denen der Test korrelieren sollte (z.B. sollte die Leseleistung mit der Rechtschreibleistung korrelieren)

18
Q

Konstruktvalidität (diskriminant)

A

Keine Korrelationen mit Konstrukten, mit denen der Test nicht korrelieren sollte (z.B. sollte die Leseleistung, nur schwach mit der non-verbalen Intelligenz korrelieren)

19
Q

Beziehung zwischen den Gütekriterien

A

Bauen auf einander auf:
▶ Die Reliabilität kann nur so hoch sein, wie die Objektivität; aber ein objektiver Test ist nicht zwangsläufig reliabel.
▶ Die Validität kann nur so hoch sein, wie die Reliabilität; aber ein reliabler Test ist nicht zwangsläufig valide.

20
Q

Reliabilitäts-Fidelitäts-Dilemma

A

Reliabilit ̈ats-Verfahren, die auf der Bestimmung der Homogenit ̈at basieren (z.B. interne Konsistenz), fallen höher aus, je homogener die eingesetzten Aufgaben sind?
Kann Breite (Fidelität) des abgedeckten Konstrukts einschränken

21
Q

Nebengütekriterium Fairness

A

Wenn Messwerte für alle Probanden frei von Diskriminierung sind

22
Q

Nebengütekriterium Ökonomie

A

Wenn ein Instrument diagnostische Daten gleicher Qualität zu einem günstigeren Preis (bzw. in kürzerer Zeit) liefert als alternative Instrumente.
Gruppen vs. Einzeltestung beispielsweise

23
Q

Nebengütekriterium Nützlichkeit

A

Wenn:
Liefert Informationen, die bereits vorhandene Verfahren nicht liefern können
Hilft Fehler zu verhindern, die bei anderen Instrumenten durch mehrmalige Verwendung zu befürchten wären

24
Q

Nebengütekriterium Zumutbarkeit und soziale Akzeptanz

A

Wenn erforderlichen Informationsgewinnung von Seiten der Diagnostiker:innen und Proband:innen als gewinnbringend angesehen werden
▶ zeitsparende Verfahren sind in der Regel eher akzeptiert.
▶ transparente Verfahren werden in der Regel eher akzeptiert.