04 Hauptgütekriterien Flashcards
Was sind die drei Hauptgütekriterien von Tests?
- Objektivität
- Reliabilität
- Validität
Was sind Gütekriterien?
Qualitätsmerkmale psychologisch-diagnostischer Verfahren
Was sollte ich als Psychologin beim auswählen von Tests beachten?
Testhandbücher lesen und beurteilen, ob die Gütekriterien erfüllt sind oder nicht.
Welche drei Arten der Objektivität gibt es?
- Durchführungsobjektivität
- Auswertungsobjektivität
- Interpretationsobjektivität
Was ist Objektivität?
In welchem Ausmass ist die Testung unabhängig von der Person, die die Testung durchführt, auswertet und interpretiert?
Wie kann Objektivität sicher gestellt werden?
Durch Gewissenhaftigkeit und Organisation
Welche drei Arten von Reliabilität gibt es?
- (Innere) Konsistenz
- Retest-Korrelation
- Paralleltest-Korrelation
Was ist Reliabilität
Wie genau kann ein Verfahren ein Messgegenstand erfassen? (Messgenauigkeit)
Was ist Validität?
Kann das Verfahren das Messen, was es zu Messen beansprucht?
(Wenn z.B. eine Waage 3kg daneben liegt, und das jeden Tag, misst sie zwar Reliabel, das angezeigte Gewicht ist aber dann nicht valide)
Welche Arten von Validität gibt es?
- Inhaltsvalidität
- Konstruktvalidität
- Kriteriumsvalidität
Warum sind die Hauptgütekriterien Hierarchisch?
Wenn das erste Kriterium - Objektivität - nicht gegeben ist, kann ein Test auch nicht reliabel und valide sein.
Wie kann Durchführungsobjektivität sichergestellt werden?
Standardisierte Testvorgabe (z.B. welche Hilfsmittel die Testperson brauchen darf, wie der Raum aussieht, wie sich die Testleitung verhalten und was sie sagen soll).
Wie kann Auswertungsobjektivität hergestellt werden?
- Methode des lauten Denkens
- Mehrere Personen, die auswerten
- Klarer Auswertungsschlüssel
- Materialien wie Auswertungsschablonen, Auswertungsblätter oder Auswertungsprogramme
Wie kann man Auswertungsobjektivität empirisch bestimmen?
- Qualitativ: Methode des Lauten Denkens -> Person probiert Auswertung aus und denkt dabei laut
- Korrelation zwischen den Auswertern berechnen
- Varianzanalytische Pläne: Vraianz zwischen den Protokollbogen durch Varianz aller Testwerte)
Wie kann die Interpretationsobjektivität hergestellt werden?
- Standardisierte Interpretation im Manual
- Verschieden AuswerterInnen kommen zur gleichen Interpretation
Welche Validität ist direkt an die eigentliche Validität geknüpft?
Inhaltsvalidität
Was ist Inhaltsvalidität?
Wenn ein test/Fragebogen jedes Item des Merkmals wirklich hinreichend Präzise erfasst. -> die eigentliche Validität
z.B. “Ich gehe gerne auf Parties und bin immer pünktlich da” misst nicht nur Extraversion, sondern auch Gewissenhaftigkeit -> dies soll vermieden werden.
Was ist das Problem bei der Inhaltsvalidität?
Es gibt keinen statistischen Kennwert dafür, man kann sie nur durch Literatur und Logik oder mithilfe von Experten belegen.
-> Deswegen gibt es auch die Kriteriumsvalidität und die Kontruktvalidität, weil es dort möglich ist. -> Diese Arten bestimmten die Validität aber INDIREKT
Was hat einen wichtigen Einfluss auf die Validität?
Die Stichprobe -> eine homogene Stichprobe kann die Korrelationen verfälschen!
Was ist Augenscheinvalidität? (Zusätzlicher Validitätsbegriff)
Wenn der blosse Augenschein eines Tests für einen Laien gerechtfertigt erscheint. -> z.B. für den Getesteten
Was ist die Kriteriumsvalidität?
Hängt das Konstrukt (z.B. Einstellungsinterview, Intelligenztest), welches das Kriterium vorhersagen soll, Hypothesenkonform mit einem bestimmten Kriterium (z.B. Leistung der Mitarbeiter, Abiturnote) zusammen?
-> z.B. Vorhersagevalidität, Übereinstimmungsvalidität, Retrospektive Validität, Inkrementelle Validität
Was ist die Konstruktvalidität?
Hängt das Konstrukt mit andern, verwandten Konstrukten zusammen und mit fernen Konstrukten nicht zusammen?
(z.B. vergleich zweier Tests / zweier Abstrakter Konzepte (z.B. Intelligenz(tests)))
Was ist Inhaltsvalidität?
Ein Test und jedes Item davon misst das zu messende Merkmal (und nur das) hinreichend präzise.
Welche drei Arten von Konstruktvalidität gibt es?
- Konvergente Konstruktvalidität
- Diskriminante Konstruktvalidität
- Faktorielle Konstruktvalidität
Welche vier Arten der Kriteriumsvalidität gibt es?
- Vorhersagevalidität (Übereinstimmung des Konstruktes mit Zukünftigem Ereignis)
- Übereinstimmungsvalidität (Übereinstimmung des Konstruktes mit zeitgleichem Ereignis)
- Retrospektive Validität (Übereinstimmung des Konstruktes mit vergangenem Ereignis)
- Inkrementelle Validität (misst sogar mehr als nur das Kriterium - erklärt mehr als die bisher etablierten Tests, Intelligenz erklärt z.B. nicht nur Schulerfolg sondern auch Berufserfolg)
Was ist ein Beispiel der inkrementellen Validität
Konstrukt “Emotionale Intelligenz” gilt als inkrementell valide, wenn das Mass für “Emotionale Intelligenz” über Intelligenz in seiner Standardform und Persönlichkeit im Sinne der Big 5 noch etwas mehr darüber hinaus vorhersagt.
Warum ist inkrementelle Validität gerade bei neuen Tests so wertvoll?
Wenn inkrementelle Validität gegeben ist, erklärt ein neuer Test etwas, was bisherige Tests noch nicht erklären konnten.
Was ist die Konvergente Validität
Zusammenhang zwischen eigenem Test und anderem Test des GLEICHEN Gültigkeitsbereiches.
(z.B. Intelligenz vs. Intelligenz)
-> ab zirka .20 Korrelation wird als ausreichend hoch angesehen bei unterschiedlichen Erfassungsmethoden (z.B. bei fragebogen vs semiprojektive Verfahren).
Was ist die Diskriminante Validität?
Zusammenhang des eigenen Tests mit anderem Test eines ANDEREN Gültigkeitsbereiches.
(z.B. Intelligenztest vs. Mass, dass Motivation erfasst)
-> Hier werden niedrige Zusammenhänge erwartet
Was ist die faktorielle Validität?
Lässt sich die theoretisch angenommene Struktur des Tests auch empirisch finden?
-> z.B. lassen sich Big5 auch in der Faktorenanalyse finden? (Konfirmatorische Faktorenanalyse)
Welche Methoden zur bestimmung der Konstruktvalidität gibt es?
- Konfirmatorische Faktorenanalyse
- Nicht Korrelative Ansätze
- MTMM-Matrix
Welche nicht.korrelativen Ansätze zur Bestimmung der Konstruktvalidität gibt es?
- Analyse von Gruppenunterschiede (z.B. Depressive vs. nicht Depressive -> unterscheiden sie sich?)
- Extremgruppenvalidierungen (z.B. Erhalten Hochbegabte tatsächlich hohe werte?)
- Prozessanalyse (z.B. lautes Denken -> Wird Konstrukt auch so verstanden, wie es intendiert war)
- Vergleich von Selbst- und Fremdeinschätzungen
- Experimentelle Variation (z.B. Analyse von Stabilität vs. Veränderung von Testwerten, z.B. Stimmungen, je nach Präsentation von Reizen, sollten sich verändern)