AK FLB I Flashcards
3 Hauptgütekriterien erläutern und je ein Beispiel nennen. ///
Kind kurz hintereinander beim schulpsychologischen Test - unterschiedliche Testwerte - Welches Hauptgütekriterium könnte verletzt sein und dessen Facetten nennen. Die beiden anderen Hauptgütekriterien erklären.
Validität: Ob Instrument wirklich erfasst, was es erfassen soll, u ob Schlussfolgerungen, die wir aus Ergebnissen in Bezug auf d zu erfassende Merkmal ziehen, auch wirklich zutreffend und damit gültig sind
> Zentrales Gütekriterium der Diagnostik
zB sollte Instrument wirklich Intelligenz erfassen u nicht ein anderes Merkmal wie Testängstlichkeit
Reliabilität: Erhebungsinstrument sollte ermöglichen, Merkmal zuverlässig zu erfassen, Unterschiede zw verschiedenen Messergebnissen versch Tests zeigen an, dass einzelne Messung mit Messfehler behaftet ist
> Kann man bei psychol Erhebungen meist nicht ausschließen, Einfluss sollte aber möglichst gering sein, damit zuverlässig / reliabel
zB Ergebnisse von Messungen / versch Tests d IQs eines Kindes dürfen sich nur unwesentlich unterscheiden
- Interne Konsistenz,
- Retest-Reliabilität,
- Testhalbierungs-Reliabilität,
- Paralleltest-Reliabilität
Objektivität: Ergebnis einer diagn Erhebung / Tests soll möglichst unabhängig vom Testleiter, Testsituationsmerkmalen, Rahmenbedingungen, Auswertern u interpretierenden Personen sein
zB sollte diagnostizierte Intelligenz nicht von Schulpsychologin abhängen, d Untersuchung durchgeführt hat
- Durchführungsobjektivität: Unabhängigkeit von Personen, die Verfahren anweisen bzw durchführen, aber auch Unabhängigkeit vom Ort der Erhebung usw
- Auswertungsobjektivität: Unabhängigkeit von Personen, die Verfahren auswerten
- Interpretationsobjektivität: Unabhängigkeit von Personen, die Ergebnisse eines Verfahrens interpretieren
Nennen Sie 3 weitere Gütekriterien.
- Skalierung
- Normierung
- Testökonomie
Definition psychologischer Test
s. Testtheorie und Testkonstruktion 1
Latente Variable (LV) mit Beispiel
Personenmerkmal, dessen Ausprägungen nicht direkt beobachtbar sind, sondern mit best WSK sich über beobachtbares Verhalten zeigt
> LV kennzeichnet Verhaltensdisposition, d sich – angeregt durch best Item – mit best WSK im beobachtbaren Verhalten zeigt
- Latentes Merkmal, deren Ausprägungen über beobachtbare Variablen geschätzt werden = Konstrukt
- Kann mithilfe d psychometr Rasch-Modells gemessen werden
zB emotionale Kompetenz (Fähigkeit, Emotionen zu erkennen)
Latent-Trait-Modelle beschreiben
- Gehen davon aus, dass latentes Merkmal kontinuierlich ist
- Unter latent trait versteht man in diesen Modellen eine kontinuierliche latente Variable
- In einem Latent-Trait-Modell kann die latente kontinuierliche Variable mit kategorialen oder kontinuierlichen beobachtbaren Variablen verknüpft werden
Latent-Trait-Modelle → Modell der Item-Response-Theorie, geht von latenten kontinuierlichen Variablen unabhängig von der Art der manifesten Items aus. Verknüpfung latente kontinuierliche Variable mit kategorialen oder kontinuierlichen beobachtbaren Variablen.
Psychometrische Modelle (Kreuztabelle latent/manifest - kategorial/kontinuierlich?) /// Variablen unterscheiden sich in manifeste und latente Variablen, die sowohl kontinuierlich oder kategorial sein können, ordnen Sie den jeweiligen Variablen ein passendes Modell zu.
s. Testtheorie und Testkonstruktion 1
Welcher Variablentyp auf Ebene der latenten Variablen ist in der Psychologie am häufigsten?
Kontinuierliche latente Variable, weil vielfach Persönlichkeitsmerkmale erfasst werden sollen, zB Extraversion, Rest der Big Five, Einstellungen
> Immer davon ausgehend, dass eindimensional gemessen wird
Konstruktvalidität erklären und Untersuchungsmethoden, davon 2 erklären
s. Testtheorie und Testkonstruktion 1
Validität + Facetten nennen und erläutern (Welches ist das wichtigste Gütekriterium der psychologischen Diagnostik?)
Validität: Es lassen sich zwei Bedeutungsfacetten unterscheiden
(1) Zum einen ist ein Test valide, wenn er das misst, was er zu messen vorgibt
(2) Zum anderen bezieht sie sich auf die Schlüsse, die aus den Testwerten
gezogen werden => Schlüsse aus Testwerten sind adäquat u angemessen
Facette der Validität:
1. Konstruktvalidität: Inwieweit können die Testwerte im Sinne des
zu erfassenden Konstrukts interpretiert werden?
Subfacetten der Konstruktvalidität:
2. Konvergente Validität: Weisen die Testwerte hohe Zusammenhänge
mit denen anderer Tests zur Erfassung desselben Konstrukts auf?
3. Diskriminante Validität: Weist der Testwert keine oder nur geringe
Zusammenhänge mit den Testwerten anderer Tests auf, die andere Konstrukte erfassen, die von dem zu erfassenden Konstrukt unabhängig sein sollen?
Facetten der Validität:
- Inhaltsvalidität (Kontentvalidität): Stellen die Items eine repräsentative Stichprobe von Items zur Erfassung des Konstrukts dar?
- Kriteriumsvalidität: Können anhand des Tests Merkmale vorhergesagt werden, die mit dem zu erfassenden Konstrukt zusammenhängen sollen?
- Konkurrent (Testergebnis führt zu Infos außerhalb d Testes, die zur gleichen Zeit passieren, zB leidet jmd an Depression?)
- Prädiktiv / prognostisch (Kann eine Vorhersage treffen, zB wird Jugendlicher mal delinquent?)
- Retrograd (Rückschlüsse auf zeitl vor Test liegende Ereignisse, zB von jetzigem Verhalten auf auslösende Faktoren schließen, warum jmd Störung entwickelt hat) - Augenscheinvalidität: Ist einem Laien offensichtlich, welches Konstrukt gemessen werden soll?
Erklären Sie Augenscheinvalidität und dessen Vor- und Nachteile.
- Augenscheinvalidität ist ggb, „wenn Validitätsanspruch eines Tests einem Laien, vom bloßen Augenschein her, gerechtfertigt erscheint“
> Hohe Augenscheinvalidität liegt vor, wenn anhand d Items offensichtlich ist, auf welches Konstrukt anhand d Testwerte geschlossen werden soll
> Ob hohe Augenscheinvalidität gewünscht ist o nicht, hängt vom Einsatzbereich d Tests ab (andere Validitätsarten werden grundsätzl angestrebt)
> Augenscheinvalidität leitet daher weniger d Konstruktionsprozess eines Tests
Vorteil:
Hohe Augenscheinvalidität ist anzustreben, wenn man Befürchtung hat, dass Person nicht motiviert ist, an Test teilzunehmen, bei dem nicht offensichtlich ist, was er messen soll
Nachteil:
Hohe Augenscheinvalidität in spezifischen Situationen kann dazu führen, dass Angaben verfälscht werden, um zB einen guten Eindruck zu hinterlassen
“Lautes Denken” erklären.
Bei Prozessanalysen kann man sich Methode d „lauten Denkens” bedienen:
- Man könnte zB Kinder bitten, bei Bearbeitung v Textaufgabe zu verbalisieren, was ihnen „durch den Kopf geht“
> Wird deutlich, dass Kind über mangelnde Sprachkompetenz verfügt u daher an Aufg scheitert, obwohl es Aufg ohne sprachlichen Kontext korrekt lösen könnte, würde dies zeigen, dass d Schluss vom Testergebnis auf Konstrukt, d gemessen werden soll (Multiplikationsfähigkeit), nicht valide wäre
Normorientierte (!) und kriteriumsorientierte Transformation erklären. Unterschied an Beispielen deutlich machen.
- Interpretation von Merkmalsausprägungen ist oft schwierig (Was bedeutets, wenn Kind 4 von 6 richtige Antworten hat?)
> Interpretation eines Testergebnisses ist einfacher, wenn man diese vor Hintergrund eines Bezugssystems bewertet
zB Verteilung der Testwerte in Bezugspopulation (Testwert mit Normwert vgl, zB Mittelwert einer Referenzpopulation)
» Eine Möglichkeit besteht darin, d z-Wert d Kindes zu bestimmen (z-Wert = Bsp für normorientierte Transformation von Merkmalsausprägungen, d sich an statistischen Verteilungskennwerten orientiert)
Normorientierte und kriteriumsorientierte Transformation (!) erklären. Unterschied an Beispielen deutlich machen.
- Bezugssystem zur Bewertung v Testergebnissen kann sich zB auf Erreichung eines Lehrziels, d Vorliegen einer spezif Leistung / Störung beziehen
- In letzterem Fall ist Bezugssystem ein Kriterium, d erfüllt sein kann / nicht
zB Einbürgerungstest in d 33 Fragen vorgelegt werden
> Personen, d mind 17 Fragen korrekt beantwortet haben, haben bestanden
> Zuordnung in zwei Klassen (nicht) bestanden orientiert sich an Kriterium, d auf theoret Überlegungen basiert
Reihenfolgeneffekte (Eines erläutern mit Beispiel)
Primingeffekte: Effekte, bei denen d Vorgabe eines Items dazu führt, dass best Infos erinnert werden, d in Folge schneller verfügbar sind
zB ist davon auszugehen, dass durch Vorgabe einer leichten Aufg zur %-Rechnung d entsprechende Wissen aktiviert u daher Bearbeitung einer
schwierigeren Textaufg, deren Lösung Prozentrechnung erfordert,
beschleunigt wird (vgl mit unmittelbarer Vorgabe)
> Bei Leistungstests muss man entsprechende Effekte bei Normierung ggf berücksichtigen
> Effekt stellt bei Fragenbögen evtl ein Problem dar, weil Veridikalität d Antwort fraglich wird
Was versteht man unter dem Ankereffekt?
- Beantwortung einer vorhergehenden Frage wird als Vergleichsanker zur
Beantwortung einer Folgefrage genutzt - Ursprüngl vor allem numerische Verankerungen untersucht
> Klassisches Bsp: Tversky und Kahneman (1974) baten Vpn, untersch Größen in %-Angaben zu schätzen (zB Anteil afrikanischer Staaten in UNO)
> Vpn mussten zunächst angeben, ob eine in Gegenwart d Vpn zufällig gezogene Zahl zw 0 u 100 größer / kleiner als %-Satz sei; dann sollte geschätzter %-Satz angegeben werden
> Schätzungen fielen je nach zuvor gezogener Zahl signifikant höher / tiefer aus (Zufallszahl in keinem plausiblen Zshang mit zu schätzendem %-Satz) - Kann sich auch auf verbale Urteile beziehen (Konsistenz- u Kontrasteffekte als Subfacetten des Ankereffekts verstehen)