Tests Flashcards

1
Q

IST 2000R?

A

Intelligenz Struktur Test
Mehrdimensionaler IQ Test
Der IST-2000-R basiert auf einem Test, der in der Vergangenheit eine
herausragende Bedeutung hatte. Er stellt eine Weiterentwicklung des in Deutschland
bisher mit Abstand am haufigsten angewandten Intelligenztests, dem IST-70, dar.
Liepmann, Beauducel, Brocke und Amthauer, der 2007
Konstrukte : 5 von den 7 Primarfaktoren von Thurstone
1. Verbale Intelligenz: Satzergänzen, Analogien …
2. Numerische Intelligenz: Rechenaufgaben, Zahlenreihen…
3. Figurale Intelligenz: Würfelaufgaben, Matritzen…
4. Merkfähigkeit: verbal & figural
5. Wissentests: Völkergruppen….
Erweiterungsmodul berücksichtigt fluide & kristalline Intelligenz

Normierung:Für alle Subskalen sowie die Gesamtskalen liegen getrennte Normen für fol-gende Bereiche vor:
• getrennt für Gymnasiasten/Nicht-Gymnasiasten, sowie eine Gesamtnorm
• getrennt für Alterskohorten
• keine Trennung nach Geschlecht erforderlich
Auswertung
_ Mit Hilfe von Schablonen
_ Rohwerte -> Summen
_ Standardwerte anhand der Normen
_ Ergebnisprofil
Auswertung. Die mit Schablone ermittelten Rohpunktsummen fur die einzelnen Untertests
werden in Standardwerte (M = 100, SD = 10) umgewandelt
Gütekriterien:
Objektivität: Schablonen, PC Auswertung, Interpretation: Auswertungsbogen! Von Profilin-terpretation abzuraten
Reliablilität: mehrere geprüft: gut!
Validität: mehrere gemessen. Korrelation mit Schulnoten, Ausbildungserfolg
Anwendungsfelder
_ Personalauswahl, eignungsdiagnostische Fragestellungen
_ Berufsberatung
_ Entwicklungsdiagnosen
_ Forschungszwecke
Ab 15 Jahren, Einzel oder Gruppen
Ca 2 Stunden! Mit Pause

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

D2

A

D2

Test d2: Aufmerksamkeits-Belastungstest
Brickenkamp, 1962
der am haufigsten verwendete Leistungstest uberhaupt.
PC & Paper Pencil Version
Einsatzgebiete:Verkehrspsychologie ,Klinischen Psychologie, der Neuropsychologie,
der Arbeits- und Organisationspsychologie, Padagogischen Psychologie & Sportpsychologie
Prinzip der Durchstreichtests entschieden
Erfasst: Aufmerksamkeit & Konzentration: muss kontinuierlich und dabei schnell und richtig erbracht werden unter Zeitdruck zu erbringen ist. Der Proband soll so
schnell und so genau wie moglich arbeiten
Misst: Das Tempo (die Anzahl
der bearbeiteten Zeichen in der Testzeit) und die Qualitat (Genauigkeit, operationalisiert
uber die Fehlerquote).

Durchfuehrung. Die Instruktion erfolgt durch Vorlesen eines Standardtextes. Fur Kinder
ist sie etwas ausfuhrlicher und es wird empfohlen, die Aufgabe an einer Wandtafel
zu veranschaulichen
einzeln und in Gruppen durchgefuhrt werden. Eine Parallelform
existiert nicht.
Auswertung. Mit Schablone: Kennwerte werden auf ein Auswertungsblatt ubertragen.

Gütekriterien:
Objektivität: je Durchführer…
Reliabilitat: sehr hohe Werte!
Validitat: kurz & mittelfristige Konzentration erfasst, Korrelation mit Konzentrationstests,
Korrelation mit Intelligenztests, Weitere Validitatsbelege
Eine Erklarung ist, dass die Intelligenztestleistung (nicht die Intelligenz!)
auch von der Konzentration der Probanden abhaengt

Bewertung: Verfahren schnell & einfach, in kurzer Zeit reable&valide Daten, fur ganz viele Lern- oder Arbeitssituationen von Bedeutung ist.

weiteres:
Aufmerksamkeit und Konzentration

Reizselektion

Tempo & Qualität

658 visuelle Reize

Schablonenauswertung

Hohe Reliabilität. Die innere Konsistenz (Cronbachs α mit den Zeilen als Items) der wich- tigsten Kennwerte, also der (fehlerkorrigierten) Tempoleistung GZ und KL, liegen für die Erwachsenen der Eichstichprobe zwischen .95 und .97. Selbst für die jüngste Alters- gruppe (9–10 Jahre) beträgt die innere Konsistenz noch .91 (GZ) bzw. .93 (KL). Auch das Fehlerprozent (F%) weist bei den Erwachsenen (hier die Split-Half Korrelation) mit .92 bzw. .94 sehr hohe Werte auf.

Validität. Aufgrund des Aufgabenformates und der Vorgabebedingungen kann der Test gleichsam »vorab« inhaltliche und Augenschein-(Face-)Validität beanspruchen

Die Konstruktvalidität des Test d2 kann durch zahlreiche Untersuchungen als belegt gelten, in denen der Test mit anderen Konzentrationstests sowie (als konstruktdiver- gentem Kriterium) mit Intelligenztests korreliert wurde.

Die Koeffizienten variieren erheblich, was sich mit den zum Teil kleinen Stichproben erklären lässt.

d Korrelationen im Bereich von .60 mit den Tempower- ten von Konzentrationstests.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

NEO-FFI, NEO-PI-R?

A
  • Multidimensionaler PSK-Tests zur Abklärung grundlegender PSK-Dimensionen im Bereich Berufs- und Laufbahnberatung
  • Anwendungsbereiche sind: Jugendliche + Erwachsene ◦ Forschungszwecke:

◦ Klinische Psychologie
◦ Schullaufbahn- und Studienberatung
◦ Organisationspsychologie

• Erfasst mittels 5 Skalen (BIG FIVE) und 60 Items (12 je Skala) folgende Dimensionen: 
◦ Extraversion
◦ Neurotizismus
◦ Offenheit für Erfahrungen
◦ Gewissenhaftigkeit ◦ Verträglichkeit

• 5-stufiges Antwortformat
• Daten beruhen auf eine SP von N=11.724
• Normen für repräsentative SP und für 12 Geschlechts- und Altersgruppen
• Mitgeteilt werden jeweils Prozentrang-, T- und Stenine-Normen, sowie alle Vertrauensintervalle
der Skalen
• Hat eine gute Reliabilität und Validität

Reliabilität:
• gute interne Konsistenz der 5 Skalen (a=.72 bis a=.87) • gute Retestreliabilität nach 5 Jahren (r=.71 bis r=.82)

Validität:
• Konstruktvalidität wurde durch FA der Items und durch gemeinsame FA der Skalen und anderen PSK-Tests bestätigt
• Korrelation der Skalen mit Selbsteinschätzung auf Adjektivskalen bestätigen Konstruktvalidität ebenfalls (r=.54 bis r=.80)
• Mittlere Korrelation zwischen Selbst- und Fremdbeurteilung mittels NEO-FFI (r=.49 – r=6.1)

NEO-PI-R

• Weltweit am häufigsten eingesetzter FB zur Messung der 5 PSK-Dimensionen
• Erfasst mit 5Skalen, 30 Facetten und 240 Items die Hauptbereiche individueller PSK-Unterschiede
• 30 Facetten ermöglichen differenziertere Erfassung der 5 Hauptskalen
• Ermöglicht eine umfassende und detaillierte Persönlichkeitsbeschreibung
• Fragebogen zur Selbst- und Fremdbeurteilung (S-Form und F-Form) bei Jugendlichen ab 16 und
Erwachsene

• Anwendungsbereiche:
◦ Klinische Psychologie, Psychiatrie
◦ Arbeitss- und Organisationspsychologie, Berufberatung
◦ Pädagogische Forschung

  • Dauer 30-40min
  • Auswertung erfolgt durch Rohwerte auf einem Profilblatt → automatische Umwandlung in Normwerte
  • Profilblatt ist an Alter und Geschlecht angepasst
  • Hinweise zur Interpretation der Skalenwerte (Haupt- + Subskalen) im Manual enthalten
  • Im Vergleich zum NEO-FFI ermöglicht es eine vollständigere Erfassung des Fünf-Faktoren-Modells

Normen:
• T-, Stanine- und Prozentrangnormen für Hauptskalen + Facetten der Formen S+F (N=11.724) • Alters-(16-50+), geschlechts- und bildungsspezifische Normierung

• Reliabilität → in allen Bereichen gut (Durchschnittlich bei .80) • Selbstbeurteilung (S-Form):
◦ Hohe interne Konsistenz der Hauptskalen (a=.87-.92)
◦ Hohe interne Konsistenz der 30 Facetten (a=.53-.85)
◦ Hohe RT nach 1 Monat / 5 Jahren für Hauptskalen (r=.88-.91)/ (r=.74-.78) ◦ Hohe RT nach 1 Monat / 5 Jahren für 30 Facetten (r=.49-.91) / (r=.53-.78)

• Fremdbeurteilung (F-Form):
◦ Hohe interne Konsistenz für Hauptskalen (a=-89-.95)
◦ Gute interne Konsistenz für 30 Facetten (a=.49-.84); Mittelwert= .75

• Validität → gut
◦ Hohe konvergente Validität (r=.96-.98) durch FA der S-Formen deutsche vs.
Amerikanische Version bestätigt
◦ Hohe konvergente Validität (r=.98-1) durch FA der deutschen S-Form und F-Form
bestätigt
◦ Zahlreiche Untersuchungsergebnisse zur konvergenten + diskriminantn Validität
liegen vor

Normierung:

• Selbstbeurteilung N=11.724
◦ Für folgende Gruppen gab es separate Normen und Profilblätter. Repräsentative Gesamtstichprobe, jeweils für Männer und Frauen von:
▪ 16-20 / 21-24 / 25-29 / 30-49 / 49+
◦ Fremdbeurteilung N=1.547
◦ Normen für Geschlechter getrennt
◦ Altersstufe 16-29 und 30 +

Vorteile gegenüber NEO-FFI:
• Zuverlässigere Messung der BIG FIVE
• Differenzierte Beschreibung der Persönlichkeit durch die Subskalen
• Fremdbeurteilung möglich
• Bessere Normierung
→ NEO-FFI ist aber kürzer und ökonomischer!!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

MMPI-2

A
  • MMPI-2 ist eines der weltweit am häufigsten verwendeten PSK-Testverfahren für Erwachsene (ab 18-70J) in der klinischen Psychologie und Psychiatrie
  • Dient als Hilfsmittel bei der Untersuchung der Persönlichkeitsstruktur, v.a. hinsichtlich psychischer Störungen
  • Einzel- und Gruppentest; N= 958 (=Eichstichprobe) Dauer ca. 60min → bei Patienten länger
  • 567 Items (=Feststellungen) + 4 VAliditätsskalen + 10 klinische Basisskalen:

◦ 4 Validitätsskalen:
▪ ? = Weiß-nicht-Skala → Anzahl nicht/ungültig beantwortetes Items
▪ L = Lügenskala = 15 Items → “Manchmal möchte ich am liebsten fluchen“ (richtig) ▪ F = Seltenheitsskala = 60 Items
▪ K = Korrekturskala = 30 Items

◦ Und 10 klinische Skalen, z.B.:
▪ Hd = Hypochondrie (32 Items) ▪ D = Depression (57 Items)
▪ Sc = Schizophrenie
▪ Si = soziale Introversion

  • Rohwerte mittels Schablone ermitteln → Transformation in t-Werte
  • Individuelle Rohwerte direkt in Profilblatt Männer/Frauen eintragen

Gütekriterien:

Reliabilität:
• Retestreliabilität der Skalen nach 10 Tagen:
◦ Bei Männern .66(Ma=Hypomanie) bis .90 (D=Depression)
◦ Bei Frauen .71 (Ma=Hypomathie) bis .92 (Sc=Schizophrenie)

Validität:
• Im Manual → FA der Skalen ergab 4 Faktoren
◦ F1: Psychotische Gedankeninhalte (Sc, Pp, Pa, F) ◦ F2: Neurotische Verhaltensweisen (Hy, L, K)
◦ F3: Introversion (Si, D)
◦ F4: Geschlechterrollenindentifikation (Mf)
• Ähnliche Struktur für Männer und Frauen + gute Übereinstimmung mit US-Ergebnissen
• Aufgrund der Itemüberlappung Vorsicht bei den Ergebnissen

Bewertung:
• Bewehrtes + gut erforschtes Verfahren, v.a. wegen großer Informationsausbeute durch viele
klinische Skalen, Validitätsskalen und Zusatzskalen
• Veraltete diagnostische Kriterien und keine Unterstützung der klinischen Diagnose nach ICD-10
+ DSM-IV

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

FPI-R

A

• Ein PSK-FB für Jugendliche ab 16 + Erwachsene (N=3740)
• Aufgrund seiner Ökonomie (Einzel-/Gruppentestung + 20-30min) häufig in der Praxis
eingesetzt
• Hat keinen besonderen theoretischen Hintergrund. Autoren wählten 10 für sie
relevante Eigenschaften und zusätzlich 2 PSK-Dimensionen nach Eysenck
• 138 Items (Aussagen) verteilen sich auf insgesamt 12 Skalen, z.B.:
◦ Lebenszufriedenheit ◦ Soziale Orientierung ◦ Leistungsorientierung ◦ Gehemmtheit
◦ Erregbarkeit
◦ Aggressivität
◦ Beanspruchung
◦ Körperliche Beschwerden ◦ Gesundheitssorgen
◦ Offenheit
◦ Extraversion
◦ Emotionalität

Gütekriterien:
Reliabilität befriedigend
• Interne Konsistenz der Skalen a ≈ .75
• Befriedigend → Konsistenzintervalle der einzelnen Skalen variieren zwischen .71-.84

Validität ausreichend
• Skalen korrelieren allgemein hoch mit anderen PSK- FB-Skalen
• Ergebnisse basieren auf subjektiven Urteilen → Einfluss von sozialer Erwünschtheit z.B. beachten
• Konvergente Validität vorhanden

FAZIT:
• FPI-R ist ein Verfahren mit großer Bedeutung für die Beschreibung individueller Unterschiede
• Diagnostische Zielsetzung, theoretische Grundlagen und Vergleichbarkeit mit anderen Verfahren kommen zu kurz → fehlender theoretischer Hintergrund erschwert Vergleiche mit anderen PSK-Verfahren
• Große Verbreitung spricht für nützliche Skalenauswahl für die Praxis
• Ausreichende Messgenauigkeit für gruppenstatistische Untersuchungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

SSS-V

A

Zusammenfassung. Die Sensation Seeking-Skalen, Form V (SSS-V) sind eines der am häufigsten eingesetzten Inventare zur Erfassung von Sensation Seeking. Allerdings wurden immer wieder geringe interne Konsistenzen und Probleme bei der Replikation der Faktorenstruktur, insbesondere für die Subskalen Experience Seeking und Boredom Susceptibility berichtet. Im Vergleich zu Alternativen hat die SSS-V allerdings den Vorteil einer differenzierteren Erfassung des Konstrukts, weshalb die neueren Inventare sich nicht durchsetzen konnten. Vor dem Hintergrund dieser Situation bestanden die Ziele der vorliegenden Arbeit in der Untersuchung der psychometrischen Eigenschaften einer von Marvin Zuckerman autorisierten deutschsprachigen SSS-V, der Gewinnung von Normen sowie optimierter Personenkennwerte anhand von Faktorwerten. Dazu wurde eine Stichprobe von 1526 Probanden (823 weiblich) im Alter von 16 bis 68 Jahren mit der SSS-V untersucht. Die vierfaktorielle Struktur der SSS-V konnte anhand einer exploratorischen Faktorenanalyse paarweiser Itemaggregate bestätigt werden. B-Gewichte zur Ermittlung von Faktorwerten sowie Normen für den deutschsprachigen Raum werden mit dieser Arbeit zur Verfügung gestellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

PSB-R

A
  • Horn, W. (1969). Prüfsystem für Schul- und Bildungsberatung PSB. Göttingen: Hogrefe.
  • Zielgruppe: Jugendliche zwischen 9 und 18 Jahren.
  • Der Test soll die Intelligenzstruktur erfassen. Anhand des Profils, das aufgrund 9 verschiedener Faktoren (Allgemeinwissen/Wortschatz, bildhaft- logisches Denken, sprachlich-symbolisches logisches Denken, Worteinfall, Gestaltbindung und Rechtschreibung, Vorstellungsvermögen, bildhaftes Erfassen, Rechenfähigkeit und Konzentration, Tempomotivation) erarbeitet wird, können Begabungsschwerpunkte erfasst werden.
  • theoretische Grundlage: multiple Faktorentheorie von Thurstone (1938)
  • Viele wichtige Sachverhalte sind an diesem Test gut zu verdeutlichen, weswegen wir unsere Testwerte in den nächsten Stunden weiterverwenden können!

Auswertung:

  • Auszählen der Punkte in den Tests
  • Beachten Sie das Durchstreichen von Lösungen, die Sie als ungültig markiert haben. Ansonsten ist jeder richtige Strich ein Punkt (auch 7)
  • Notieren Sie in jeder Spalte von 1 bis 10 oben oder unten auf dem Bogen die Punktzahlen = Anzahl der richtig gelösten Aufgaben (falsche Antworten werden nicht gesondert ausgewertet)
  • Testreihe 5: nicht mehr die Wörter mit S zählen, Wiederholungen werden nur einfach gezählt
  • Tragen Sie die Punktzahlen in das Profil auf der Vorderseite ein in der Spalte unter dem „+“-Zeichen beim jeweiligen Test. Die Werte von Spalte 1 und 2 werden sofort addiert, alle anderen erstmal getrennt hingeschrieben und dann addiert zu Zwischensummen 3+4; 5+6; 7+8 und 9+10.
  • Berechnen Sie dann Ihren Gesamtwert als Summe aller Einzelwerte und zur Kontrolle als Summe der Zwischensummen
  • Später: Eintragen des Wertes rechts unter die Glockenkurve als C-Wert

Testgütekriterien:
• Objektivität: in Durchführung (standardisierte Instruktionen) und Auswertung (Schablonen) gegeben
• Reliabilität: Innere Konsistenz zwischen .77 (Subtest 6, Form A) und .95 (Subtest 7, Form B).
• Faktorielle Validität (Homogenität): Alle Subtests korrelieren zwischen .53 (Subtest 7) und .67 (Subtest2 1+2, 4), mit dem Gesamtergebnis
• Inhaltliche Validität: Faktorenanalyse von Huldi (1991) zur Überprüfung der von Horn postulierten Intelligenzfaktoren nach Thurstone. Es resultierten drei Faktoren (mit Ladungen >.3):
– Faktor 1: Subtest 3, 4, 7, 8 ≈ „fluide Intelligenz“ i.S. Cattels
– Faktor 2: Subtest 1+2, 4, 5, 6, 9 ≈ „kristalline Intelligenz“ i.S. Cattels – Faktor 3: Subtest 7, 9, 10: Tempofaktor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

RT & (LM-) TAT

A

Geht auf Freud zurück

Verlegung Eigenschaft – auf eine Person der Außenwelt

Validitätskoeffizienten kaum über die Grenze von r .25

Durchführungs- als auch für die Auswertungsobjektivität erhebliche Probleme

Reliabilitätsbestimmung ist problematisch.

Halbierungskoeffizient lässt sich kaum berechnen

Paralleltestreliabilität scheitert am Fehlen einer Parallelform

Retestreliabilität ist schwierig, gegebenen Antworten leicht erinnert werden können.

Konstruktvalidierng – akzeptable Theorie voraussetzt, nur schwer zu leisten.

Der Rorschach-Test kann nicht als objektives, reliables und/oder valides Testverfah- ren bezeichnet werden.

Der TAT ist kein Verfahren, das – darin den meisten projektiven Verfahren gleich – den klassischen Testgütekriterien genügt. Revers und Widauer (1985), die mit dem Thematischen Gestaltungstest eine modifizierte Version des TAT mit moderneren Bildern publiziert haben, wollen ihr Verfahren auch eher als Kommunikationsmedi- um zur Bearbeitung biografischer Grundsituationen, als explorative Technik zur Erfassung von Kognitionen und Emotionen aufgefasst wissen denn als Test. Die mangelnden Testeigenschaften wären zu verschmerzen, wenn sich auf diese Weise Informationen gewinnen ließen, die sonst nicht zu erlangen sind. Da den Versuchs- personen aber offensichtlich die relevanten Inhalte bewusst sind, stellt sich die Frage, ob diese nicht durch direkte Befragung einfacher zu erheben sind.

Projektive Verfahren haben die auf sie gesetzte Hoffnung, man könne mit ihrer Hilfe verdrängte Bewusstseinsinhalte ermitteln, nicht erfüllen können. Durch direkte Be- fragungen lassen sich bewusste Informationen meist leichter gewinnen als mittels projektiver Techniken. Lediglich bei Kindern können projektive Verfahren als Explo- rationshilfen dienen. Die Messqualität von Tests ist in der Regel nur durch hohen konstruktorischen und prozeduralen Aufwand zu erreichen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly