Tests Flashcards
Nenne 2 Testarten
Leistungs- und Persönlichkeitstests.
Definition Test
Wissenschaftlich begründetes, methodisches Verfahren zur Erfassung eines oder mehrerer Merkmale, um eine möglichst genaue quantitative Aussage über den relativen Grad einer individuellen Merkmalsausprägung treffen zu können. Bestehend aus Items, die von Personen verschiedener Merkmalsausprägungen unterschiedlich beantwortet werden.
“In abstrakterem Sinn auch als standardisierte Verhaltensstichprobe, die aus Antworten auf mehrere Items besteht. Aus den Antworten wird der Testwert der untersuchten Person aggregiert”
Nenne Beispiele für Leistungstests
Intelligenztests, zB der HAWIE (Hamburg-Wechsler-Intelligenztest), WAIS (Wechsler Adult Intelligence Scales)
Aufmerksamkeits-Belastungs-Test (d2-Revision)
Beschreibe den HAWIE
(Hamburg-Wechsler-Intelligenztest)
besteht aus einem Verbal- und einem Handlungsteil
Verbal: Allgemeines Wissen, Zahlen nachsprechen, Wortschatztest, Rechnerisches Denken, Allgemeines Verständnis, Gemeinsamkeiten Finden
Handlung: Bilder ergänzen, Bilder ordnen, Mosaiktest, Figuren legen, Zahlen-Symbol-Test
Nenne die 6 “Skalen” des Verbal- und die 5 des Handlungsteils des HAWIE
Verbal:
Allgemeines Wissen, Zahlen nachsprechen, Wortschatztest, Rechnerisches Denken, Allgemeines Verständnis, Gemeinsamkeiten finden
Handlung:
Bilder ergänzen, Bilder ordnen, Mosaiktest, Figuren legen, Zahlen-Symbol-Test
Wie funktioniert der Aufmerksamkeits-Belastungs-Test (d2-Revision)?
visuelle Reize müssen unter Zeitdruck diskriminiert werden
20 Sekunden pro Zeile, d’s und p’s mit 1-4 Strichen
Was ist das Ziel von Persönlichkeitstests? Nenne 3 Persönlichkeitstests
Die Erfassung mehr oder weniger stabiler Persönlichkeitsmerkmale.
Fünf-Faktoren-Inventar (NEO-FFI) zur Erfassung der “Big-Five”
Frankfurter Persönlichkeitsinventar (FPI-R)
Trierer Integriertes Persönlichkeitsinventar (TIPI)
Definiere Persönlichkeit und nenne die “Big-Five”
Die Gesamtheit aller zum Wesen eines Menschen gehörenden Erlebnisse und Verhaltensdispositionen
Extraversion, Neurotizismus, Offenheit für Neues, Verträglichkeit, Gewissenhaftigkeit
Beschreibe das FPI-R (Frankfurter Persönlichkeitsinventar)
Persönlichkeitstest mit 12 Skalen, eignet sich für die Bereiche Psychotherapie, Rehabilitation, Psychosomatik, chronische Erkrankungen, Gesundheitspsychologie
12 Skalen:
Gehemmtheit, Soziale Orientierung, Leistungsorientierung, Erregbarkeit, Aggressivität, Beanspruchung, Körperliche Beschwerden, Lebenszufriedenheit, Gesundheitssorgen, Offenheit
“Zusatzskalen” Extraversion, Emotionalität
Für welche Bereiche eignet sich das Frankfurter Persönlichkeitsinventar? (5)
Psychotherapie, Rehabilitation, Psychosomatik, chronische Erkrankungen, Gesundheitspsychologie
Welche 12 Skalen finden im Frankfurter Persönlichkeitsinventar Anwendung?
Gehemmtheit, Soziale Orientierung, Leistungsorientierung, Erregbarkeit, Aggressivität, Beanspruchung, Körperliche Beschwerden, Lebenszufriedenheit, Gesundheitssorgen, Offenheit
“Zusatzskalen” Extraversion, Emotionalität
Was sind Stanine?
FPI-Standardwerte, von 1 bis 9
(Freiburger Persönlichkeits Inventar?)
Beschreibe die Verteilung der Staninewerte
1234 5 6789
Normbereich: 4+5+6= 54% der Population
Wert 5: 20%
Wert 4+6=34%
Werte 3+7=24%
Werte 2+8=14%
Werte 1+9=8%
Das heißt
1=4%,
2=7%,
3=12%,
4=17%,
5=20% (usw, paarweise da Normalverteilt)
Welche Bedeutung kommt Testtheorien zu?
Sie schaffen die Grundlage für eine möglichst präzise Messung, Formalisierung von Regeln für Testverfahren.
Beschreibe die klassische Testtheorie (KTT) & Ihre 5 Axiome
pragmatische Überlegungen hinsichtlich der Konstruktion von Tests, die seit Beginn des 20. Jh. entwickelt wurden.
Hauptziel: Abschätzung des Messfehlers und somit der Zuverlässigkeit (Reliabilität) einer Messung ► Reliabilität ist der Quotient aus wahrem und beobachteter Varianz
- Testwerte setzen sich aus dem wahren Wert (T) und dem Messfehler (E) zusammen, X=T+E
- Bei Messwiederholungen sind der Mittelwert und Erwartungswert des Messfehlers 0.
- Messfehler und wahrer Wert korrelieren nicht miteinander.
- Wahrer- und Fehlerwert zwei verschiedener Tests sind unabhängig voneinander.
- Fehlerwerte aus zwei verschiedenen Tests sind unabhängig voneinander.
Welche Kritik kannst du an der klassischen Testtheorie üben?
wesentlich: reine Messfehlertheorie
Die Testung auf Basis der KTT ähnelt einer rein physikalischen Messung
+ Die Axiome sind kaum überprüfbar und nur schwer haltbar
Beschreibe Item-Response-Theorien (IRT)
stellt eine Ergänzung zur KTT dar - Im Gegensatz zu dieser sind Messfehler nicht nur rein unsystematisch sondern haben einen systematischen Anteil in der Messfehlervarianz
Begründung des Rückschlusses von manifestem Verhalten auf latente Variablen (gemessenes Verhalten als Indikator für latente Variable)
Ziel: Parameterschätzung
Jede beobachtete Reaktion besteht aus:
Personenparameter (zB Fähigkeit)
Itemparameter (zB Schwierigkeit)
Zufall
Nenne Beispiele für systematische Anteile in der Messfehlervarianz in IRT (Item-Response-Theorien)
Übungs- und Transfereffekte, systematische Wechselwirkungen zwischen Person und Situation (think also: Hawthorne Effekt)
Definiere Personen- und Itemparameter und beschreibe die Item-Response Funktion
Personenparameter: Die Wahrscheinlichkeit, mit der eine Person Items in einem Test lösen kann
Itemparameter: Die Wahrscheinlichkeit, mit der Items von Testpersonen gelöst werden.
Item-Response-Funktion: Personenparameter x-Achse, Itemparameter y-Achse
stellt die Abhängigkeit der Lösungswahrscheinlichkeit von dem Personenparameter dar-
bildet das Verhältnis zur latenten Variable ab
Punkt der höchsten Steigung: Höchste Trennschärfe zwischen Personen niedriger und hoher Merkmalsausprägung
Was sind latente und manifeste Variable?
manifeste Variable: das beobachtbare Verhalten
latente Variable: nicht beobachtbare Merkmalsausprägung, die in Abhängigkeit der manifesten Variablen festgestellt werden soll
Wie erfolgt die Parameterschätzung?
Computergestütze Berechnung der Maximum-Likelihood-Funktion
“Hierbei werden die Parameterschätzungen solange adjustiert, bis sich die Likelihood nicht mehr bedeutend erhöht” ►”Konvergenz”
Was versteht man unter “Konvergenz” in der Maxium-Likelihood-Funktion
Der Punkt, an dem die Veränderung der Parameterschätzungen keine Erhöhung/ signifikante Veränderung der Likelihood bedingt.
Beschreibe das Rasch-Modell, nenne einen Vorteil
Teil der IRT
Nur bei dichotomen Merkmalen anwendbar (lediglich 2 Ausprägungsmöglichkeiten, true/false)
versucht den Rückschluss von manifester auf latente Variable zu begründen
Annahme, dass Items eines Tests dieselbe latente Variable mit unterschiedlicher Schwierigkeit jedoch identischer Trennschärfe erfassen
liefert standardisierte Personenparameter - klarere Abbildung von Besonderheiten
Welche Testtheorie findet in der Praxis am häufigsten Anwendung?
Eine Kombination aus klassischer Testtheorie (KTT) und Item-Response-Theorie (IRT) (getrennte Durchführung, Zusammengeführter Vergleich)
Beschreibe das Trierer Integrierte Persönlichkeitsinventar (TIPI)
Rasch-skalierter Fragebogen zur Erfassung der Dimensionen gestörter und normaler Persönlichkeit, auf den 4 Skalen Neurotizismus, Extraversion, Verträglichkeit und Gewissenhaftigkeit, nach den Prinzipien der IRT erstellt.
Die Antwortmöglichkeiten werden skaliert als
“in.. 1,2,3,4,5… von fünf Fällen”
Was ist der PFK 9-14
Ein mehrdimensionaler Persönlichkeitsfragebogen der auf Kinder ausgelegt ist
Ergebnisse stehen im Vergleich mit der Subpopulation der neun- bis vierzehn-jährigen
gegliedert in 3 Teilbereiche: Verhaltensstile, Motive und Selbstbild
Der Test erfasst primäre Persönlichkeitszüge und Persönlichkeitszüge auf höherem Allgemeinheitsniveau (Faktoren 2, Ordnung)
Beschreibe die Ziele bei der Entwicklung des PFK 9-14 (PersönlichkeitsFragebogen für Kinder)
- interindividuelle Bestimmung der Charakteristika der Kinderpersönlichkeit
- Erfassung solcher Persönlichkeitszüge aus den 3 Bereichen Verhaltensstil, Motiv und Selbstbild, die eine hohe Varianz des Erlebens und Verhaltens aufklären
- Konstanz der internen Struktur über verschiedene Subpopulationen (zB Geschlechts- oder Altersgruppen) der Gesamtstichprobe 9-14 jähriger
- Beschreibung der Persönlichkeitsstruktur eines einzelnen Probanden gegenüber der Ausprägung der Durchschnittsstruktur
Welchen Zweck verfolgt der PFK 9-14
Die Vorhersage und Erklärung des Verhaltens von Schülern und Einflussnahme auf die schulische Entwicklung (zB Vorhersage des Schulerfolgs sowie Anpassungs- und Kooperationsverhalten, Analyse von Schulschwierigkeiten und Zuweisung zu Schulformen und Kursen)
Früherkennung von potenziell Verhaltensauffälligen und psychisch gefährdeten Kindern oder Diagnose bereits auffällig gewordener Kinder
Schildere die Historie des PFK 9-14
erschien 1976 in der ersten Auflage, bestehend aus 15 Primärdimensionen (4 Verhaltensstil, 6 Motiv, 5 Selbstbid) und 5 Faktoren 2. Ordnung (Derbdraufgängerische Ichdurchsetzung, Soziale Willfährigkeit, Emotionalität, Selbstgenügsame Isolierung, Offen-optimistisches Engagement)
1992 in der dritten Auflage (wegen typischer, ständiger Weiterentwicklung): einheitliche Festlegung auf 12 Items pro Dimension
2004 vierte Auflage zur Anpassung an eine passendere Datenbasis
Nenne eine Möglichkeit zur Ermittlung der Skalen Rohwerte nach einem Test
Abgleich der angekreuzten Kästchen mit einer Schablone, die Symbolmarkierungen für die ermittelten Merkmalsdimensionen hat. Die jeweiligen Teilrohwerte werden am Ende zusammengetragen
Was ist das OPQ?
SHL Occupational Personality Questionnaire
Was ist das SHL Occupational Personality Questionnaire (OPQ)
eines der weltweit führenden Persönlichkeits-Assessments zur Vorhersage von Eignung, Leistung, Potenzial im Kontext der Persönlichkeitspsychologie aus 32 leistungsrelevanten Persönlichkeitsmerkmale