2. Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 3. Bezeichnung von Skalenpunkten

1. nummerisch: mit zahlen markiert Skala, erweckt den Eindruck einer intervallskalierten Skala, wobei die Wahl der Nummerierung eine Verschiebung der Antworten verursachen kann 2. Verbal: mit Worten bezeichnet --> hier ist es vorteilhaft, dass die Skalenpunkte intersubketiv einheitlich interpretiert werden 3. optische Skala: kommen ohne Markierungen aus 4. Symbolskala: dienen lediglich Symbole zur Beurteilung --> Alle Skalen können jedoch ebenso miteinander kombiniert werden s. Handout

2. Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen

1. Verwendung von Skalenstufen 2. Polarität der Antwortskala 3. Bezeichnung von Skalenpunkten 4. neutrale Mittelkategorie? 5. "Weiß-nicht"-Kategorie? 6. asymmetrische Skala

2. Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 4. Neutrale Mittelkategorie

1. dient häufig als Ausweichoption, wird als "normal" eingestuft und deshalt gewählt oder gänzlich gemieden. 2. Nachteile: Dies kann zu erheblichen Verzerrungen führen und spricht gegen die Verwendung. 3. Vorteile: Wenn es allerdingt keine neutrale Mittelkategorie gibt, werden Probant innen zu einem Urteil gezwungen, selbst dann, wenn ihre Einstellung eigentlich neutral ist oder das gefragt Merkmal durchschnittlich/ mittel ausgeprägt ist --> dies kann eben so zu Validitätseinschränkungen führen

2. Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 5. "Ich-Weiß-nicht" -Kategorie

1. Seperat: dient als seperate Antwortalternative und ist optisch von den anderen Kategorien getrennt. 2. Verwendung: kann angekreuzt werden, wenn Probanden das Item nicht verstanden haben, keine Meinung zu dem item haben oder sie ein Statment/ eine Frage nicht beurteilen können --> daher kann sie häufig sinnvoll sein 3. Nachteile: das Ankreuzen einer "Ich-Weiß-nicht" Kategorie führt zu einem fehlenden Messwert, was sie negativ auf Reliabilität und Validität einer Skala auswirken kann --> bei zu vielen Fehlenden Messwerten ist es nicht mehr möglich eine Aussage über die Ausprägung einer Eigenschaft einer Person zu treffen

2. Testkonstruktion: Fehlerhafte Itembeantwortung bei Beurteilungsaufgaben - Definition und Arten

1. Definition: systematische, nicht-zufällige Fehler, die bei der Itembearbeitung entstehen. Erschweren die Interpretation der Untersuchungsergebnisse 2. Arten: a) Soziale Erwünschtheit b) Tendenz zur Mitte c) Akquieszenz (Zustimmungstendenz)

2. Testkonstruktion: Fehlerhafte Itembeantwortung -2. Tendenz zur Mitte: Definition & Lösungen

1. Definition: Bewusste oder unbewusste Bevorzugung der mittleren (neutralen) Antwort. 2. Lösung: a) keine neutrale Mittelkategorie b) keine extremen sprachlichen Bezeichnungen der beiden Pole c) eine "ich-weiß-nicht"-Kategorie --> Aber Härte-Effekt: Tendenz zu Extremurteilen ebenfalls möglich!

2. Testkonstruktion: Itemkonstruktion - wichtige Punkte

1. Sprachliche Verständlichkeit 2. Eindeutigkeit des iteminhalts 3. Varianz des Antwortverhaltens und Itemsschwierigkeit 4. Weitere Aspekte

Planung und Konstruktion eines Tests Flashcards by Ja Nie

Information zur Testplanung und Konstruktion: 1. Testplanung: Annahme

Verhalten von Personen kann mit Hilfe von individuellen Merkmalen gemessen werden, diese sollen mit einem Test erfasst werden

How well did you know this?

Not at all

Perfectly

Information zur Testplanung und Konstruktion: 1. Testplanung: Geltungsbereich

Mit dem Geltungsbereich werden die Anwendungsmöglichkeiten von Tests angebenen. Es sollte auf inhaltiche Validität geachtet werden (Übereinstimmung zwischen dem zu messenden Merkmal und seiner Operationsalisierung mittels des Testitems)

How well did you know this?

Not at all

Perfectly

Information zur Testplanung und Konstruktion:1. Testplanung: Zielgruppe

Über welchen Personenkreis sollen mit den Tests Aussagen getroffen werden ?

How well did you know this?

Not at all

Perfectly

Information zur Testplanung und Konstruktion: 1. Testplanung: Testlänge (Anzahl der Items)

je breiter der Geltungsbereich, desto länger wird der Test
Mit zunehmender Anzahl an Items zur Erfassung eines Merkmalbereichs wird das Ergebnis präziser (denn Messfehler wird geringer, Reliabilität steigt). Dieser Zugewinnn wird ab einer gewissen Länge aber von Störvariablen (Erschöpfung, nachlassende Motivaton, Konzentrationsfähigkeit) überlagert

How well did you know this?

Not at all

Perfectly

Information zur Testplanung und Konstruktion: 1. Testplanung: Aufgabentypen und Antwortformate

Die Aufgabenstellung besteht auf zwei Teilen:
a) Aufgabenstamm: die Aufgabe an sich, bei Persönlichkeitstests eine Frage oder Statment
b) Antwortformat: die ver. Itemtypen / Aufgabentypen können anhand des Antwortvormates unterschieden werden (offen/ gebunden)

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - Verwendung der Skalenstufen

Verwendung von Skalenstufen: bei der Verwendung von Skalenstufen, sollte der Grad der differenziertheit des urteils berücksichtigt werden (wie viele Abstufungen?) —> visuelle Analogskala vs. diskret gestufe Ratingskala?

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 3. Bezeichnung von Skalenpunkten

nummerisch: mit zahlen markiert Skala, erweckt den Eindruck einer intervallskalierten Skala, wobei die Wahl der Nummerierung eine Verschiebung der Antworten verursachen kann
Verbal: mit Worten bezeichnet –> hier ist es vorteilhaft, dass die Skalenpunkte intersubketiv einheitlich interpretiert werden
optische Skala: kommen ohne Markierungen aus
Symbolskala: dienen lediglich Symbole zur Beurteilung

–> Alle Skalen können jedoch ebenso miteinander kombiniert werden s. Handout

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 2. Polarität der Antwortskala

a) bipolare Skala: der Bereich der Zustimmung bzw. Ablehnung geht von einem positiven zu einem negativen Pol
b) unipolare Skala: besitzt einen “Nullpunkt” (z.B.: von “nie” bis “Immer”)
–> Die Entscheidung darüber hängt von den Inteminahlt bzw. von der zu erfassenden Eigenschaft ab, Beispiel s. Handout

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen

Verwendung von Skalenstufen
Polarität der Antwortskala
Bezeichnung von Skalenpunkten
neutrale Mittelkategorie?
“Weiß-nicht”-Kategorie?
asymmetrische Skala

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 4. Neutrale Mittelkategorie

dient häufig als Ausweichoption, wird als “normal” eingestuft und deshalt gewählt oder gänzlich gemieden.
Nachteile: Dies kann zu erheblichen Verzerrungen führen und spricht gegen die Verwendung.
Vorteile: Wenn es allerdingt keine neutrale Mittelkategorie gibt, werden Probant*innen zu einem Urteil gezwungen, selbst dann, wenn ihre Einstellung eigentlich neutral ist oder das gefragt Merkmal durchschnittlich/ mittel ausgeprägt ist –> dies kann eben so zu Validitätseinschränkungen führen

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 5. “Ich-Weiß-nicht” -Kategorie

Seperat: dient als seperate Antwortalternative und ist optisch von den anderen Kategorien getrennt.
Verwendung: kann angekreuzt werden, wenn Probanden das Item nicht verstanden haben, keine Meinung zu dem item haben oder sie ein Statment/ eine Frage nicht beurteilen können –> daher kann sie häufig sinnvoll sein
Nachteile: das Ankreuzen einer “Ich-Weiß-nicht” Kategorie führt zu einem fehlenden Messwert, was sie negativ auf Reliabilität und Validität einer Skala auswirken kann –> bei zu vielen Fehlenden Messwerten ist es nicht mehr möglich eine Aussage über die Ausprägung einer Eigenschaft einer Person zu treffen

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Aspekte, die bei der Konstruktion von Beurteilungsaufgaben beachtet werden sollen - 6. Verwendung asymmetrischer Skalen

ist dann in Betracht zu ziehen, wenn keine symmetrisches Antwortspekturm erwartet wird, dadruch kann eine höhere Differenzierung ermöglicht werden. In der Psychologie selten vertreten –> z.B.: Itemspezifisches Antwortformat s. Handout s. 2

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Fehlerhafte Itembeantwortung bei Beurteilungsaufgaben - Definition und Arten

Definition: systematische, nicht-zufällige Fehler, die bei der Itembearbeitung entstehen. Erschweren die Interpretation der Untersuchungsergebnisse
Arten:
a) Soziale Erwünschtheit
b) Tendenz zur Mitte
c) Akquieszenz (Zustimmungstendenz)

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Fehlerhafte Itembeantwortung - 1. Soziale Erwünschtheit: Definition, Arten & Lösung

Häufig poitivere Darstellung/ Übereinstimmung mit Normen & WErten der Gesellschaft. Tenden als günstig erarchete Merkmale in den Vordergrund zu stellen und gleichteitig als unerwüscht vermutete Merkmale zu verbergen

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Fehlerhafte Itembeantwortung -2. Tendenz zur Mitte: Definition & Lösungen

Definition: Bewusste oder unbewusste Bevorzugung der mittleren (neutralen) Antwort.
Lösung:
a) keine neutrale Mittelkategorie
b) keine extremen sprachlichen Bezeichnungen der beiden Pole
c) eine “ich-weiß-nicht”-Kategorie
–> Aber Härte-Effekt: Tendenz zu Extremurteilen ebenfalls möglich!

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Fehlerhafte Itembeantwortung - 3. Akquieszenz - Definition

–> Zustimmungstendenz
1. Definition: Tendenz Fragen/Statments unkritisch zuzustimmen –> ebenfalls gibt es Ablehnungstendenz

How well did you know this?

Not at all

Perfectly

Testkonstruktion: Itemkonstruktion - wichtige Punkte

Sprachliche Verständlichkeit
Eindeutigkeit des iteminhalts
Varianz des Antwortverhaltens und Itemsschwierigkeit
Weitere Aspekte

Testkonstruktion: Itemkonstruktion - 1. Sprachliche Verständlichkeit

oberste Priorität = Klarheit (Verständnis möglichst schon nach einmaligem Lesen)
Richtlinien:
a) Items eher positiv formulieren & (doppelte) Verneinung vermeiden
b) komplizierte Satzkonstruktionen vermeiden
c) Wortabkürzungen vermeiden
d) Fachbegriffe & Fremdworte vermeiden (Zielgruppe beachteten!)
e) Achtung bei Angaben von Intensitäten und Häufigkeiten: sie die Antworten im Sinne des zu erfassenden Konstrukts interpretierbar?
f) Sinnvolle und erschöpfende Antwortmöglichkeiten evlt. offenes Antwortformat mit klaren Maßheinheiten (z.B.: _h pro Woche)

Testkonstruktion: Itemkonstruktion - 2. Eindeutigkeit des Iteminhalts

Alle VP sollten das gleiche Verständnis des iteminhalts haben
Richtlinien:
a) keine Universalausdrücke (“nie” oder “immer”)
b) schwierige Begriffe definieren
c) Mehrdeutigkeit vermeiden
d) nur eine Aussage pro item
e) Vorwissen der VP berücksichtigen
f) Zeitspannen klar angeben

Testkonstruktion: Itemkonstruktion - 3. Varianz des Antwortverhatlens und Itemschwierigkeit

Items sollten interindividuelle Unterschiede abbilden (zwischen unterschiedlichen Merkmalsausprägungen differenzieren)
ITems vermeiden, die die meisten Menschen lösen/ bejahen bzw. nicht lösen/verneinen würden
–> Ausnahme: im klinischen Bereich, um Störungen diagnostizieren zu können)
Bei Leistungstests: genung ver. Items, um auch im unteren und oberen Bereich gut differenzieren zu können

Testkonstruktion: Itemkonstruktion -4. weitere Aspekte

Aktualität: der Items, v.a. bei Wissensfragen
Wertfreiheit: Vorsicht bei Fragen, die von sich aus Wertung enthalten oder mit konstruktfremden Emotionen kondunfiert sind
keine Suggesivfragen
Festlegung der Antwortrichtung:
a) was bedeutet Zustimmung/Ablehnung für die Ausprägung des interessierenden Merkmals?
b) Kann jedes items mit dem einheitlichen Antwortformat schlüssig beantwortet werden?

Testkonstruktion: Erstellung einer vorläufigen Testversion - Überblick

Reihenfolger der Items:
a) Aufsteigende Schwierigkeit
b) Aktualisierungseffekte beachten
c) Konsistenzeffekte
Instruktion

Testkonstruktion: Erstellung einer vorläufigen Testversion: 1. Reihenfolge der Items

Aufsteigende Schwierigkeit
Aktualisierungseffekte beachten
Konsistenzeffekte

Testkonstruktion: Erstellung einer vorläufigen Testversion - Merkmale einer guten Instruktion

Eine gute Instruktion solle:
1. zur Mitarbeit animieren
2. Klare Handlungsanweisungen geben
3. den Antwortmodus erläutern
4. ein Beispielitem enthalten
5. Aufforderung enthalten spontan, wahrheitsgetreu und vollständig zu antworten
6. Anonymität der VP gewährleisten
7. Zusätzlich zur Imstruktion: Angaben einer Ansprechperson für Rückfragen, Demopraphische Variablen

Prinzipien der Itemformulierung

1. Einfachheit 2. Einfache Sätze 3. Kurz 4. Einen Gedanken 5. Absolute Wörter vermeiden 6. "Nur", "Gerade", "Kaum" 7. Keine Fremdwörter 8. positive Formulierung 9. Konstruktfremde Emotionen 10. Häufigkeit/Intensität 11. Zeitspanne

Testkonstruktion: Fehlerhafte Itembeantwortung - 1. Soziale Erwünschtheit: Arten

1. Selbsttäuschung: selfdeceptiv enhancement häufig eher unbewusst 2. Fremdtäuschung: impression management erzeugt Fehleindruck wird häufig zur Täuschung anderer bewusst eingesetzt

. Testkonstruktion: Fehlerhafte Itembeantwortung - 1. Soziale Erwünschtheit: Lösung

1. Aufklärung über Untersuchungszweck 2. Anonymität 3. Kontrollskala: VP müssen Stellung zu negativer, weit verbreiteter Verhaltensweise beziehen --> Verneinung deutet auf hohe Tendenz der sozialen Erwünschtheit hin

. Testkonstruktion: Fehlerhafte Itembeantwortung - Aquieszenz - Lösung

positive und negative formulierte Items ABER: 1. Gefahr von Effekten der Itempolung, da positiven Items häufiger zugestimmt wird und negative Items häufiger verneint werden 2. Probleme bei der statistischen Analyse können auftreten --> z.B.: bilden negativ gepolte Items häufig eigene Faktoren bei der Faktorenanalyse oder wenn vergessen wird sie zu recodieren hängen sie ngativ mit den anderen Items zusammen und wirken sich somit stark negativ auf die Reliabilität aus

2. Testkonstruktion: Erstellung einer vorläufigen Testversion: 1. Reihenfolge der Items -1. Aufsteigende Schwierigkeit - Warum?

1. um Überforderung der Vp zu vermeiden 2. "Eisbrecherfunktion" von leicht lösbaren Items am Anfang

2. Testkonstruktion: Erstellung einer vorläufigen Testversion: 1. Reihenfolge der Items - Akualisierungseffekt Definition

logische und inhaltliche Zusammenhänge zwischen den Items, die dazu führen, dass sich die Items gegenseitig erschweren oder erleichtern vermeiden (Beispiel s. Handout s. 4)

2. Testkonstruktion: Erstellung einer vorläufigen Testversion: 1. Reihenfolge der Items - Konsistenzeffekte - Definition und Lösung

1. Definition: "stimmige Antwort" durch Vermutung, dass Items das gleiche Merkmal abdecken 2. Lösung: a) Pufferaufgaben: zur Verschleierung der Messintention b) Ausbalancieren: durch Randomisierung oder spezifisches Arrangement der Reihenfolge der Items c) Nichtssagende Testbeschreibungen oder offene Mittleiung des Erhebungsziels: zur Vorbeugung von Kotexteffekten

Prinzipien der Itemformulierung: 1. Eindeutigkeit

Items sollte eindeutig, klar und einfach formuliert sein

Prinzipien der Itemformulierung: 2. Einfache Sätze

Items sollten aus einem einfachen Satz mit einer klaren Aussage und nicht aus verschachtelten Satzgefügen / Verbindungen bestehen

Prinzipien der Itemformulierung: 3. Kurz

Items sollten kurz sein und nur ausnahmsweise 20 Wörter überschreiten

Prinzipien der Itemformulierung: 4. Ein Gedanken

Items sollten immer nur einen vollständigen Gedanken haben, der in einem Satz formuliert wird

Prinzipien der Itemformulierung: 5. Absolute Wörter vermeiden

items sollten keine Wörter wie "immer", "nie" und "niemad" enthalten

Prinzipien der Itemformulierung: 6. "Nur", "Gerade", "kaum"

sollten nur vorsichtig und ausnahmsweise verwendet werden

Prinzipien der Itemformulierung: 7. Keine Fremdwörter

oder Wörter, die der befragten Person fremd sein könnten (Fremdwörter, Fachwörter, Abkürzungen) --> Auf Alter, Geschlecht, Bildungsstand achten, ...

Prinzipien der Itemformulierung: 8. konstruktfremde Emotionen

sollen vermieden werden auszulösen. Dabei muss ggf.auch auf Alter, Geschlecht, Bildungsstand, ethische Herkunft, und Vertrautheit mit dem Untersuchungsgegenstand geachtet werden

Prinzipien der Itemformulierung: 9. positive Formulierung

und keine doppelte Verneinung

Prinzipien der Itemformulierung: 10. Häufigkeit/ Intensität

Items sollen Angaben zur Häufigkeit/Intensität eines Merkmals nur enthalten, wenn sie eindeutig interpretierbar sind und üver das Antwortformat auch korekt eingeschätzt werden können

Prinzipien der Itemformulierung: 11. Zeitspannen

Sollen immer eindeutig interpretierbar sein ("im letzen Monat" statt "in letzter Zeit")