W7: Erstellung Testentwurf, Itemformate Flashcards

1
Q

Was wird bei der Erstellung des Testentwurfs als Erstes gemacht resp. berücksichtigt?

A
  • Festlegung der Art der Indikatoren
  • Festlegung der Zielgruppe
  • Testziel (Erfassung der Ausprägung einer Eigenschaft / Fähigkeit oder Erfassung von Wissen)
    -Definiton des Messegegenstandes
    -Formulierung von Fragen (Testkonstruktion)
    -Empirische Prüfung des Testentwurfs
    -Normierung des Tests (Ermittlung Cut-Off-Wert)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind T-Daten (test data)?

A

Leistungstests, bei denen die Antwort eindeutig als richtig oder falsch klassifiziert werden kann. Wie verhalte ich mich in einer konkreten Situation?

objektiv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Q-Daten (questionnaire data)?

A

Daten aus Persönlichkeitsfragebögen, die Selbst- oder Fremdratings erfassen. Geäusserte oder erfragte Interessen.

subjektiv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind L-Daten (life data)?

A

Daten aus Verhaltensbeobachtungen, schlagen sich in Taten nieder, konkrete Berufsausübungen, Freizeitinteressen etc.

objektiv

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind objektive Indikatoren?

A

T-Daten (Leistungstests)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind subjektive Indikatoren?

A

Q-Daten (Persönlichkeitsfragebögen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Merkmale des Zielgruppe, die sich auf die Testerstellung auswirken können?

A

-Alter & Bildung
-Erlebens- und Verhaltensspektrum (was ist die Lebensrealität meiner Gruppe?)
-Sprachbeherrschung
-Item-/ Testfairnes
-… Liste nicht abschliessend

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was bedeutet der Begriff Itemschwierigkeit?

A

Wenn ein Item von vielen Personen zugestimmt wird (bei Fragebögen) bzw. von vielen Personen richtig gelöst wird (bei Leistungstests).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welchen Einfluss haben Alter & Bildung auf die Testerstellung?

A

Ältere Menschen sehen bspw. nicht mehr so gut, dies ist dann schwieriger Tests wie den d2-R durchzuführen. Betr. Bildung müssen die Aufgaben so konstruiert werden, dass bspw. für 6-jährige ein geringerer Schwierigkeitsgrad besteht als für 16-jährige Gymnasiasten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welchen Einfluss haben Elebens- und Verhaltensspektrum?

A

Die unterschiedlichen Lehrpläne von Ländern / Schulen müssen berücksichtigt werden. Auch einen Einfluss kann bspw. der Grund für einen Fragebogen haben - z.B. Messung Extraversion bei einer Jobauschreibung für einen Animateur. Die Frage “ich mag es in der Disco zu tanzen” würde wohl jeder zustimmen. Dieses Bspw-Item enthält keine Informationen über das Verhalten der Bewerbergruppe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welchen Einfluss hat die Sprachbeherrschung?

A

Wird die Frage nicht verstanden, kann dies zu zufälligen oder falschen Antworten führen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welchen Einfluss haben Item- und Testfairness?

A

Vorkenntnisse, Testerfahrung und kulturelle Aspekte müssen berücksichtigt werden..

Komplexes Thema, inwieweit einzelne Gruppen durch einen Test bevorzugt oder benachteiligt werden. Dies muss bei der Testerstellung zwingend berücksichtigt werden. Die Item- oder Testfairness kann mit dem Rasch-Modell überprüft werden (vergleich Itemschwierigkeiten von unterschiedlichen Gruppen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind kognitive Interviewtechniken?

A

Damit ein Test praxistauglich ist, müssen Vortests mit den Personen aus der Zielgruppe durchgeführt werden. Mit der Technik des lauten Denkens sollen die Testprobanden laut mitdenken und aussprechen, was sie beim Lösen denken resp. interpretieren. Darüber hinau können Nachfragetechniken (Probing) seitens Versuchsleitung eingesetzt werden. Anschl. Interview / Austausch.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche Ziele wollen mit der Testkonstruktion erreicht werden?

A

-Feststellung Eigenschafts- oder Fähigkeitsausprägung einer Person
-Gruppentrennung oder Klassifikation von Personen
-Erfassung von Wissen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welche Konstruktionsstrategien gibt es?

A

-Rationale Testkonstruktion
-Externale Testkonstruktion
-Induktive Testkonstruktion
-Prototypenansatz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist die rationale (deduktive) Testkonstruktion?

A

Eignet sich, wenn eine gut ausgearbeitete Theorie/Forschung für das zu untersuchende Konstrukt vorliegt - wichtig ist eine spezifische Definition. Bsp. Intelligenzforschung, z.B. numerische Intelligenz, wird definiert als: “erfasst Rechenfertigkeit und Fähigkeit, logische Beziehungen ziwschen Zahlen herzustellen”. Aufgrund dieser Definition können einfach Items erstellt werden.

Ausgangspunkt ist eine gut ausgearbeitete Theorie!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist externale Testkonstruktion?

A

Hier wird nach Items gesucht, anhand derer wir Gruppen möglichst gut trennen können, üblicherweise anhand einer grossen Anzahl Items. Items sind typischerweise heterogen.
z.B. Fragen wie: “Wenn sich zufällig die Gelegenheit ergibt, würde ich schon einmal Hasch oder Marihuana konsumieren”. Die Items können i.d.R. gut getrennt werden, sind aber unterschiedlichen Konstrukten zugeordnet. Mithilfe von der Faktorenanalyse kann versucht werden, die Fragen in homogenere Teile zusammenzufassen. Beispiel: Integritätstest

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist die induktive Testkonstruktion?

A

Grosse Itemmegen. Ziel ist es, Dimensionen zu finden, die den Itemantworten zugrunde liegen. Vorher keine theoretische Ausarbeitung - nur eine Idee, dass bestimmte Items dieselben Konstruke erfassen könnten. Erst nach der Analyse wird aufgrund der gefundenen Dimensionen ein theoretisches Modell entwickelt.
Sprich: Modell wird anhand der Ergebnisse einer Faktorenanalyse entwicklet.

–> Wurde oft kritisiert, findet aber in neurer Zeit immer mehr Anklag. Prominentes Beispiel: Big Five!

Wird wahrscheinlich am häufigsten verwendet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was ist der Prototypenansatz?

A

Dieser Ansatz nutzt die Idee, dass jeder Mensch für jede Eigenschaft (bspw. Extraversion) eine prototypische Vorstellung haben. Um Items zu generieren, müssen die prototypischen Vorstellung von Menschen gesammelt werden. Vor allem bei Persönlichkeitsfragebögen geeignet.

Bsp: Personen sollen an eine Person denken, welche eine bestimmte Eigenschaft aufweisen, und dann deren Verhalten beschreiben. Auch umgekehrt möglich, sie sollen an eine Person denken, die möglichst wenig prototypisch ist.

Beispiel: AFC (Act Frequency Approach)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was kann zum Vergleich der Methoden gesagt werden?

A

Gibt keine “beste” Methode in Bezug Vorteile zur Validität. Alle haben Vor- und Nachteile. Mit einer Kombination der Methoden können optimale Ergebnisse erzielt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist bei der Messung eines Konstrukts herausfordernd?

A

Oftmals ist es nicht möglich, sofort eine Definition des zu messenden Konstrukts / Konstruktraum zu erstellen. Häufig ist es notwendig, durch weitere Schritte zu beschliessen, was eigentlich genau gemessen werden soll. Hierbei helfen Top-Down und Bottom-up-Techniken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was bedeutet der Konstruktraum?

A

Eingrenzung des Konstrukts, aus welchen Indikatoren (Verhalten, Einstellungen, Eigenschaften) das Konstrukt besteht, wo es Anknüpfungspunkte oder gar Überlappungen zu anderen Konstrukten gibt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was sind Top-Down Techniken und wie werden sie unterteilt?

A

Indikatoren des Konstrukts werden auf Basis von Expertenurteilen oder der Sammlung von Definitionsmerkalen aus der bestehenden Literatur zusammengestellt.

  • Erfahrungsgeleitet-intuitiver Ansatz
  • Sammlung und Analyse von Definitionen/Literaturrecherche
24
Q

Was ist der erfahrungsgeleitet-intuitiver Ansatz (gehört zu top-down)?

A

Auf Basis von Expertenwissen wird definiert, welche Elemente oder Indikatoren das Konstrukt messen. Vorteilhaft, mehrere Experten zu befragen.

25
Q

Was beschreibt die Sammlung und Analyse von Definitionen/Literaturrecherche (gehört zu top-down)?

A

Ziel ist es, mithilfe von Literaturrecherche Indikatoren bzw. Definitionsmerkmale eines Konstrukts zu finden. z.b. in publizierten Studien / Testmanualen, Lehrzeitschriften, Lehrbücher etc. Oder bereits existierende Testverfahren.

26
Q

Was sind Bottom-up Techniken und wie werden sie unterteilt?

A

Hier werden zunächst Verhaltensweisen oder Indikatoren mithilfe der analytischen/empirischen oder der personenbezogen-empirischen Ansätzen ermittelt.

  • Analytisch-empirischer Ansatz
  • Personenbezogen-empirischer Ansatz
27
Q

Was ist der analytisch-empirischer Ansatz (gehört zu bottom-up)?

A

Dieser Ansatz der Merkmalseingrenzung ist v.a. im Bereich der Arbeits-, Betriebs- und Organisationspsychologie vertreten - Beobachtungs- und Befragungsinstrumente f¨r Situations- und Verhaltensbeschreibungen. Eine Methode, welche ausserhalb der Arbeits- etc. psychologie angewendet wird, mehr Gestaltungsfreiraum lässt: CIT. Mithilfe von CIT werden Verhaltensanker/Verhaltensmerkmale für ein Konstrukt ermittelt und dann zugeordnet. Dies führ zu besonders trennscharfen Definitionen.

28
Q

Was ist der CIT?

A

CIT (Critical Incident Technique): Ausgangsidee ist, dass sich Verhalten von Personen in versch. Situationen unterscheidet. Beispielfragen:
“Erinnern Sie sich bitte an eine Situation, in der Sie unkonzentriert waren”
- Schildern Sie die genaue Umstände!
- Woran haben Sie gemerkt, dass Sie unkonzentriert waren?
- Was waren die Konsequenzen?

Antworten werden gesammelt und in Gruppen zusammengefasst. Dann können Rückschlüsse über die zugrunde liegenden Konstrukte gezogen werden und Verhaltensweisen definieren.

29
Q

Was sind personenbezogen-empirische Methoden (gehört zu bottom-up)?

A

Hier wird auf bereits existierende empirische Befunde zurückgegriffen. Beschluss aufgrund von empirisch gefundenen Zusammenhängen zwischen Personenmerkmalen und bestimmten Kriterien auf zugrunde liegende Indikatoren.

30
Q

Was ist ein nomologisches Netzwerk?

A

Beziehung zwischen Konstrukten, aber auch zwischen Konstrukten und Beobachtbarem.

31
Q

Was ist z.B. das nomologische Netzwerk von Konzentration?

A

-Intelligenz
-Koordination
-Aufmerksamkeit
-Speed
-Inhibition

32
Q

Welche Arten von Itemformaten gibt es?

A

-gebundene
-freie

33
Q

Welche gebundene Antwortformate gibt es?

A

-Ratingskala
-Richtig-Falsch Aufgabe
-Zuordnungsaufgabe
-Umordnungsaufgabe
-Ungewöhnliche Itemformate

34
Q

Was sind Merkmale einer Ratingskala?

A

-Differenzierungsgrad (drei, vier, fünf, sechstufig)
-Validität und Reliabilität steigen, wenn mehr Antwortkategorien benutzt werden (bis 7 Kategorien)
-Polarität (unipolare von 0 nur in eine Richtung, bipolar von 0 in zwei Richtungen)
-Antwortalternativen: z.B. in Form von Smiley, rein numerisch (z.B. Schulnoten)
-Adjustierung Itemschwierigkeit: Umformulierungen von Items, um in eine gewisse Richtung zu lenken

Ratingskalen für: Häufigkeitsskalen, Intensität, Wahrscheinlichkeit, Bewertung

35
Q

Was sind die Vorteile / Nachteile einer Ratingskala?

A

Vorteile: Informationen über die Ausprägung eines Merkmals, ökonomische Durchführung und Auswertung

Nachteile: Abstufungen werden subjektiv anders aufgefasst (bedeutet evtl. nicht für alle das Gleiche), Neigung zu extremen Antworten

36
Q

Was sind die Vorteile / Nachteile einer Richtig-Falsch-Aufgabe?

A

Vorteile: kurze Bearbeitungs, Auswertungs- und Lösungszeiten. Leicht verständliche Testinstruktion.

Nachteile: Muss eindeutig beantwortbar sein, hoher Prozentsatz (50%) an Zufallslösungen möglich, wenig differenzierte Informationen, erhöhte Ja-Sage-Tendenz

37
Q

Was sind die Merkmale einer Mehrfachwahlaufgabe?

A

Haben mehr als zwei Antwortalternativen. Bspw. Multiple Choice- Items. Wird häufig eingesetzt bei der Erfassung von Wissen oder bei der Messung von Intelligenz.

38
Q

Was sind die Vorteile / Nachteile einer Mehrfachwahlaufgabe?

A

Vorteile: Durchführung und Auswertung sind ökonomisch. Zufällige Beantwortung der Probanden eher weniger mit mehr Items.

Nachteile: Lösungsstrategien können Ergebnis verfälschen, richtige Antworten sollten auf allen Items verteilt sein, kann schwierig sein, genug mögliche attraktive Lösungsmöglichkeiten zu finden.

39
Q

Was sind Distraktoren?

A

Falsche Antwortmöglichkeiten, die eine Persone von der richtigen Lösung ablenken soll.

40
Q

Was sind Zuordnungsaufgaben?

A

Zuordnung bestimmter Zeichen oder Inhalte zu anderen Zeichen oder Inhalten. z.B. Bilder oder Zeichen.

41
Q

Was sind die Vorteile / Nachteile einer Zuordnungsaufgabe?

A

Vorteile: Durchführung und Auswertung sind ökonomisch. Eignet sich zur Überprüfung von Wissen.

Nachteile: Antwortalternativen finden ist eher schwierig. Statt Reproduktion von Wissen wird nur Wiedererkennen gefordert.

42
Q

Was sind die Vorteile / Nachteile einer Umordnungsaufgaben?

A

Vorteile: kann bei Personen / Kinder eingesetzt werden, die nicht lesen können

Nachteile: Itemformat nur für wenige Fragestellungen ideal, aufwändige Materialbeschaffung

43
Q

Was sind allgemeine Nachteile von gebundenen Itemformaten?

A

Absichtliches Verfälschen, Raten, Antworttendenzen, Motivation, keine Erfassung von Kreativität oder sprachlichen Fertigkeiten.

44
Q

Welche freie Aufgabenbeantwortung gibt es?

A

-Ergänzungsaufgabe
-Kurzaufsatz

45
Q

Was sind die Vorteile / Nachteile einer Ergänzungsaufgabe?

A

Vorteile: kaum Zufallslösungen möglich, Möglichkeit für komplexe Aufgaben, qualitative Auswertung der Aufgaben

Nachteile: Folgefehler, grössere Zeitaufwand für die Bearbeitung, Reproduktion von Wissen wird abgefragt, Ketteneffekte (wenn ich ein Wort nicht weiss dann wahrscheinlich das nächste auch nicht)

46
Q

Was sind die Vorteile / Nachteile eines Kurzaufsatzes?

A

Vorteile: freie Reproduktion von Wissen ist möglich, keine Zufallslösungen möglich

Nachteile: Wenn Auswertungskriterien nicht eindeutig sind, evtl. eingeschränkte Auswertungsobjektivität, aufwändige Methode

47
Q

Welche Probleme bestehen bei der Formulierung von Fragebogenitems?

A
  • Itempolung (Tendenz, Items immer zuzustimmen)
  • Doppelte Verneinung (ich bin nicht jemand, der nicht traurig ist)
  • Registrierung von Verhaltenshäufigkeit
48
Q

Tipps und Tricks zur Formulierung von Fragebogenitems

A

-Begriffe mit mehreren Bedeutungen vermeiden
-Keine doppelten Verneinungen
-keine negativ gepolten Items
-Verallgemeinerungen vermeiden
-Wichtiges sparsam hervorheben
-keine Abkürzungen
-keine Fremdwörter (und wenn, dann erklären)
-Zeitspannen genau definieren
-leichte Verständlichkeit
-kurze Lösungszeit
-geringer Materialverbrauch
-leichte Auswertbarkeit
-

49
Q

Welche Reihenfolgeneffekte können auftreten?

A
  • Ankereffekte
  • Konsistenz- oder Assimilationseffekte
  • Kontrasteffekte
  • Salienzeffekte
  • Primingeffekte
  • Subtraktionseffekte
50
Q

Was sind Ankereffekte?

A

Die Beantwortung der vorhergehenden Frage wird durch die Testperson als Vergleichsanker für die nächste Frage verwendet

51
Q

Was sind Konsistenz- oder Assimilationseffekte?

A

Tp beantworten die zweite Frage ähnlich der ersten, um ein konsistentes Bild abzugeben, während eine getrennte Vorgabe der Fragen grössere Unterschiede bringen würde

52
Q

Was sind Kontrasteffekte?

A

Umgekehrter Fall: Die Antwort auf die zweite Frage reicht stärker von der ersten ab, als wenn beide Fragen getrennt gestellt würden

53
Q

Was sind Salienzeffekte?

A

Die Beantwortung der Fragen kann die Bewusstheit zu einem Sachverhalt verändern und die Beschäftigung mit dem angesprochenen Thema kann zu verstärkter oder verminderter
Einschätzung führen.

54
Q

Was sind Primingeffekte?

A

Wenn die Vorgabe eines Items dazu führt, dass bestimmte Informationen erinnert werden, die in der Folge schneller verfügbar sind.

55
Q

Was sind Subtraktionseffekte?

A

Die Tp folgert aus der Tatsache, dass die erste Frage bereits beantwortet wurde, dass die folgende Frage einen weiteren Aspekt erfragt und Informationen zur ersten Frage nicht weiter
berücksichtigt werden sollen, um Redundanzen zu vermeiden

56
Q

Was sind mögliche Verzerrungen von Testergebnisse?

A
  • subjektive Tests = Verfälschbarkeit
  • Absichtliche Verstellung
  • soziale Erwünschtheit
  • Akquieszenz (Ja-Sage-Tendenz)
  • Tendenz zur Mitte / Extremurteile
  • Motivation
  • Reihenfolgeeffekte (vorangehende Items geben Hinweise zur Lösung eines nachfolgenden Items)