11. VL. Interpretation von Testresultaten und Testeichung Flashcards

1
Q

Was ist die Ausgangslage vor der Testwertinterpretation und welche beiden Formen gibt es?

A

Ausgangslage: Wir haben einen numerischen Testwert (Rohwert) und müssen diesen nun interpretieren. Dazu benötigen wir einen Vergleichsmassstab.

Davon gibt es 2 Formen:

  • Normorientiert: Ergebnis mit Norm einer Referenzgruppe vergleichen (linear und nicht linear) = NO
  • Kriteriumsorientiert: Anhand eines inhaltlichen Referenzwertes, der a priori festgelegt wurde, vergleichen. = KO

Merke: Auch das Gemisch aus beiden ist möglich bsp. Beck’s Depressions Inventar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

NO: Normierung: Definition und Zweck.

A

Definition: Unter Normierung (Eichung) versteht man das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen eindeutig eingeordnet werden können.

Zweck: Bezugssystem herstellen. Dient als Hilfe zur Interpretation des Rohwerts.

Vergleichsmassstab: Bezugsgruppe

  • letzter Schritt in der Testkonstruktion
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

NO: Was bedeutet der Normwert und welche beiden Vorgehensweisen in der Normierung gibt es?

A

Normwert: Erlaubt Positionierung der Testperson bezüglich der erfassten Merkmalsausprägung innerhalb der Bezugs- bzw. Referenzgruppe.

Vorgehensweisen:

  1. Nicht-Linear (Bsp. Prozentrang)
  2. Linear (Bsp. z-Wert)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

NO: Erkläre die Ablaufschrotte der Normierung eines Tests.

A
  1. Repräsentative Stichprobe nötig
  2. Verteilung der Testwerte auf Normalität prüfen
  3. Prozentrang- oder Standardnormen (bei Normalvertil.)
  4. Je nach Ziel weitere Transformationen:
    - z-Werte mit linearen Transformationen in andere Standardnormen umwandeln
    - Flächentransformationen (falls nicht normalverteilte Testwerte)
  5. Ergebnisse der Testeichung in Normtabelle darstellen
  6. Geltungsbereich definieren & Aktualität der Normstichprobe prüfen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

NO: Erkläre die nicht-lineare Testwerttransformation und erkläre die Bildung des Prozentrangnormen

A

Definition: Ein Prozentrang gibt an, wie viel Prozent der Bezugsgruppe bzw. Normierungsstichprobe einen Testwert erzielt, der niedriger oder maximal ebenso hoch ist, wie der Testwert xv der Testperson v. Der Prozentrang entspricht somit dem prozentualen Flächenanteil der Häufigkeitsverteilung der Bezugsgruppe, der am unteren Skalenende beginnt und nach oben hin durch den Testwert xv begrenzt wird.

Aber: Prozentrang ist nicht gleich Prozent korrekt gelöst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

NO: Wie ist das Vorgehen bei der Bildung von Prozentrangnormen?

A

Vorgehen:

  1. Testwerte der Normierungsstichprobe in aufsteigende Rangordnung bringen
  2. Häufigkeiten der einzelnen Testwertausprägungen erfassen, kumulierte Häufigkeiten bis einschliesslich Testwert bestimmen
  3. diese durch den Umfang N dividieren & mit 100 multiplizieren

–> Normtabelle erstellen, d.h jedem Prozentrang von 1-100 werden die jeweils zugehörigen Testwerte zugeordnet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Von was ist der Prozentrang abhängig?

Was gilt?

Und was ist das Problem?

A

Wichtig: Prozentrang ist abhängig von Vergleichsstichprobe. (Relativ zu was / wem?)

Es gilt:

  • leichte Verständlichkeit
  • Ordinalskalenniveau genügt
  • keine bestimmte Verteilungsform gefordert
  • selbst bei intervallskallierten Testwerten kann keine Prozentrangdifferenz als Vergleich herangezogen werden. = z-Wert-Transformation wählen

Problem: In Bereichen mit hoher Testwertdichte werden Merkmalsunterschiede überschätzt, in Bereichen mit niedriger Testwertdichte jedoch unterschätzt.
= Die zugrunde liegende Messungs-Skala wird verzerrt = daher z-Werte nehmen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

NO: Erkläre die Bildung von standardisierten z-Normwerten!

A
  • z-Werte erhält man durch eine lineare Transformation der Testwerte
  • ermöglichen im Gegensatz zu Prozentrangnormen einen Vergleich von Testwerten verschiedener Skalen
  • Voraussetzung: intervallskaliert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definiere den z-Normwert.

A

Der z-Normwert gibt an, wie stark der Testwert xv einer Testperson v vom Mittelwert x der Verteilung der Bezugsgruppe in Einheiten der Standardabweichung SD der Testwert xv abweicht.

z-Norm: Position des Testwertes einer Person als standardisierter Abstand (bzw. Differenz) zum arithmethischen Mittelwert der Verteilung der Bezugsgruppe. –> Vergleich des individuellen Testwertes mit dem arithmethischen Mittel

z-Normwerte haben einen Mittelwert von Z=0 und eine Standardabweichung von SD(z) = 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Beschreibe das Vorgehen der linearen Testwerttransformation:

A
  1. z-Wert berechnen
  2. Mit Hilfe der Verteilungsfunktion der Standardnormalverteilung (Tabelle A2) kann die Fläche bzw. der Prozentrang berechnet werden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist das Fazit der z-Werte?

A
  • Algebraische Operationen können angewendet werden, da die Differenzen zwischen Norm- und Testwert proportional sind
  • wenn normalverteilt, dann heisst der z-Normwert Standardwert
  • oft wechselt man aber von den z-Normwerten in andere Standardnormen, da sie übersichtlicher sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Grenze Normalisierung und Normierung voneinander ab!

A

Normierung bzw. lineare Transformationen normalisieren nicht, sondern behalten die originalen Verhältnisse, daher ist der Vergleich mit anderen Verteilungen nur bedingt möglich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erkläre die Normdifferenzierung Kontroverse

A

Wie spezifisch soll eine Vergleichs- bzw. Referenzgruppe zusammengestellt sein?
Fairness vs. Gefahr von “overadjustment”, d.h. Norme zu sehr an Teilpopulation angepasst

Fazit: Diverse Interessen sorgfältig abwägen und Kompromisse eingehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was gilt für die Aktualität der Normen?

A

Normen sind mind. alle 8 Jahre auf ihre Gültigkeit zu prüfen und ggf. Neunormierung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Beschreibe die Kriteriumsorientierte Testwertinterpretation!

Wie ist die Vorgehensweise?

A

Testwertinterpretation durch Bezug zu einem spezifischen inhaltlichen Kriterium (unabhängig von Anzahl Personen, die das Kriterium erreicht haben).

Vorgehensweise: Vorab Schwellenwert definieren, ab dem ein Kriterium als zutreffend angenommen wird.

Schwellenwert kann durch 2 Arten ermittelt werden:
1. mit Hilfe der Inhalte der Testaufgaben werden Testwerte beschrieben = Expertenurteil
2. durch Bezug zu einem externen Kriterium = hierzu muss eigens eine Untersuchung durchgeführt werden:
einfaches Verfahren fürs Eruieren eines externen Kriteriums: ROC-Analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Schwellenwert ermitteln: Beschreibe 1. die KO im Bezug auf den Aufgabeninhalt.

Voraussetzung?
Probleme?

A

Voraussetzung: A priori genaue inhaltliche Vorstellungen von der theoretischen Grundgesamtheit (Definition) der Aufgaben des interessierenden Konstrukt.

  • Definition erfolgt durch Experten
  • Aufgaben sollen Schwierigkeitsverteilungen aufweisen, die derjenigen der Grundgesamtheit entsprechen

Bei psychologischen Fragebögen oft schwierig, kann eher bei Lernzielen- oder Leistungstests angewendet werden.

Problem: Schwierigkeit kann auch durch verbale Formulierung beeinflusst werden, die nichts mit der Merkmalsausprägung zu tun hat.

17
Q

Beschreibe die Receiver-Operating-Characteristic-Anaöyse!

Was ist das Ziel?

A

Ziel: Schwellenwert bestimmen zur Unterscheidung von 2 Gruppen anhand eines externen Kriteriums.

18
Q

Beschreibe die Signal-Detection-Matrix!

Was bedeutet die Effizienz?

A
Sensitivität = Trefferquote = Richtig Positiv
1-Sensitivität = Verpasserquote = Falsch Negativ
Spezifität = Korrekte Ablehnung = Richtig Negativ
1-Spezifität = Falscher Alarm = Falsch Positiv

Effizienz: Anteil insgesamt richtiger Klassifikationsentscheidungen! = Personen die tatsächlich richtig eingestuft wurden!

19
Q

Bsp: Was bedeutet eine Sensitivität von 90%?

A

Von 100 Personen, welche krank sind, weisen 90 der Untersuchten ein positives Resultat auf.
= Nicht: Personen mit positivem Resultat leiden mit 90% Wahrscheinlichkeit an der Krankheit!

= also immer vom Kriterium ausgehen!

20
Q

Von was sind die Sensitivität und die Spezifität abhängig?

Wie werden S & S vom Schwellenwert beeinflusst?

A

Sensitivität und Spezifität sind voneinander und vom gesetzten Schwellenwert (Cut-Off Point) abhängig.

Durch die ROC-Analyse wird eine Darstellung von Sensitivität und Spezifität bei verschiedenen Referenzwerten möglich.

Je höher der Schwellenwert, desto höher die Spezifität und desto niedriger die Sensitivität. Je niedriger der Schwellenwert, desto niedriger die Spezifität und desto höher die Sensitivität!

21
Q

Sensitivität und Spezifität in Abhängigkeit des Schwellenwertes.

Wie verhält es sich bei mittlerem - hohem - niedrigem Schwellenwert?

A

Mittlerer Schwellenwert:
Spezi: .80
Sensi: .90

Hoher Schwellenwert:
Spezi: 100 = steigt
Sensi: .50 = sinkt

Niedriger Schwellenwert:
Spezi: .50 = sinkt
Sensi: 100 = steigt

22
Q

Wie kann der Schwellenwert optimal bestimmt werden?

Was ist der Youden-Index?

A

Durch die ROC-Kurve! Verdeutlicht die gegenläufige Beziehung zwischen Spezi und Sensi.

Max. Youden-Index: Schwellenwert, bei welchem die Summe von Spezi und Sensi am grössten ist, d.h die Trennung der beiden Gruppen gelingt dort am Besten.
Youden-Index = Sensi + Spezi -1

vgl. p.36!

23
Q

Was bedeutet die AUC (Area under Curve)?

A

Ein Mass für die Güte des Tests ist die Fläche unter der ROC-Kurve. Sie gibt Auskunft über die diskriminatorische Fähigkeit des Tests. Wenn sich die Kurve signifikant von der Diagonalen unterscheidet, dann weist der Test Trennschärfe auf!

Wenn sich also die Kurve dem linken oberen Ecken nähert, dann erhöht sich die diskriminatorische Güte.

Damit: optimaler Cut-Off-Wert bei max. Yourden

24
Q

Macht es immer Sinn den max. Youden-Index zu wählen?

A

Nein. z.B bei Suizidalität lieber einen tieferen Schwellenwert nehmen! (à la lieber eine Person mehr behandeln als eine zu wenig)

Höheren Schwellenwert wählen bei: Managerselektion, Todesstrafe = lieber einen geeigneten Manager nicht nehmen als ein ungeeigneter nehmen

Niedriger Schwellenwert wählen bei: Suizidgefährdung, Einstufungstest Primarschule = lieber ein Kind in die Schule lassen, dass noch nicht 100% ready ist, als eines das ready ist nicht lassen