8. VL: Reliabilität 3: Interrater-Reliabilität und Validität 1: Inhalts- und Kriteriumsvalidität Flashcards

1
Q

Welche beiden Arten von Daten gibt es?

Welche Vorgehensweisen werden dabei angewendet?

A
  • Quantitative Daten: Fragebogen / Tests mit Skalen
  • Qualitative Daten: offene Fragen / Interview

Vorgehensweise: Top-down vs. Bottom-up

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist der Hauptvorteil an qualitativen Daten?

Was ist der Hauptnachteil an qualitativen Daten?

A

Qualitative Daten:

Vorteil: Erfassen, was nicht direkt gesagt wird, Phänomene im Kontext

Nachteil: Überlegen was und wie man fragt, Transformation der unstrukturierten, freien Antworten in quantitaitive Teile = Kodieren der Daten sehr schwer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie können qualitative Daten kodiert werden?

A

Antworten mit Hilfe eines Kodiersystems quantifizieren:

  • mit bereits vorhandenem Kodiersystem
  • Entwicklung eines neuen Kodiersystems

Merke: Der Vorteil an einem bereits vorhandenem ist, dass es bereits in mehreren Versuchen ausprobiert wurde. Bsp. Facial Action Coding Sytsem (Ekman & Fries)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Durch welche beiden Wege kann ein neues Kodiersystem entwickelt werden?

A
  1. Topdown (deduktiv / theoretischer Ansatz)

2. Bottomup (induktiver / empirischer Ansatz)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Erkläre das Vorgehen beim Top-Down Ansatz in der Entwicklung eines neuen Kodiersystems!

A
  1. Theoriegeleitete Kategorie bilden
  2. Material lesen - sind Kategorien brauchbar?
  3. Überarbeitung des Kodiersystems
  4. Training und Testphase
  5. Kodieren

(Zuerst Theorie, dann Kodieren)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Erkläre das Vorgehen beim Bottom-Up Ansatz in der Entwicklung eines neuen Kodiersystems!

A

Kodiersystem entsteht erst beim Durchlesen der Daten oder man bemerkt nachtäglich, dass etwas mit dem Kodiersystem ursprünglich nicht eingefangen wurde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Erkläre die beiden Vorgehensphasen der Kodierung der Daten. Auf was müssen die Kodierer besonders achten?

A
  1. Trainingsphase:
    - genügend Material notwendig
    - System anpassen mittels Feedback der Kodierer (unklare Kategorien besprechen)
    - gute Übereinstimmung der Kodiere finden
  2. Kodierphase:
    - unabhängiges kodieren (nicht mehr ansprechen)
    - nichts über die Hypothesen wissen
    - für Auswertung nachträgliche Aussprache
    - ABER: für die Schätzung der Reliabilität benötigt man ursprüngliche Bewertung

Anzahl Rater: Um Reliablität zu schätzen, benötigt man mindestens zwei unabhängige Kodierer. (mind. 20-25% der Pbn)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Welche Methoden zur Berechnung der Interrater-Reliabilität kennst du? Welche Skalenniveau haben sie?

A

a) Prozentualen Übereinstimmung (nominal)
b) Cohen’s Kappa (nominal)
c) Interrater-Korrelation (intervall)
d) Intraclass-Korrelation (intervall)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Beschreibe a) die Methode der Prozentualen Übereinstimmung!

Was ist das Problem dabei?

A

Einfacher Index der prozentualen Übereinstimmung der Kodierung bei nominalen (kategorialen) Skalen.

Beispiel: Beobachter machen Striche wenn sie Kind beobachten. Übereinstimmung der Striche aller Beobachter ausschlaggebend.

Intervall kann zeitlich aber auch mit Sätzen oder anderen Einheiten sein.

Problem: Nicht sensibel für das Ausmass der Übereinstimmung. Sehr anfällig für zufällige Übereinstimmung!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Beschreibe b) die Methode des Cohen’s Kappa.

Welche Werte kann Kappa annehmen?

Welche Wert können wie interpretiert werden?

A

Proportion prozentualer Übereinstimmung! Korrektur angewendet um die Übereinstimmung durch Zufall zu umgehen (siehe a)
–> Beste Methode für den Grad der Übereinstimmung

Beispiel: 2 Schichtleiter beurteilen 20 Arbeiter nach 3 Verhaltenskategorien.

Kappa kann Werte zwischen -1 = weniger als per Zufall, 0 = wenig Übereinstimmung und 1 = perfekte Übereinstimmung annehmen.

Allgemein gilt:
Kappa .75 sehr hohe Übereinstimmung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Beschreibe c) die Methode der Interrater Korrelation.

Was ist das Problem dabei?

A

Relative, Proportionale Übereinstimmung bei intervallskalierten Daten. Es geht um die Konsistenz in den Mustern der Ratings (höhe spielt keine Rolle).

Beispiel: 2 Rater kodieren einige Textpassagen im Bezug auf die Emotionalität.

Problem: Korrelation zeigt nur Muster auf und nicht die absolute Übereinstimmung. Wollen die Rater mit denselben Zahlen auch dasselbe ausdrücken?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Beschreibe d) die Intraclass Korrelation (ICC)

A

Erweiterung der Varianzaufteilung der KTT, d.h nebst dem Zufallsfehler werden auch systematische Fehler berücksichtigt. Mit dem ICC können systematische Fehler (z.B Varianz der Rater) herauspartialisiert werden.

Beispiel: 5 Rater beurteilen 10 Essays von Studenten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie kann die Interraterreliabilität verbessert werden?

A
  1. Genaues Nachvollziehen, wo die Probleme liegen, Verbessern der Raterleistung
  2. Angleichen des Hintergrundes der Rater (Homogenisierung der Rater)
  3. Ausschluss von Rater, deren Werte sich von der Mehrheitsmeinung unterscheiden.
  4. Vereinfachung der beteiligten Informationsverarbeitungsprozessen.
  5. Veränderung der Skalenbeschreibung (Zwischenstufen mit Zahlen beschriften, Intervallskala besser als dichotom)
  6. Beispiele dafür, was gemeint ist und was nicht gemeint ist
  7. Beurteilung Merkmal für Merkmal (mehrere Durchgänge)
  8. Angleichen der Art, in der Beurteilungsobjekte präsentiert werden
  9. Erhöhung der Varianz
  10. Prozentsatz der von beiden / allen Ratern kodierten Pbn erhöhen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wenn ein Test hohe Validität hat dann kann man…

A

.. 1. vom beobachteten Verhalten innerhalb der Testsituation auf das Verhalten ausserhalb der Testsituation schliessen
.. 2. vom beobachteten Verhalten innerhalb der Testsituation auf Fähigkeiten, Dispositionen, Persönlichkeit als Grundlage für das Verhalten schliessen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Validität und zu welchen Zwecken können die Ergebnisse interpretiert werden?

A

Validität ist das wichtigste Gütekriterium! Gibt an, ob die Interpretation und Schlüsse des Tests valide sind.

Interpretation der Testergebnisse kann folgendes bezwecken:

  • Bewerten: Vergleich mit der Leistung von anderen Pers.
  • Verallgemeinerung: auf ähnliche Aufgaben, Situationen
  • Extrapolieren: auf andere Bereiche ausserhalb (hochrechnen)
  • Erklären: Annahme über Konstrukt und Prozesse
  • Entscheidungen: für was sich jemand eignet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welche Ziele haben die einzelnen Arten der Validität?

A

Jede Methode hat ein anderes Ziel im Vordergrund!

  • Inhaltsvalidität: Repräsentativität der Items und Test
  • Kriteriumsvalidität: praktische Anwendbarkeit der Vorhersage
  • Konstruktvalidität: Schluss über latente theoretische Konstrukte
17
Q

Welche Methoden zur Validitätsbestimmung gibt es?

A
  • theoretische Argumente/Urteile von Experten
  • prädiktive Vorhersage
  • Faktorenanalyse
  • Korrelation mit anderen Variablen
  • Gruppenvergleiche
  • experimentelle Manipulation
18
Q
  1. Augenschein- Validität.
A

Definition: Augenscheinvalidität gibt ab, inwieweit der Validitätsanspruch eines Tests von blossem Auge her einem Laien gerechtfertigt erscheint.

  • Glaubhaftigkeit, Akzeptzanz
  • unterstützt die Interpretation eines Tests nicht
  • sinnvoll für die Motivation der Testperson
  • Problem: Soziale Erwünschtheit –> Verzerrung möglich
19
Q
  1. Inhaltsvalidität:

Definition

von was geht es aus?

Hauptziel

A

Definition: Inwieweit erfassen die Items im Test das interessierende Merkmal repräsentativ? = Verallgemeinern!

Geht immer um den Repräsentationsausschluss! Dabei 2 Formen:

  • Ideal: Enumerative Lösung = vollständige Auflistung aller relevanter Items
  • Real: Annähnerungslösung = exemplarische Auswahl relevanter Items

Hauptziel: Verallgemeinerung der Interpretation der Testergebnisse –> Inhaltsvalidität basiert auf Logik, nicht Statistik!

20
Q

Welche beiden Merkmalsdefinitionen können bei der Inhaltsvalidität unterschieden werden?

A

Operationale Definition:

  • Merkmal wird über Testinhalte definiert, ohne theoretische Annahme
  • Nachweis: Urteil von Fachexperten
  • Ziel: Verallgemeinerung

Theoretische Definition:

  • Definition im Rahmen einer Theorie
  • Nachweis: theoretische Fundierung & schlüssige Argumentation
  • Ziel: Verallgemeinerung & Erklärung
21
Q

Nenne 2 Arten von fehlender Inhaltsvalidität

A
  1. Konstrukt ist unterrepräsentiert

2. konstruktirrelevante Varianz wird miterfasst

22
Q

Kriteriumsvalidität:

Definition

Hauptziel

A

Praktische Anwendbarkeit der Vorhersage inwiefern korreliert das Kriterium mit einem Kriterium ausserhalb?

Geht immer vom Korrelationsausschluss aus!

Hauptziel: Extrapolierende Interpretation der Testergebnisse auf praktisch relevante externe Kriterien

Aber wichtig: diese Aussenkriterien muss man sorgfälltig wählen durch:

  • ökonomische Entscheidung (inkrementelle Validität)
  • zeitliche Verfügbarkeit der Kriterien = 1. Übereinstimmungsvalidität, 2. Vorhersagevalidität, 3. Retrospektive Validität
23
Q

Kriteriumsvalidität: Beschreibe die 3 Arten der zeitlichen Verfügbarkeit!

A
  1. Vergangenheit: Retrospektive Validität
  2. Jetzt: Konkurrente Validität (Übereinstimm.val)
  3. Zukunft: Prognostische Validität (Vorhersageval.)
24
Q

Kriteriumsvalidität: Beschreibe die Übereinstimmungsvalidität!

Was steht im Vordergrund?

A

Jetzt! Zwei zeitgleiche Messungen (Testscore & Kriteriumsscore) = wie gut stimmen diese überein?

Diagnose steht im Vordergrund!

25
Q

Kriteriumsvalidität: Beschreibe die Vorhersagevalidität!

Was steht im Vordergrund?

A

Zukunft! Zwei Messungen mit unterschiedlicher Zeitspanne! Eines Jetzt (Testscore) und eines später (Kriterium).

Prognose steht im Vordergrund! (Testscore soll Kriterium vorhersagen)

Bsp. NC

26
Q

Kriteriumsvalidität: Beschreibe die Retrospektive Validität

Was steht im Vordergrund?

A

Ein Kriterium, welches in der Vergangenheit gemessen wurde, soll mit dem Testscore von Heute vergleichen werden!

Im Vordergrund steht die Erklärung.

27
Q

Kriteriumsvalidität: Beschreibe die inkrementelle Validität!

A

Gehört zu ökonomische Entscheidung!

Ausmass, indem die Vorhersage des praktisch relevanten externen Kriteriums verbessert werden kann, wenn zusätzliche Testaufgaben oder Testskalen zu den bereits existierenden hinzugenommen werden.