Gütekriterien 2 Flashcards

1
Q

Validität - Definition

A

Übereinstimmung von Testergebnissen mit dem, was der Test messen soll. Es handelt sich um ein Urteil darüber, wie angemessen bestimte Schlussfolgerungen vom Testwert auf das Verhalten außerhalb des Testes oder auf ein Merkmal der Person sind
= Gültigkeit einer Messung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Validität vs. Reliabilität

A

Reliabilität = Konstantheit einer Messung
Validität = Genauigkeit einer Messeung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Validität - Eigenschaften

A
  1. Wichtigstes Gütekriterium –> verlgiechbar mit dem Wirksamkeitsnachweis von Medikamenten
  2. Validierung eines Verfahrens läuft i.d.R. immer unterschiedlich ab
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Arten von Validität

A
  1. Inhaltsvalidität
  2. Kritieriumsvalidität:
    a) Konkurente Validität
    b) Prädiktive Validität
    c) inkrementelle Validität
  3. Konstruktvalidität:
    a) Konvergente Validität
    b) divergente Validität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Arten von Validität: Inhaltsvalidität - Definition, Inhalt (Definition) & Fragestellungen

A
  1. Definition: wie repräsentativ sind die Items eines Testes für das zu messende Merkmal
  2. Inhalt = Die Gesamtheit des Materials z.B.: Items, Antwortmöglichkeiten, Stimuli,…, sie messen das zu messende Merkmal
  3. Fragestellungen:
    a) Stellen die items eine repräsentative Auswahl aus allen möglichen Items dar, welche das interessierende Merkmal erfassen können?
    b) Kann das interessierende Konstrukt Unterscheide in den beobachteten Antworten erklären?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Arten von Validität: Inhaltsvalidität - Bestimmung/ Einschätzung

A
  1. Hypothetisch: Inhaltsvalidität ist etwas hypothetisches (kann nicht berechnet/ nummerisch angegeben weredn)
  2. Als hoch anzusehen wenn: Autoren eines Tests ihr Konzept und Verfahren bei der Konstruktion und Auswahl von items (Indikatoren) genau darlegen –> Aber: Inhaltsvalidität ist NICHT Augenscheinvalidität (“Sieht doch gut aus”)
  3. Konsens: über relevante Items kann auch nummerisch ausgedrückt werden (Korrelation zwischen unabhängigen numerischen Urteilen von Experten)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Arten von Validität: Kriteriumsvalidität - Definition

A

Zusammenhang zwischen Testergebnis und konkreten Leistungen / Verhaltensweisen außerhalb der Testsituation. Das Kriterium muss für den vorgesehenen Einsatzbereich des Tests relevant sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Arten von Validität: Kritierumsvalidität - Bestimmung, Arten & Erhebung

A
  1. Bestimmung: numerisch bestimmbar (Korrelation)
  2. Erhebung: des Kriteriums kann im gleichen Zeitraum stattfinden wie die Testerhebung aber auch zu einem deutlich späteren Zeitpunkt
  3. Arten:
    a) Konkurrente Validität
    b) Prädiktive Validität
    c) Inkrementelle Validität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Arten von Validität: Kritierumsvalidität: Konkurrente Validität

A

= Übereinstimmungsvalidität

  1. Korrelation zwischen Test und Kriterium innerhalb eines gegebenen Zeitpunktes (wird relativ zeitgleich erfasst)
  2. Beispiele:
    a) Messung von Schüchternheit und Anzahl der Bekannten als Kriterium
    b) Messung von Konservaismus und gewählte politische Partei bei der letzten Wahl als Kritierum
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Arten von Validität: Kriteriumsvalidität: Prädiktive Validität

A

= Vorhersagevalidität
1. Korrelation zeischen Test zu einem Zeitpunkt und erfasstem/ auftretendem Kritierum zu einem späteren Zeitpunkt

  1. Beispiel: Messung von Schüchternheit im 1 Semester und Berechnung der Korrelation der Anzahl der Bekannten im 3. Semester
    s. F14/ 15
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Arten von Validität: Kritieriumsvalidität: inkrementelle Validität

A
  1. Die zusätzliche Varianzaufklärung eines Tests in einem Kritierium gegenüber einem anderen etablierten Test (meist per Regressionsanalyse oder mehrerer Korrelationen)
    s. F. 16
  2. Idee: Das interesserende Kriterium sollte möglichst umfassend erfasst werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Arten von Validität: Kritieriumsvalidität: inkrementelle Validität - Wann wird sie benutzt?

A
  1. Mehrere Tests: Es gibt mehrere Tests, die ein Merkmal messen –> Entscheidung welcher verwendet werden solle, also welcher Test mehr mit dem Kriterium zusammenhängt/ mehr Varianz aufklärt
  2. mehere Verfahren: wenn man mehrere diagnostische Verfahren ergänzend benutzen möchte, um möglichst viel Varianz eines Kritieriums aufzuklären (z.B.: Auswahl von Bewerbern für einen Job)
    Beispiel s. F. 18/ 19
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Arten von Validität: Konstruktvalidität Definition & Konstrukt Definition

A
  1. Definition: empirische Belege dafür, dass ein Test das Konstrukt erfasst, welches erfasst werden soll - und nicht ein anderes
  2. Definition - Konstrukte: hypothetische Konzepte/ Merkmale –> Erlangen ihre Bedeutung durch ein Netzwerk anderer Konstrukte im Rahmen empirischer Forschung (Zusammenhänge zwischen den zu erfassenden Merkmalen mit anderen Merkmalen)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Arten von Validität: Konstruktvalidität - Eigenschaften

A
  1. Anspruchsvoll: die überzeugendste und anspruchvollste Form der Validierung
  2. Theoriegeleitete: Erwartungen über (fehlende) Zusammenhänge zwischen dem zu validierenden Instrument und Validitätskritierien werden auf der Basis einer Theorie vorgenommen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Arten von Validität: Konstruktvalidität - Arten von Validitäten und nomologische Netze

A
  1. Arten von Validitäten:
    a) konvergente Validität: Zusammenhang des vorliegenden Tests mit konstruktnahem Tests
    b) diskriminante/divergente Validität: kein/geringer Zusammenhang mit konstruktfremden Tests
  2. Nomologisches Netz: Umfeld von Konzepten ähnlicher oder unterschiedlicher Bedeutung –> Einordung des Konstruktes in das nomologische Netz, Zusammenhang mit anderen Konstrukten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Arten von Validität: Konstruktvalidität: Methoden zur Bestimmung der Konstruktvalidität

A
  1. Empirische Differenzierung
  2. Experimentelle Differenzierung
  3. Faktorenanalytische Differenzierung
  4. Multitrait-Multimethod (MTMM) -Analyse
17
Q

Arten von Validität: Konstruktvalidität: Methoden zur Messung von Konstruktvalidität - Faktoranalystische Differenzierung - Annahme

A

Zusammenhänge aller items lassen sich auf gemeinsames Konstrukt zurückführen

18
Q

Arten von Validität: Konstruktvalidität: Multitrait-Multimethod -Ansatz: Eigenschaften

A
  1. Ver. Eigenschaften werden mit ver. Methoden erfasst
  2. Daunter konstruktähnliche Eigenschaften und konstruktfremde Eigenschaften
  3. Gleiche und andere Methoden (z.B.: Fragebogen und Verhaltensbeobachtung) zur Erfassung
19
Q

Arten von Validität: Mutitrait-Mutlimethod- Ansatz: Berechnung

A
  1. Korrelationsmatrix: Daraus wird eine Korrelationsmatrix gebildet
    a) Das Konstrukt sollte mit ähnlichen Konstrukten positiv (und eher hoch) korrelieren
    b) das Konstrukt soll mit anderen Konstrukten nicht (oder niedrig) korrelieren
    c) Reliabilität: ablesbar - gleiches Konstrukt mit gleicher Methoden
    s. F. 28
20
Q

Arten von Validität: Konstruktvalidität: Multitrait-Multimethod-Ansatz: Interpretationshilfe

A
  1. Reliabilität = Dasselbe Merkmal + dieselbe Methoden
  2. Dasselbe Merkmal + ver. Methoden:
    a) konvergente Validität: bei einer hohen Korrelation –> das Merkmal kann unabhängig von der gewählten Methoden erfasst werden
    b) geringe konvergente Validität: niedrige Korrelation
  3. divergente Validität = niedrige Korrelation von Ver. Merkmale + dieselbe Methode
  4. Methodeneffekt und niedrige divergente Validität = hohe Korrelation von ver. merkmalen + dieselbe Methode
  5. divergente Validität/ gegen Methodeneffekt = Korrelation zwischen ver. Methoden und ver. Merkmalen sollte am niedrigesten ausfallen
    s. F. 29/ 30/31
21
Q

Wie beurteilt man die Validität eines Verfahrens?

A
  1. Korrelationskoeffizenten: -1 bis 1
  2. Insgesamt sehr schwer zu beurteilen, es gibt keine pauschalen kennwerite, spezifische Umstände sind bedeutsam –> i.d.R.: Vergleichswerte ähnlicher etablierter Verfahren suchen
  3. Studie von Hemphill(2003):

Oberes Drittel von Verfahren hatte Validität r = .35 bis r = .78

Mittleres Drittel von Verfahren hatte Validität r = .21 bis r = .33

Unteres Drittel von Verfahren hatte Validität von r = .02 bis r = .21
siehe F. 33!!

22
Q

Zusammenhang der Gütekriterien

A
  1. je höher die Objektivität, desto größer die Reliabilität:
    a) Fehler in Durchführung, Auswertung, Interpretation führen zu unreliablen Messungen: Verletzung von Objektivität = Messfehler = niedrige Reliabilität
    b) Daher liefert die Objektivität eine Obergrenze für die Reliabilität
  2. geringe Reliabilität fürht zu geringer Validität:
    a) Reliabilität ist Vorraussetzung für Validität
    b) geringe Reliabilität eines Tests (oder Kriteriums) führt zu geringer Korrelation mit einem anderen Test (oder Kriterium)
    c) Umgekerht ist geringe Validität trotz hoher Reliabilität mögich
    s. F. 34
23
Q

Daumenregel zur Beurteilung der Testgüte

A
  1. Reliabilität (interne Konsistenz):
    a) niedirg: < .70
    b) Akzeptabel bis sehr gut: .70 -.90
  2. Kritierumsvalidität:
    a) niedrig: < .30
    b) akzeptabel bis sehr gut: .30-.60

–> lediglich Anhalspunkte, in der Praxis selten so hohe Werte
–> Abhöngig von inhalticher Fragestellung und von der Art des psychometrischen Verfahrens
–> in der Persönlichkeitsdiagnostik i.d.R: niedriger als in der Leistungsdiagnostik

24
Q

Normierung & Normwerte - Definition

A
  1. Definition: Liefert einen Bezug bzw. Vergleichsmaß zur Interpretatiion eines Tests
  2. Normwerte - Dfinition: zur aussagekräftigen und fairen Beurteilung individueller Rohwerte in einem Test im Verlgeich zu einer Referenzgruppe ist oft eine Transformation in sogenannte Normwerte notwendig
25
Q

Normierung: Arten von Normwerten und Vorraussetzungen

A
  1. Arten von Normwerten:
    a) Äquivalentnorm
    b) Abweichungsnorm
    c) Prozentrangnorm
  2. Vorraussetzungen:
    a) Repräsentativität der Stichprobe
    b) Standardisierte Durchführung der diagnostischen Erhebung
26
Q

Normierung: 1. Äquivanentnorm - Definition, Anwendung & Beispiel

A
  1. Definition: Zuordnung der Rohwerte zu dem Durchschnittswert der individuellen Referenzgruppe (z.B.: Alter, Geschlecht, Bildungsstandard, …)
  2. Anwendung: häufig bei Entwicklungsstanddiagnostik in Bezug auf die entsprechende Altersgruppe (z.B.: kognitive Leistungsfähigkeit eines Kindes ausgedrückt ind er durchschnittliches Leistungsfähigket eines bestimmten Alters)
  3. Beispiel: Die Aufmerksamkeit eines Kindes im Alter von 6 entspräche der eines durchschnittlich:
    5-jährigen (unterdurchschnittlich)
    6-jährigen (durchschnittlich)
    7-jährigen (überdurchschnittlich)
27
Q

Normierung: 2. Abweichungsnorm - Definition, Vorraussetzung, Formel & übliche Abweichungsnormen

A
  1. Definition: Transformation individueller Testwerte in Normwerte, welche angeben, wie weit eine Person über oder unter dem Durchschnitt einer repräsentativen Referenzpopulation liegt
  2. Voraussetzungen:
    a) Standardnormalverteilung
    b) mind. Intervallskalenniveau der individuellen Werte
  3. Formel: (X - M) / Sx = z
    X = Messwert einer Person
    M= Mittelwert der Verteilung (alle Messwerte der Referenzgruppe)
    S(x) = Streuung von X
  4. Übliche Abweichungsnormen:
    –> es gibt kein einheitliches Normsystem
    a) IQ-Werte
    b) z-Werte
    c) T-Werte
    d) Stanin-Werte
    s. F. 40
28
Q

Normierung: 3. Prozentränge - Definition & Beispiel

A
  1. Definition: Transformation individueller Testwerte in Normwerte, welche angeben, welchen Rang eine Person im Vergleich zur Referenzgruppe einnimmt, ausgedrückt in % von Merkmalsträgern, die eine gleich große oder eine kleinere Merkmalsausprägung aufweisen
  2. Beispiel: Prozentrang 20
    –> 20% der vergleichbaren VP haben einen gleichen oder niedrigeren Testwert, 80% der VP haben einen höheren Testwert
    s. F. 41
29
Q

Äquivalenznorm - Nachteil

A

Sie lassen keine Vergleiche zwischen den Referenzgruppen zu (siehe Übung Seminar)

30
Q

Arten von Validität: Konstruktvalidität: Methoden zur Messung von Konstruktvalidität - Faktoranalystische Differenzierung - Faktoranalyse Definition

A

multivariates statistisches Verfahren, dass viele korrelierte beobachtete (=manifeste) Variablen zu wenigen künstlichen, nicht beobachtbaren (=latenten) Variablen reduziert

  1. Beispiel: Wie viele unterschiedliche Skalen stecken in dem Items? Welche Items gehöhren zu welcher Skala?
31
Q

Arten von Validität: Konstruktvalidität: Methoden zur Messung von Konstruktvalidität - Faktoranalystische Differenzierung - Interpretation der Ergebnisse

A

Bildet ein Test die Theoretische Grundlage ab?

  1. Wenn z.B. nur ein Konstrukt gemessen werden soll, müsste es nur einen gemeinsamen Faktor geben
  2. Bei zwei Subskalen = 2 Faktoren
  3. Gehören die Items zu den jeweiligen Skalen, wie vermutet?
    –> Anstreben einer einfachen Struktur
32
Q

Arten von Validität: Konstruktvalidität: Methoden zur Bestimmung der Konstruktvalidität: Empirische Differenzierung

A

zwischen Gruppen auf Basis empirischer Daten (Beispiel s. F. 24)
–> Kann der Test zwischen den Gruppen unterscheiden?

33
Q

Arten von Validität: Konstruktvalidität: Methoden zur Bestimmung der Konstruktvalidität: Multirait-Multimethod-Analyse

A

Prinzip - Korrelation zwischen ver. Maßen innerhalb eines Konstrukts –> Korrelation zwischen Konstrukten

34
Q

Arten von Validität: Konstruktvalidität: Methoden zur Bestimmung der Konstruktvalidität: Experimentelle Differenzierung

A

auf der Basis einer zugrundeliegenden psychologischen Theorie und eines (quasi-) experimentellen Designs (Beispiel s. F. 24)

35
Q

Arten von Validität: Konstruktvalidität: Methoden zur Bestimmung der Konstruktvalidität: Faktoranalytische Differenzierung

A

prinzip - Hohe Faktorenladungen mit dem zu messenden latenten Konstrukt

36
Q

Normwerte: T-Werte Interpretieren: Durchschnitt, SD & Unter-Überdurchschnittlicher Bereich

A
  1. Durschnitt: 50
  2. SD: 10
  3. Überdurchschnittlich: größer/gleich 60
  4. unterdurchschnittlich: kleiner gleich 40