Einführung Flashcards

Definitionen, Gütekriterien, Begriffe

1
Q

Was ist ein Test?

A
  • ein wissenschaftliches Routineverfahren
  • Erfassung abgrenzbarer psy Merkmale
  • Ziel: quantitative Aussage über Merkmalsausprägung
    Routineverfahren=
  • so detailiert, dass es andere Testleitende einsetzen können
  • an großer Stichprobe erprobt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist mit Wissenschaftlichkeit gemeint?

A
  • es muss eine Theorie geben unter welchen Bedingungen welche Aussagen anhand Testergebnisse ableitbar sind
    = genaue Vorstellung über das Merkmal, Qualitätsansprüche
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind die primären Aufgabengebiete der Testtheorie?

A
  • Formulierung theoretischer Hintergrund
  • Festlegung und Quantifizierung von Qualitätsansprüchen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist ein psychologisches Merkmal?

A

Überbegriff:
- Traits oder Eigenschaften = zeitlich stabil
- States = zeitlich begrenzte biolog, emo & kog Zustände
- Erlebens- und Verhaltensweisen

latent/beobachtbar -> latente Merkmale durch messbare Sachverhalte “erschlossen”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was bedeutet Messen?

A

einem Objekt (empirisches Relativ) einen Zahlenwert (numerisches Relativ) so zuordnen, dass zumindest eine Eigenschaft des numerischen Relativs auch für das empirische Relativ gilt
-> Zahlenwerte vergleichbar
-> je nach theoretischer Fundierung unterschiedliches Skalenniveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist ein Fragebogen?

A
  • wird für unterschiedliches verwendet:
  • schriftliche Befragung zur Erhebung von demoskopischen, schulischen, medizinischen, etc. Daten
  • Instrument zur “Selbst- oder Fremdeinschätzung” zB Persönlichkeitstest
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Testarten kennen wir?

A
  1. Leistungstests
  2. Persönlichkeits- und Interessenstests
  3. objektive Persönlichkeitstests
  4. projektive Verfahren
  5. apparative Tests
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind Leistungstests?

A
  • erfassen Konstrukte die sich auf kognitive Leistungen beziehen
  • es soll die maximale Leistung unter den jeweiligen Testbedingungen erfasst werden
  • die Antworten haben falsche und richtige Antworten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Persönlichkeitsfragebögen?

A
  • verfolgen das Ziel für eine Person typisches Verhalten zu erfassen
  • verwenden mehrere Fragen pro Persönlichkeitsmerkmal
  • keine richtigen und falschen Antworten
  • im Allgemeinen leicht verfälschbar
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind Objektive Persönlichkeitstests?

A
  • versuchen das Ausmaß an Verfälschbarkeit zu reduzieren zB soziale Erwünschtheit
  • indem Persönlichkeitsmerkmal nicht durch subjektive Urteile sondern über Verhalten in standardisierten Situationen erfragt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind Projektive Tests?

A
  • versuchen Persönlichkeits as Ganzes zu erfassen
  • nimmt Rücksicht auf individuelle Erlebnis- und Bedürfnisstrukturen
  • nutzt mehrdeutiges Material zB BIlder um unbewusste oder verdrängte Bewusstseinsinhalte zu erfassen
  • oft explorativen Charakter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind Apparative Tests?

A
  • 2 Arten:
  • Tests für sensorische/motorische Merkmale zB Muskelkraft, Geschicklichkeit, sensomotorische Koordination
  • computerbasierte Tests, spezialisierte Varianten von Leistungs- und Persönlichkeitsfragebögen sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind die Testgütekriterien?

A

Hauptgütekriterien: Objektivität, Reliabilität, Validität
Nebengütekriterien: Skalierung, Normierung, Ökonomie, Nützlichkeit, Zumutbarkeit, Unverfälschbarkeit, Fairness

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wann ist ein Test objektiv?

A
  • wenn er das Merkmal unabhängig von der Testsituation und der testleitenden Person (Durchführungsobjektivität, Testleiter:innenunabhängigkeit), der auswertenden Person (Auswertungsobjektivität, Verrechnussicherheit) und der interpretierenden Person (Interpretationsobjektivität, Interpretationseindeutigkeit) misst.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist die Durchführungsobjektivität und wie kann sie gewährleistet werden?

A
  • Ergebnis unabhängig von Testleiter:in und Situation
  • mögl standardisierte Bedingungen
  • schriftliche, klare Instruktionen für Testleiter:in -> Konstanz der Fragen/Aufgaben
  • geringe soziale Interaktion zwischen Testleiter:in und getesteter Person
  • möglichst ähnliche Untersuchungssituation
    -> Angabe der vorgesehenen Zeitdauer

-> Testverhalten der Versuchsperson soll nur von der individuellen Merkmalsausprägung abhängen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist die Auswertungsobjektivität und wie kann sie gewährleistet werden?

A
  • verschiedene Auswerter:innen kommen beim Vorliegen der Antworten zum selben numerischen Ergebnis
  • Vermeidung freier Antwortformate
  • klare Auswertungsregeln
  • Verwendung von MC-Format
  • kann berechnet werden: zB Cohens Kappa, Fleiss Kappa, Konkordanzkoeffizienten nach Kendall
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist die Interpretationsobjektivität und wie kann sie gewährleistet werden?

A
  • beim Vorliegen der Testergebnisse kommen unterschiedliche Anwender:innen zum selben Schluss
  • klare Interpretationsregeln
  • Vorhandensein von Normen und Normwerten -> normorientierte Interpretation
  • Verwendung von Prozenträngen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was gibt der Prozentrang (PR) an?

A

wie viele Prozent der Referenzpopulation diesen oder einen schlechteren Testwert erzielen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wann ist ein Test reliabel?

A
  • wenn er das Merkmal zuverlässig daher exakt, ohne Messfehler, misst.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Welche Skalenniveaus gibt es und welche Rechenmethoden sind erlaubt?

A
  1. Nominal: x=y, x=/=y zB Gender
  2. Ordinal: x<y, x>y zB Zieleinlauf
  3. Intervall: x+y, x-y zB Celsius
  4. Verhältnis: Nullpunkt, x*y,x/y zB Kelvin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist eine Population?

A

Menge aller potenzieller Untersuchungsobjekte
µ = Mittelwert der Population
σ² = Varianz der Population
ρ(x,y) = Populationskorrelation (rho)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was ist eine normierte Testwertinterpretation?

A

z-Werte, t-Werte etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was ist eine kriteriumsorientierte Testwertinterpretation?

A

an kriterium gebunden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wie kann laut KTT die Reliabilität gemessen werden?

A

Reliabilität = Quotient aus wahrer Varianz & Gesamtvarianz der Testwerte
Messfehlervarianz = Unreliabilität des Messinstuments -> Maßband aus Gummi

25
Q

Was ist der Reliabilitätskoeffizient? Wie hoch sollte der Reliabilitätskoeffizient bei einem guten Test sein?

A

Rel = zwischen 0 und 1
1 = frei von Messfehler
0 = Wert nur Messfehler

guter Test: .7

-> mehrere klassische Verfahren: bauen auf KTT auf, strenge Annahmen

26
Q

Was ist die Retest Reliabilität?

A
  • schätzt Reliabilität als Korrelation zwischen Testwerten der 1. und 2. Messung
  • Problem dabei: zB Übungseffekte, tatsächliche Veränderungen der Testwerte werden anhand der LST-Theorie identifiziert bzw. berücksichtigt
27
Q

Was ist die paralleltest Reliabilität?

A
  • kontrolliert Übungseffekte, Erinnerungseffekte, Merkmalsveränderungen
  • zB Itemzwillinge -> 2 Testformen
  • anhand faktorenanalytischer Verfahren geprüft
28
Q

Was ist die Testhalbierungs- (Split-half) Reliabilität?

A

statt Testwiederholung 2 Testhälften
Halbtestkorrelation ist geringer als Gesamtreliabilität -> Korrekturformel (Spearman-Brown-Formel) nötig um Halbtestkorrelation auf Gesamtreliabilität der ursprünglichen Testlänge hochzurechnen

29
Q

Was ist Crohnbachs Alpha?

A
  • Verallgemeinerung der Testhalbierungsmethode:
  • jedes Item wird als eigenständiger Testteil angesehen, je stärker jedes Item miteinander korreliert desto mehr reliabel ist der Test
  • Voraussetzung: Annahme dass die Kovarianzen zwischen Items identisch sind -> prüfbar anhand CFA
  • Kritik: problematisch dass so strenge Annahmen nötig sind
  • von unkritischer Verwendung ist abzuraten
30
Q

Welche modellbasierten Methode der Reliabilitätsschätzung kennen wir?

A
  • Omega Koeffizient:
    mehrdimensionale Konstrukte möglich
    CFA bestimmt ob Voraussetzungen erfüllt
  • auf Basis der KTT
  • weniger strenge Annahmen
31
Q

Wann ist ein Test valide?

A

= gültigkeit
= wenn er das misst, was gemessen werden soll -> in der Praxis am wichtigsten

Konstruktvalidität, Kriteriumsvalidität, Augenscheinvalidität, Inhaltsvalidität

32
Q

Was ist die Konstruktvalidität?

A

Ist Zusammenhangsstruktur zwischen Testitems und interessierenden Persönlichkeitsmerkmalen (Konstrukt) wissenschaftlich fundiert?

Struktursuchende und strukturprüfende Verfahren

33
Q

Was sind struktursuchende faktorenanalytische Verfahren? Wozu werden sie angewendet?

A
  • helfen dabei geeignete Dimensionalität aufzustellen
  • exploratorische Faktorenanalyse (EFA): Hypothesen über Dimensionalität (ein- oder mehrdimensional) der Merkmalsstruktur
  • Faktorladungen geben Auskunft über Homogenität des Tests
  • einordnung in nomologisches Netzwerk: Zusammenhänge zu anderen Tests
  • Testergebnisse empirisch hinsichtlich Ähnlichkeit verglichen (konvergenter und diskriminanter Validität)
34
Q

Was ist konvergente Validität?

A

gibt an ob Test gewolltes Merkmal misst
Vgl. mit konstruktnahem Test -> Ergebnisse ähnlich?

35
Q

Was ist diskriminante Validität?

A

gibt an ob das Merkmal abgrenzbar ist
Vgl: mit konstrkutfernem Test -> Ergebnisse unähnlich?
-> Bestätigung dass es ein abgegrenztes Konzept ist
-> Multitrait-Multimethod-Analysen (MTMM-Analyse)

36
Q

Was ist die konfirmatorische Faktorenanalyse (CFA)?

A

Kreuzvalidierung, inferenzstatistische Absicherung der anhand EFA gefundenen dimensionalen Strukturen der Testitems anhand von neuen Daten

37
Q

Was überprüft die Multitrait-Multimethod-Analyse?

A

überprüft Zusammenhang unterschiedlicher Merkmalen (Traits) unter Herauspartialisierung der Methodeneinflüsse strukturprüfend

38
Q

Was ist Kriteriumsvalidität?

A

wie gut kann Testkennwert erfolgreich ein Kriterium (Verhaltensweise) außerhalb der Testsituation extrapolieren (vorhersagen)?

39
Q

Was ist Kriteriumsvalidität?

A

wie gut kann Testkennwert erfolgreich ein Kriterium (Verhaltensweise) außerhalb der Testsituation extrapolieren (vorhersagen)?
-> valide hinsichtlich des Kriteriums
* an keine besonderen testtheoretischen Annahmen gebunden
*abhängig von zeitlicher Verfügbarkeit:
- Übereinstimmungsvalidität (=konkurrente Validität) = zeitgleich
- Verhersagevalidität (=prognostische Validität) = prognose

40
Q

Was ist die Augenscheinvalidität?

A
  • inwieweit Gültigkeitsanspruch eines Tests vom bloßen Augenschein her einem Laien gerechtfertigt ist
  • wichtig für Akzeptanz
    zB Intelligenztests
41
Q

Was ist die Inhaltsvalidität?

A
  • Testitems bilden das interessierende Merkmal repräsentativ ab
  • in der Regel nicht numerisch sondern durch logische und fachliche Überlegung
  • erfüllt wenn Merkmal vollständig erfasst werden konnte
  • Bewertung von Expert:innen
  • einfachste Methode: simulationsorientierte Zugangsweise: Items geben unmittelbar Auskunft über Verhaltensbereich zB Rechtschreibkenntnisse anhand Diktat prüfen, Fahrkenntnisse anhand Autofahren prüfen
42
Q

Was ist der argumentationsbasierte Validierungsansatz?

A
  • Weiterentwicklung des Validitätsverständnis
  • früher: Eigenschaft eines Tests; heute: Interpretation
  • Validität integriert Infos aus verschiedenen Quellen, fortwährend argumenativer Prozess
  • jede intendierte Testwertinterpretation benötigt eine seperate Validierung
  • Interpretationen festlegen, formulieren, empirische Grundannahmen identifizieren -> stützen/widerlegen. Evidenzquellen: Testinhalte, bei der beantwortung ablaufende Prozesse, interne Struktur der Testdaten, Beziehung von Testvariablen zu anderen Konstrukten
    -> abschließende zusammenfassende Bewertung: valide, wenn keine der zugrunde liegenden Annahmen widerlegt werden konnte
43
Q

Was ist das Gütekriterium Skalierung?

A
  • wenn die laut Verrechnungsregel resultierenden Testwerte (numerisches Relativ)die tatsächlichen Merkmalsrelationen (empirisches Relativ) adäquat abbilden
  • im Rahmen der IRT ist man nicht darauf angewiesen das Skalenniveau mit externen Kriterien zu bestimmen -> Gütekriterium der Skalierung kann anhand von IRT Modellen statistisch überprüft werden
44
Q

Was ist Normierung (Eichung)?

A
  • welche Population?
  • verschiedene Testanwender verschiedene Testwerte von verschiedenen Testpersonen bezüglich des gleichen Merkmals in gleicher Weise interpretieren
    -> Bezugssysteme -> repräsentativ
  • Normwerte zB IQ, z-Wert, t-Wert
    -> Bezug auf Abstand des Testwerts Yx vom Mittelwert der Testergebnisse
    -> normalverteilt, Interpretation über Flächenanteile der Standardnormalverteilung
    -> wenn nicht normalverteilt Prozentränge, Flächentransformation
    1. Eichtabellen gültig (alle 8 Jahre prüfen, Neonormierung zB Lerneffekte)
    2. Population definiert
    3. Stichprobe für Eichtabelle repräsentativ
45
Q

Was ist die kriteriumsorientierte Testwertinterpretation?

A

Zuordnung von Testleistungen zu inhaltlich begründbaren Merkmalausprägungen -> Score erreicht -> Major Depression -> erhöht interpretationsobjektivität

46
Q

Was ist Ökonomie?

A

Wie viel Zeit/Ressourcen habe ich?
2 Faktoren:
1. finanzieller Aufwand
2. zeitlicher Aufwand: Testzeit, Auswertung

Erkenntnisgewinn > Kosten
Computer erhöhen Ökonomie zB adaptives Testing

47
Q

Was ist das Gütekriterium Nützlichkeit?

A

welchen Nutzen hat der Test im Sinne der Kriterumsvalidität?
Anwendungsmöglichkeiten?

48
Q

Was ist das Gütekriterium Zumutbarkeit?

A

wie belastend ist der Test?
Zeit, psy, physischer Aufwand
betrifft ausschließlich Testperson
gesellschaftliche Normen, Akzeptanz

49
Q

Warum sind Prozentränge cool?

A
  • setzen keine Intervllskalierung der Testwerte voraus
  • setzen keine Normalverteilung der Testwerte voraus
  • sind eine einfache inhaltliche Interpretation der Testergebnisse
50
Q

Was sind z-Werte?

A
  • Standardmesswert
  • intervallskaliert + normalverteilte Testwerte
  • definiert durch:
    z=(x-x̄)/ô(X)~NV (0,1)
    mit x̄~µ(x) und ô(X)~σ(X)
  • legen relative Position des Testkennwerts der getesteten Person bezogen auf die Referenzpopulation dar
  • positiv bei überdurchschnittlichen Ergebnissen
  • negativ bei unterdurchschnittlichen Ergebnissen
  • jeder z-Wert ≙ ein Prozentrang -> z-Tabelle
    -> Flächentransformation: intervallkalierte aber nicht normalverteilte Testkennwerte können mit Hilfe von z-Werten in normalverteilte Kennwerte transformiert werden
51
Q

Welche Schritte gibt es in der Testkonstruktion?

A
  1. Planung
  2. Itemkonstruktion
  3. Erstellung der vorläufigen Testversion
  4. Erprobung an Stichprobe
  5. Itemanalyse und Überarbeitung
  6. Normierung
52
Q

Welche Fragen fragen wir bei der Planung der Testkonstruktion?

A

-wer? Zielgruppe: KInder/Erwachsene
-wie? Struktur: Fragen?
-was? welches Merkmal?
-wo? welchen Geltungsbereich?
-wie lange?

53
Q

Welche Strategien sind bei der Itemkonstruktion zu beachten?

A

unterschiedliche Strategien:
- intuitive Konstruktion
- rationale Konstruktion
- externale (kriteriumsorientierte) Konstruktion
- internale (faktorenanalytisch) Konstruktion

54
Q

Wie läuft die intuitive Itemkonstruktion ab und was sollte dabei beachtet werden?

A
  • Items intuitiv von Testkonstrukteur:in ausgewählt
  • nur wenn theoretischer Erkenntnisstand gering ist
55
Q

Wie läuft die rationale Itemkonstruktion ab und was sollte dabei beachtet werden?

A
  • Merkmal wird differenziert und spezifiziert
  • Verhaltensindikatoren festgelegt
  • elaborierte Theorie über Differenziertheit von Personen hinsichtlich des interessierenden Merkmals besteht bereits
56
Q

Wie läuft die externale (kriteriumsorientierte) Itemkonstruktion ab und was sollte dabei beachtet werden?

A
  • großer Itempool Personen vorgegeben die sich im externen Merkmal (Kriterium) stark unterscheiden
  • Items ausgewählt die gut zwischen Gruppen mit unterschiedlichen Ausprägungen im Kriterium diskriminieren
  • Diskriminierungsfähigkeit der Items wird anhand anderer Stichprobe überprüft
57
Q

Wie läuft die internale (faktorenanalytische) Itemkonstruktion ab?

A
  • Items werden konstruiert die eine hypothetische Verhaltensdimension erfassen sollen
  • Stichprobe vorgegeben
  • Faktorenanalyse -> Ergebnisse zu Skalen zusammengefasst
58
Q

Was muss bei der Berechnung des Testwerts beachtet werden?

A

X=Σxi
- gut wenn vorher anhand Modelltests festgestellt wurde, dass die strengen Messtheoretischen Voraussetzungen zur Eindimensionalität und der Unkorreliertheit der Messfehler erfüllt ist