Einführung Flashcards

Question

Was ist der Reliabilitätskoeffizient? Wie hoch sollte der Reliabilitätskoeffizient bei einem guten Test sein?

Answer 1

Rel = zwischen 0 und 1 1 = frei von Messfehler 0 = Wert nur Messfehler guter Test: .7 -> mehrere klassische Verfahren: bauen auf KTT auf, strenge Annahmen

Answer 2

- schätzt Reliabilität als Korrelation zwischen Testwerten der 1. und 2. Messung - Problem dabei: zB Übungseffekte, tatsächliche Veränderungen der Testwerte werden anhand der LST-Theorie identifiziert bzw. berücksichtigt

Answer 3

- kontrolliert Übungseffekte, Erinnerungseffekte, Merkmalsveränderungen - zB Itemzwillinge -> 2 Testformen - anhand faktorenanalytischer Verfahren geprüft

Answer 4

statt Testwiederholung 2 Testhälften Halbtestkorrelation ist geringer als Gesamtreliabilität -> Korrekturformel (Spearman-Brown-Formel) nötig um Halbtestkorrelation auf Gesamtreliabilität der ursprünglichen Testlänge hochzurechnen

Answer 5

- Verallgemeinerung der Testhalbierungsmethode: * jedes Item wird als eigenständiger Testteil angesehen, je stärker jedes Item miteinander korreliert desto mehr reliabel ist der Test * Voraussetzung: Annahme dass die Kovarianzen zwischen Items identisch sind -> prüfbar anhand CFA * Kritik: problematisch dass so strenge Annahmen nötig sind * von unkritischer Verwendung ist abzuraten

Answer 6

- Omega Koeffizient: mehrdimensionale Konstrukte möglich CFA bestimmt ob Voraussetzungen erfüllt - auf Basis der KTT - weniger strenge Annahmen

Answer 7

= gültigkeit = wenn er das misst, was gemessen werden soll -> in der Praxis am wichtigsten Konstruktvalidität, Kriteriumsvalidität, Augenscheinvalidität, Inhaltsvalidität

Answer 8

Ist Zusammenhangsstruktur zwischen Testitems und interessierenden Persönlichkeitsmerkmalen (Konstrukt) wissenschaftlich fundiert? Struktursuchende und strukturprüfende Verfahren

Answer 9

- helfen dabei geeignete Dimensionalität aufzustellen - exploratorische Faktorenanalyse (EFA): Hypothesen über Dimensionalität (ein- oder mehrdimensional) der Merkmalsstruktur - Faktorladungen geben Auskunft über Homogenität des Tests - einordnung in nomologisches Netzwerk: Zusammenhänge zu anderen Tests - Testergebnisse empirisch hinsichtlich Ähnlichkeit verglichen (konvergenter und diskriminanter Validität)

Answer 10

gibt an ob Test gewolltes Merkmal misst Vgl. mit konstruktnahem Test -> Ergebnisse ähnlich?

Answer 11

gibt an ob das Merkmal abgrenzbar ist Vgl: mit konstrkutfernem Test -> Ergebnisse unähnlich? -> Bestätigung dass es ein abgegrenztes Konzept ist -> Multitrait-Multimethod-Analysen (MTMM-Analyse)

Answer 12

Kreuzvalidierung, inferenzstatistische Absicherung der anhand EFA gefundenen dimensionalen Strukturen der Testitems anhand von neuen Daten

Answer 13

überprüft Zusammenhang unterschiedlicher Merkmalen (Traits) unter Herauspartialisierung der Methodeneinflüsse strukturprüfend

Answer 14

wie gut kann Testkennwert erfolgreich ein Kriterium (Verhaltensweise) außerhalb der Testsituation extrapolieren (vorhersagen)?

Answer 15

wie gut kann Testkennwert erfolgreich ein Kriterium (Verhaltensweise) außerhalb der Testsituation extrapolieren (vorhersagen)? -> valide hinsichtlich des Kriteriums * an keine besonderen testtheoretischen Annahmen gebunden *abhängig von zeitlicher Verfügbarkeit: - Übereinstimmungsvalidität (=konkurrente Validität) = zeitgleich - Verhersagevalidität (=prognostische Validität) = prognose

Answer 16

- inwieweit Gültigkeitsanspruch eines Tests vom bloßen Augenschein her einem Laien gerechtfertigt ist - wichtig für Akzeptanz zB Intelligenztests

Answer 17

- Testitems bilden das interessierende Merkmal repräsentativ ab - in der Regel nicht numerisch sondern durch logische und fachliche Überlegung - erfüllt wenn Merkmal vollständig erfasst werden konnte - Bewertung von Expert:innen - einfachste Methode: simulationsorientierte Zugangsweise: Items geben unmittelbar Auskunft über Verhaltensbereich zB Rechtschreibkenntnisse anhand Diktat prüfen, Fahrkenntnisse anhand Autofahren prüfen

Answer 18

- Weiterentwicklung des Validitätsverständnis - früher: Eigenschaft eines Tests; heute: Interpretation - Validität integriert Infos aus verschiedenen Quellen, fortwährend argumenativer Prozess - jede intendierte Testwertinterpretation benötigt eine seperate Validierung - Interpretationen festlegen, formulieren, empirische Grundannahmen identifizieren -> stützen/widerlegen. Evidenzquellen: Testinhalte, bei der beantwortung ablaufende Prozesse, interne Struktur der Testdaten, Beziehung von Testvariablen zu anderen Konstrukten -> abschließende zusammenfassende Bewertung: valide, wenn keine der zugrunde liegenden Annahmen widerlegt werden konnte

Answer 19

- wenn die laut Verrechnungsregel resultierenden Testwerte (numerisches Relativ)die tatsächlichen Merkmalsrelationen (empirisches Relativ) adäquat abbilden - im Rahmen der IRT ist man nicht darauf angewiesen das Skalenniveau mit externen Kriterien zu bestimmen -> Gütekriterium der Skalierung kann anhand von IRT Modellen statistisch überprüft werden

Answer 20

* welche Population? - verschiedene Testanwender verschiedene Testwerte von verschiedenen Testpersonen bezüglich des gleichen Merkmals in gleicher Weise interpretieren -> Bezugssysteme -> repräsentativ - Normwerte zB IQ, z-Wert, t-Wert -> Bezug auf Abstand des Testwerts Yx vom Mittelwert der Testergebnisse -> normalverteilt, Interpretation über Flächenanteile der Standardnormalverteilung -> wenn nicht normalverteilt Prozentränge, Flächentransformation 1. Eichtabellen gültig (alle 8 Jahre prüfen, Neonormierung zB Lerneffekte) 2. Population definiert 3. Stichprobe für Eichtabelle repräsentativ

Answer 21

Zuordnung von Testleistungen zu inhaltlich begründbaren Merkmalausprägungen -> Score erreicht -> Major Depression -> erhöht interpretationsobjektivität

Answer 22

Wie viel Zeit/Ressourcen habe ich? 2 Faktoren: 1. finanzieller Aufwand 2. zeitlicher Aufwand: Testzeit, Auswertung Erkenntnisgewinn > Kosten Computer erhöhen Ökonomie zB adaptives Testing

Answer 23

welchen Nutzen hat der Test im Sinne der Kriterumsvalidität? Anwendungsmöglichkeiten?

Answer 24

wie belastend ist der Test? Zeit, psy, physischer Aufwand betrifft ausschließlich Testperson gesellschaftliche Normen, Akzeptanz

Answer 25

- setzen keine Intervllskalierung der Testwerte voraus - setzen keine Normalverteilung der Testwerte voraus - sind eine einfache inhaltliche Interpretation der Testergebnisse

Answer 26

- Standardmesswert - intervallskaliert + normalverteilte Testwerte - definiert durch: z=(x-x̄)/ô(X)~NV (0,1) mit x̄~µ(x) und ô(X)~σ(X) - legen relative Position des Testkennwerts der getesteten Person bezogen auf die Referenzpopulation dar - positiv bei überdurchschnittlichen Ergebnissen - negativ bei unterdurchschnittlichen Ergebnissen - jeder z-Wert ≙ ein Prozentrang -> z-Tabelle -> Flächentransformation: intervallkalierte aber nicht normalverteilte Testkennwerte können mit Hilfe von z-Werten in normalverteilte Kennwerte transformiert werden

Answer 27

1. Planung 2. Itemkonstruktion 3. Erstellung der vorläufigen Testversion 4. Erprobung an Stichprobe 5. Itemanalyse und Überarbeitung 6. Normierung

Answer 28

-wer? Zielgruppe: KInder/Erwachsene -wie? Struktur: Fragen? -was? welches Merkmal? -wo? welchen Geltungsbereich? -wie lange?

Answer 29

unterschiedliche Strategien: - intuitive Konstruktion - rationale Konstruktion - externale (kriteriumsorientierte) Konstruktion - internale (faktorenanalytisch) Konstruktion

Answer 30

- Items intuitiv von Testkonstrukteur:in ausgewählt - nur wenn theoretischer Erkenntnisstand gering ist

Answer 31

- Merkmal wird differenziert und spezifiziert - Verhaltensindikatoren festgelegt * elaborierte Theorie über Differenziertheit von Personen hinsichtlich des interessierenden Merkmals besteht bereits

Answer 32

- großer Itempool Personen vorgegeben die sich im externen Merkmal (Kriterium) stark unterscheiden - Items ausgewählt die gut zwischen Gruppen mit unterschiedlichen Ausprägungen im Kriterium diskriminieren - Diskriminierungsfähigkeit der Items wird anhand anderer Stichprobe überprüft

Answer 33

- Items werden konstruiert die eine hypothetische Verhaltensdimension erfassen sollen - Stichprobe vorgegeben - Faktorenanalyse -> Ergebnisse zu Skalen zusammengefasst

Answer 34

X=Σxi - gut wenn vorher anhand Modelltests festgestellt wurde, dass die strengen Messtheoretischen Voraussetzungen zur Eindimensionalität und der Unkorreliertheit der Messfehler erfüllt ist

Einführung Flashcards

Definitionen, Gütekriterien, Begriffe