Klausurfragen Flashcards
Nennen Sie zwei Grundannahmen der Klassischen Testtheorie zum Messfehler.
Der Mittelwert des Messfehlers ist über unendliche viele Messungen einer Person oder einer Population 0.
Es besteht kein Zusammenhang zwischen dem Messfehler und dem wahren Wert T einer Person oder einer Population.
Es besteht kein Zusammenhang zwischen dem Messfehler eines Tests A und dem wahren Wert eines Test B.
Es besteht kein Zusammenhang zwischen dem Messfehler eines Test A und dem Messfehler eines Tests B.
Ausgabe zu KMO und Bartlett-test. Welche Voraussetzung für welches Verfahren wird hier überprüft und wie bewerten Sie das Ergebnis?
K-M-O: über 0.7 sehr gut
Variablenauswahl für eine explorative Faktorenanalyse geeignet
Bartlett-Test: testet die 0-Hypothese, dass alle Korrelationen gleich 0 sind. (wollen wir nicht, wir wollen Korrelationen, sprich sie verwerfen)
Erklären Sie die Inangriffnahme Korrektur am Beispiel eines Leistungstests.
- Einsatz bei zeitbegrenzten Leistungstest, bei denen nicht alle Aufgaben von allen Probanden beantwortet werden können
- Anzahl der Probanden, die die Aufgabe richtig gelöst haben
- Probanden, die die Aufgabe bearbeitet haben
Warum kann die Reliabilität nur geschätzt werden?
Die Reliabilität eines Tests ist definiert als der Anteil der Varianz der wahren Werte an der Varianz der beobachteten Testwerte:
Grundannahme bei Reliabilitätsschätzungen: wiederholte Messungen unter vergleichbaren Bedingungen.
Gleichheit der Fehlervarianzen wiederholter Messungen anzunehmen?
wahre wert und Messfehler können nur geschätzt werden, und da die R über die beiden Wertten definiert ist, kann sie auch nur geschätzt werden
Welche Methoden gibt es, um die Reliabilität zu schätzen?
Testhalbierung,
interne Konsistenz,
Paralleltest,
Retestreliabilität
b) Könnte die Reliabilität dieses Modells verbessert werden? Wie würden Sie dabei vorgehen?
klare Itemformulierung
klare Auswertung
Items mit geringer TS ausschließen
Testverlängerung mit homogenen Items
Bewerten Sie die globale Passung
Warunung: Chi-Wert ist ungeeignet bei großem N
CMIN ist abhängig von der Stichprobengöße
Je mehr Personen untersucht werden, desto schlechter
erscheint das Modell unter ansonsten gleichen Umständen.
Lösung: Stichprobenreduktion?
Bewerten Sie die lokale Passung anhand von zwei Dimensionen.
SMC > 0.4
Signifikanz der Faktorladung (***)
FAR > 0.6
DEV > 0.5
Erklären Sie an jeweils einem Beispiel wie man mithilfe eines experimentalen und eines korrelativen Ansatzes die Konstruktvalidität ermitteln kann.
experimentell: testwert als UV und einmal als AV
UV Placebo oder Medikament und AV Testwert zur Zustandsangst
korrelative: multitrait multimethod erlaubt gemeinsame Betrachtung konvergenter und diskriminanter Validität.
vErläutern Sie anhand von Beispielen zwei Arten wie man die Kriteriumsvalidität prüfen kann.
Übereinstimmungsvalidität (= konkurrente Validität):
Zusammenhang von Testwert mit Kriterium, das zeitgleich existiert
→ Abinote & Intelligenz
Vorhersagevalidität (= prognostische Validität): Prognose einer zukünftigen Ausprägung eines Merkmals
–> Abinote sagt Beruflichen Erfolg vorher
Welche Grundannahme macht die KTT über den beobachteten Testwert X einer Person?
Der beobachtete Wert X einer Person setzt sich zusammen aus dem wahren Wert T dieser Person und einem Messfehler E.
Der Messfehler repräsentiert dabei alle unsystematischen Einflüsse auf den Testwert der Person.
Der wahre Wert T ist der Erwartungswert über unendlich viele Messungen.
Bei welchem Entscheidungsschritt der experimentellen Faktorenanalyse wird die Parallelanalyse nach Horn eingesetzt und wie unterscheidet sich diese vom Eigenwertkriterium (Kaiser-Guttmann-Regel)?
Extraktionsschritt: beschäftigt sich mit der Frage wie viele Faktoren extrahiert werden sollen. Ist der zweite Schritt der explorativen FA.
Bei der Parallelanalyse nach Horn, werden alle Faktoren extrahiert, deren EIgenwert über dem zufällig erzeugten EIgenwert liegen.
Faktoren werden extrahiert, deren Eigenwerte über den zufällig generierten Eigenwerten liegen
Beim Eigenwertkriterium werden alle Faktoren extrahiert die einen EIgenwert größer als 1 haben.
Warum ist die Beurteilung der Äquivalenz zentral für Reliabilitätsschätzung und welche Formen der Äquivalenz haben Sie in der Vorlesung kennengelernt?
Die Beurteilung der Äquivalenz und damit die Beurteilung der verschiedenen Qualität zweier Messung ist zentral für die Realibilitätsschätzung, da von ihr die Auswahl der geeigeneten Reliabilitätskoeffizienten abhängt.
In der Vorlesung haben wir tau-äquivalent, im wesentlichen äquivalent, parallel, im wesentlichen parallel, tau-kongenerisch.
schlechte Reliabilität
momentanen Stimmung schwankt
Zeitabstand beeinflusst Höhe des Korrelationskoeffeizienten, wird eher für Persönlichkeitstest eingesetzt die zeitlich stabile Merkmale erfassen.
globale Passung
100 < N < 300
RMSEA sollte < .08 liegen. Ein hoher Wert spricht dafür dass es viele Abweichungen gibt.
x2/df sollte < 1,5 sein
GFI und NFI sollte > .9