04321 Flashcards
Definition psychologischer Test (2 Elemente)
- wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale
- Ziel ist eine möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung
Definition psychologischer Test - Definition Wissenschaftlichkeit (3 Elemente)
- Merkmale eindeutig definiert und nachweisbar relevant
- Konstruktion baut auf statistische Modelle psychologischer Testtheorie auf
- bewaehrt gegenueber psychometrischen Guetekriterien
Was ist ein typisches Kennzeichen das ein Test wissenschaftlich fundiert ist?
Vorhandensein eines Testmanuals (aka Handanweisungen)
Definition psychologischer Test - Definition Routineverfahren
Inhalt, Verfahrensablauf und Bewertung des Tests sind genau vorgegeben und so routinemaessig wiederholbar
Definition psychologischer Test - Definition Persoenlichkeitsmerkmal
weit gefasst - schließt im Grunde alle Arten interindividueller Differenzen ein
Was sind zwei Kriterien die man beim Einsatz eines psychologischen/psychometrischen Tests bedenken muss?
- Ist der Test gut (wissenschaftlich etc.)
2. Passt der Test zur Fragestellung!
Nach welchen 3 Dimensionen werden Tests oft klassifiziert?
- Inhalt
- Testungsstrategien
- formale Gesichtspunkte
Klassifizierung von Tests - Dimension Inhalt - 3 Unterkategorien
- Leistungstests
- Psychometrische Persönlichkeitstests
- Persönlichkeits-Entfaltungsverfahren
Klassifizierung von Tests - Dimension Inhalt - Leistungstests -5 Beispiele
Entwicklungstests, Intelligenztests, Allgemeine Leistungstests, Schultests, spezielle Funktionsprüfungs- und Eignungstests
Klassifizierung von Tests - Dimension Inhalt - Leistungstests -Beschreibung - 2 Dimensionen
- geben Aufschluss über Fähigkeiten und Fertigkeiten eines Individuums
- bestehen in der Regel aus einer Vielzahl von Problemlöseaufgaben, deren Beantwortung als richtig oder als falsch eingestuft wird
Klassifizierung von Testst - Dimension Inhalt - Psychometrische Persönlichkeitstests -3 Beispiele
- Persönlichkeits-Struktur-Tests
- Einstellungs- und Interessentests
- Klinische Tests
Klassifizierung von Testst - Dimension Inhalt - Psychometrische Persönlichkeitstests -Beschreibung - 3 Dimensionen
- Fragen, die sich auf Gefühle, Vorlieben, Abneigungen, Interessen und Meinungen der Probanden beziehen
- Antworten sind subjektive Selbstbeurteilung oder Selbstbeschreibung
- Es gibt kein richtig oder falsch
Klassifizierung von Tests - Dimension Inhalt - Psychometrische Persönlichkeitstests -Definition Inventar
Fragebogen, der mehrere Merkmale erfasst und so aus verschiedenen Subtests besteht
Klassifizierung von Tests - Dimension Inhalt - Persönlichkeits-Entfaltungsverfahren- 3 Beispiele
- Formdeuteverfahren
- Verbal-thematische Verfahren
- Zeichnerische und Gestaltungsverfahren
Klassifizierung von Testst - Dimension Inhalt - Persönlichkeits-Entfaltungsverfahren- Beschreibung der Durchfuehrung (2 Dimensionen)
- Projektive Verfahren, die weitgehend aus unstrukturierten Materialien bestehen (e.g., Farbkleckse, Satzanfänge, Spielmaterial, mehrdeutige Bilder)
- Proband muss vollenden oder deuten
Klassifizierung von Tests - Dimension Inhalt - Persönlichkeits-Entfaltungsverfahren- underlying assumption
Annahme, dass Testpersonen bei der Strukturierung unbewusste Motive, Gefühle oder Einstellungen in die Geschichte oder das Bild projizieren
Klassifizierung von Testst - Dimension Inhalt - Persönlichkeits-Entfaltungsverfahren- projektive vs semi-projektive Tests - Unterschied re: Testtheorie
Projektive Tests - oft nicht testtheoretisch konstruiert, zu wenig Struktur
semi-projektive Tests - mit Standardisierung verbunden, eher als Tests identifizierbar
Klassifizierung von Tests - Dimension Testungsstrategie - 2 Unterkategorien
- normorientierte Konstrukttests
2. kriterienorientierte Tests
Klassifizierung von Tests - Dimension Testungsstrategie - - normorientierte Konstrukttests - Definition Element 1: Konstrukt(test)
erlauben wissenschaftlich begründbaren Rückschluss vom Testverhalten auf dahinter liegende Eigenschaften und Fähigkeiten (Konstrukte).
Klassifizierung von Testst - Dimension Testungsstrategie - normorientierten Konstrukttests - Definition Element 2: normorientiert
Testergebnis einer Person wird relativ zur durchschnittlichen Ausprägung (= Norm) einer Bezugsgruppe gesehen
Klassifizierung von Tests - Dimension Testungsstrategie - kriterienorientierte Tests - Grundidee
Vergleich der Testleistung mit einer Idealnorm
Klassifizierung von Testst - Dimension Testungsstrategie - kriterienorientierte Tests - klassisches Beispiel
hat Schueler/Student das Lehrziel erreicht?
Klassifizierung von Tests - Dimension formale Gesichtspunkte- 5 Unterkategorien
- Zeitbeschraenkung?
- Zahl der Dimensionen
- Durchfuehrung (Gruppen-/Individualtest)
- Sprachgebundenheit (verbal/nonverbal)
- Technologie/Medium (Papier, Computer etc., incl adaptiv)
Klassifizierung von Tests - Dimension formale Gesichtspunkte - Gesichtspunkt Zeitbeschraenkung -2 moegliche Auspraegungen
- mit Zeitbeschraenkung: Schnelligkeitstests (Speedtests)
2. ohne Zeitbeschraenkung: Niveautests (Powertests)
Was steht im Zentrum der psychologischen Testtheorie (2 ideas)?
- Zusammenhang psychologischer Merkmale mit dem Testverhalten (in psychologischen Tests)
- Schlüsse, die aufgrund der Antworten im Test auf die zugrunde liegenden Merkmale gezogen werden duerfen
worum geht es bei der psychologischen Testtheorie NICHT (2 Ideeen)?
- Theorie der psychologischen Merkmale (Konstrukte)
2. Klassifikation psychologischer Merkmale
Was ist das kleinste Element eines psychologischen Tests?
ein einzelnes item (aka Aufgabe)
Was ist die Grundannahme, die ein Item (und die dazugehoerige Antwort) relevant machen?
item ist beobachtbarer Indikator (manifeste Variable) fuer ein zugrundeliegendes nicht beobachtbares Konstrukt (latente Variable)
Def. Skala (Kontext - psychologischer Test)
nach einer festgelegten Vorschrift, meist durch
einfache Aufsummierung oder Durchschnittsbildung, berechnete Gesamtwert mehrerer Items
Was sind die beiden Bereiche eines Tests?
latenter Bereich, manifester Bereich
Testtheorie - Merksatz
In der Testtheorie geht es um die Beurteilung sowohl des Gesamtwerts im Test als auch von dessen Bestandteilen hinsichtlich des Zusammenhangs zwischen
Testverhalten und psychologischen Merkmalen.
Was sind zwei mathematisch-statistische Ansaetze zur Testtheorie?
- Klassische Testtheorie (KTT)
2. ProbabilistischeTesttheorie (PTT)
Welcher der zwei mathematisch-statistischen Ansaetze der Testtheorie dominiert in der Praxis?
KTT; nach Rost (1999) basieren 95 Prozent aller Tests auf der KTT
Was ist der Hauptvorteil der KTT (ggueber PTT)?
Einfachere mathematische Anwendbarkeit
Wie gut haben sich die auf der KTT beruhenden Tests bewaehrt?
allgemein gut!
Worum geht es im Prinzip in der KTT?
KTT: Theorie der Messfehler (aka Reliabilitaet!)
KTT: Was sind 2 moegliche Gruende, dass Testergebnisse einer Person zu verschiedenen Messzeitpunkten variieren koennen? Bsp - Klausur
- Uebungs- und Transfereffekte (Lernen!) - systematisch!
2. unsystematische Einfluesse - auessere (Laerm), innere (Krankheit)
KTT: systematische vs. unsystematische Fehler, welche Fehler sind im KTT Fehlerbegriff inbegriffen?
nur UNsystematische Fehler (KTT unterstellt Zufallsziehung und Zufallsfehler)
KTT: Was ist der Ausgangspunkt der Überlegungen?
Varianz von Messwerten
KTT: Was sind die 3 Quellen der Varianz von Messwerten?
- Interitemvarianz: Testung einer einzelnen Person bei einer einzigen Gelegenheit zwischen den Items eines Tests
- intraindividuell, wenn dieselbe Person mehrfach mit dem gleichen Verfahren getestet wird
- interindividuell zwischen verschiedenen Teilnehmern einer einzelnen Testung
KTT: Definition wahrer Wert Ti (von Englisch: true score)
Mittelwert der (hypothetischen) Normalverteilung die sich ergaebe, wenn Person i den gleichen Test unter gleichen Bedingungen beliebig oft ablegte; aka Existenzaxiom
KTT: Definition zentrales Grundaxiom der KTT
Xi = Ti + Ei (Grundannahme der KTT), mit Ei - Fehlerkomponente
KTT: 4 zentrale Annahmen re: Fehlerterm Ei
- Mittelwert Null
- Wahrer Wert und Fehler unkorreliert
- Fehler verschiedener Tests unkorreliert
- Kreuzweise Unkorreliertheit von Fehlern und wahren Werten verschiedener Tests
KTT: Definition Reliabilitaet rtt
Anteil der wahren Varianz (S-squared true) an der gedamten beobachteten Varianz (S-squared X)
KTT: Wie laesst sich die beobachtete Varianz (S-squared X) auch ausdruecken? warum?
(S-squared true) plus (S-squared E); warum - Unkorreliertheit von Xi und Ei
KTT: wie wird die Grundgleichung um systematicshe Verzerrungen erweitert?
Xi = Ci + Bi + Ei; Bi bedeutet bias (systematische Verzerrung)
KTT: Worum geht es in der Validitaet (in Abgrenzung zur Reliabilitaet)?
um die Gültigkeit inhaltlicher Aussagen auf der Grundlage von Testergebnissen.
KTT: Validitaet, formale Definition
Rtc=(s-quared construct)/sum{(S-squared construct +S-squared bias +(S-squared error)}
note - equation assumes that bias, construct uncorrelated
KTT: 6 kritische Anmerkungen
- nicht intendierte systematixche Varianzanteile (bias) werden dem wahren Wert zugeordnet
- Keine Verbindung zwischen Markmal und Itembeantwortung her
- Ist wahrer Wert wirklich konstant und unabhaengig?
- Messungen in Extrembereichen ungenau
- Annahme der Eindimensionalitaet - haltbar?
- Stichprobehabhaengigkeit der Testwerte
PTT: Grundidee (in Abgrenzung zur KTT)
Zusammenhang zwischen der Fähigkeit (oder Eigenschaft) einer Person und der Wahrscheinlichkeit, mit der diese Person eine Aufgabe löst (oder z.B. einer Aussage zustimmt), die besagte Fähigkeit bzw. Eigenschaft messen soll.
PTT: Was ist der (wissenschaftsgeschichtliche) Ursprung?
Intelligenztests
PTT: Was ist das bekannteste Modell?
Rasch Modell (1960)
PTT: Rash Model - von welchen zwei Faktoren haengt die Loesungswahrsheinlichtkeit ab?
(1) von der Fähigkeit oder Eigenschaftsausprägung einer Person (person parameter)
(2) der Schwierigkeit eines Items (item parameter)
PTT: Ist beziehung zwischen Personenfähigkeit und Itemlösungswahrscheinlichkeit deterministisch oder probabilistisch?
Probabilistisch! I.E., jeder Teilnehmer hat eine positive Wahrscheinlichkeit fuer jede Antwort
PTT: Was ist ein wichtiger theoretischer Vorteil der PTT ggueber der PTT?
PTT erlaubt Durchfuehrung eines Modelltests der die Erfuellung der voraussetzungen prueft (i.e., Zulaessigkeit der Summation der Itemwerte, Eindimensionalitaet)
PTT: Was bedeutet dass der Itemsummenwert eine erschoepfende Statistik der Personenfaehigkeit ist?
der Summenwert einer Person liefert alle Informationen über die Fähigkeitsausprägung der Person; aka präzise Definition von Itemhomogenität
PTT: Definition der Itemhomogenitaet - wie ist das formalisiert?
lokale stochastische Unabhängigkeit, die im Prinzip besagt, dass man die Lösungswahrscheinlichkeiten der Items für alle Personen multiplizieren darf
Welche 2 Fragen stehen am Anfang der Testkonstruktion?
- Merkmalsbereich: Was soll der Test messen?
2. Geltungsbereich: Wo, bei wem und wofür soll der Test eingesetzt werden?
Abgrenzung des Mermalsbereichs - 5 wichtige Verfahren/tools?
- Theoretische Ableitung
- Literaturrecherche
- explorative Verfahren der Datenerhebung
- Befragung von Experten (qualititative Interviews)
- Strukturierte Varianten der Merkmalsabgrenzung
Abgrenzung des Merkmalsbereichs -Strukturierte Varianten der Merkmalsabgrenzung - 3 Techniken
- Facettentheorie (Guttman, 1959)
- act frequency approach (AFA; Buss & Craik, 1983)
- Methode der kritischen Ereignisse bzw. critical incident technique (CIT, Flanagan, 1954)
Abgrenzung des Merkmalsbereichs -Strukturierte Varianten der Merkmalsabgrenzung -Facettentheorie - n Ueberlegungen
- Methode zur Systematisierung wissenschaftlicher Fragestellungen
- stellt Werkzeuge zur Verfügung, um einen Merkmalsbereich
a) vollständig einzugrenzen
b) in Teilmerkmale und Ausprägungen zu zergliedern
c) Beziehungen zwischen Facetten darzustellen zu skalieren
Arbeitsdefinition - typische Rolle in der Itementwicklung (AFA, CIT and beyond)?
AFA, CIT - Keine Arbeitsdefinition; Definition und Itemformulierung in einem Schritt;
otherwise: Arbeitsdefinition ist der Anfang
Geltungsbereich - worum geht es hier?
Zweck, Zielgruppe und Kontext des Testeinsatzes
Geltungsbereich 2 thoughts
- oft durch Spezifikationen des Auftraggebers eingeschränkt.
- Researcher must always think (ethics, illegal questions, inherent conflicts…)
Geltungsbereich - example for inherent conflict
Verwendung einer betrieblichen Leistungsbeurteilung für Festlegung von Gehaltsbestandteilen UND als Infor-mationsgrundlage der Personalentwicklung
5 grundlegende Vorgehensweisen zur Testkonstruktion
- Rational (deduktiv, theoriegeleitet)
- External (empirisch, kriteriumsorientiert)
- Internal (induktiv, faktorenanalytisch)
- typologisierend
- Prototypen
rationale Konstruktion: Ausgangspunkt (2 thoughts)
- geeignete theoretische Definition des Zielkonstrukts
2. deduktive Ableitung spezifischer Indikatoren
bekanntes Beispiel fuer rational entwickelten Test mit mehreren hierarchischen Ebenen
Berliner Intelligenz-struktur-Test (BIS-Test, Jäger, Süß & Beauducel, 1997)
rationale Konstruktion: Rolle der Empirie/Daten in der Itementwicklung?
Nicht Formulierung von Items, aber Testung, Validierung und Eliminierung von Items
Externale Strategie: Grundidee
Item-Auswahl zur Maximierung des empirischen Zusammenhangs mit einem Kriterium (what makes a good sales rep…); kriterienorientier
Externale Strategie: Rolle der Theorie?
Allgemein gering; Extremfall - theoriefrei (dust bowl empiricism); how about our predictive models?
Externale Strategie - welche Methode ist prinzipiell verwandt?
multiple Regression…!
Externale Strategie - 3 typische Probleme
- schwer interpretierbare Skalen (theoriefrei…)
- grosse Stichproben noetig
- unabhaengige Validierung (cross validation needed)
Externale Strategie - principieller Vorteil
praktischer Nutzen durch kriteriumsbezogene Validitaet
Externale Strategie - 2 bekannte Beispiel
Minnesota Multiphasic Personality Inventory, California Psychological Inventory
Externale Strategien - Beispiel Minnesota Multiphasic Personality Inventory - worum geht es?
klinischer Test, Unterscheidung zwischen psychisch unauffälligen und z.B. als schizophren, manisch usw. eingestuften Gruppen
Externale Strategien - Beispiel California Psychological Inventory - worum geht es?
auf Normalbereich bezogen; Subskala Socialization auf Praedisposition zu kriminellem Verhalten bezogen
Induktive Strategien - Grundidee
Generiere breiten Itempool, teste mit (kleiner) Stichprobe, generiere (homogene) Subskalen durch Faktorenanalyse
Induktive Strategien - bekanntes Beispiel
- Primärfaktorenmodell der Intelligenz (Thurstone & Thurstone, 1941)
- Fünf-Faktoren-Modells (OCEAN!)
Typologisierende Strategie - Grundidee
Identifikation von Gruppen von Personen oder Objekten auf der Grundlage empirischer Information
Typologisierende Strategie - typische Methode
Clusteranalyse
Typologisierende Strategie -Beispiel
Myers-Briggs-Type Indicator, MBTI
Typologisierende Strategie - common concern
auf empirische Fundierung und Prüfung wird oft verzichtet
Prototypenansatz - Grundidee
Vorgabe eines kognitiven Ankerreizes (Prototyp) und Einschaetzung von Objekten im Vergleich zum Prototyp
Prototypenansatz - Bezug zu AFA
AFA - prototypische Verhaltensweisen werden unmittelbar zur Abgrenzung des Merkmalsbereichs und der Itemgenerierung genutzt
Vergleichende Bewertung der 3 Hauptvarianten (intern, extern, rational)? 3 thoughts; summary see Tabelle 2.1
- kaum systematische Validitätsvorteile fuer eine Strategie
2 .kriterienbezogenen Validität: leichte Vorteile rational, Nachteile internal - Rational unschlagbar re: theoretische Fundierung, Interpretierbarkeit der Testergebnisse.
Generierung von Items (aka Aufgaben), 2 grundlegende Aspekte
- Inhaltlich (was fragen)
2. formal (wie fragen - Formulierung und Antwortformat)
7 inhaltliche Kategorien fuer Persoenlichkeitsitems
- Beschreibung von Reaktionen (beobachtbar, intern, physische Reaktion)
- Eigenschaftszuschreibungen
- Wünsche und Interessen
- Biografische Fakten
- Einstellungen und Überzeugungen
- Reaktionen anderer auf die eigene Person
- Bizarre items (jemand will mich vergisten)
Wofuer steht IPIP und was ist es?
International Personality Item Pool; frei verfuegbarer umfangreicher Itempool
Wofuer steht AFA?
act frequency approach (Buss & Craik, 1983)
AFA - Grundidee (2 elements)
- Metatheorie der Persönlichkeit
- Dispositionen als kognitive Kategorien aufgefasst, in denen Verhaltensweisen nach der Häufigkeit ihres Auftretens zusammengefasst werden.
AFA - Grundidee Beispiel: “Maria ist arrogant”
- Maria hat in einem gegebenen Zeitraum relativ zu einer sozialen Norm eine große Zahl arroganter Verhaltensweisen gezeigt
- Note - Grenzen des Konstrukts und Frequenz/threshold nicht klar definiert
AFA - Vorgehensweise bei der Generierung von Items; 2 steps
- Vpn (set 1) geben typische Verhaltensweisen fuer Menschen an, die Zieleigenschaft in hohem Masse besitzen; generiert items
- Vpn (set 2) schaetzen ab, wie typisch items fuer die Eigenschaft sind
AFA - assessment (2 elements)
- Gut: Beurteilung der Protypizitaet und empirische Befunde stimmen i.d.R. gut ueberein, Skalen lassen sich gut entwickeln
- Problem: allgemeiner Unterschied im Aktivitaetslevel (across Vpn)
AFA - Problem allgemeine Unterschiede im Aktivitaetslevel - what does that mean
Manche Versuchspersonen geben häufiger als andere an, dass sie Verhalten jeglicher Art gezeigt haben (oder sind tatsächlich generell aktiver), verzerrt Korrelationen
CIT - wofuer steht die Abkuerzung?
critical incident technique (CIT, Flanagan, 1954)
CIT - geschichtlicher Hintergund
Organisationspsychologie; ursprünglich als Verfahren der beruflichen Leistungsbeurteilung konzipiert
CIT und Itemgenerierung - Ansatzpunkt
Gedanke, dass sich gute oder unbefriedigende Leistungen in konkreten erfolgskritischen Ereignissen niederschlagen
CIT und Itemgenerierung - Ansatzpunkt - Beispiel
Nichteinhaltung von Wartungsintervallen durch einen Maschinenbediener kann zu einem kostspieligen Stillstand führen
CIT und Itemgenerierung - Vorgehensweise - 2 Schritte
- Use one set of SMEs to identify critical incidents
2. Validate list with different set of SMEs
CIT und Itemgenerierung - Vergleich zu AFA
- Prinzipiell aehnlich
2. Hauptunterschied - “acts” in AFA sind oft enger definiert als “incidents” in CIT
CIT - allgemeine Bewertung - general idea (1 positive, 1 negative)
- Positiv: kriterienbezogener Einsatz ist allgemein gut bewaehrt
- Negativ: Entwicklungsaufwand erheblich, Verhaltensbeispiele für mittlere Leistung schwer zu finden, Sammlung kritischer Ereignisse ergibt nicht immer homogene, interpretierbare Konstrukte
Was sind formal die 3 Bestandteile eines jeden Items?
- Itemstamm - eigentliche Frage, Aufgabe oder Reiz
- Antwortformat - moegliche Reaktionen
- Reihenfolge der items im Fragebogen
Wie wichtig sind Vortests zur Vorpruefung von Formulierungen
SEHR WICHTIG
Taxonomie von 8 Antworttypen (auf 2-3 Hierarchiebenen - think tree)
- frei: Ergaenzung, Kurzaufsatz
- gebunden
- Ordnung: Zuordnung, Umordnung
- Auswahl: Dichtomie, Mehrfachahl
- Beurteilung: Analogskala, Ratingskala - also - atypische Formate
thought on Leistungstests und freie Antworten
can work, given that there is usually one (or a limited set of) correct answer(s). e.g., In welchem Land liegt die Stadt Lima)
Nachteil re: freie Antworten - 3 ideas
- fehlende Standardisierung der Antworten; oft Notwendigkeit der Schaffung erschöpfender Musterlösungen
- Risiko von Folgefehlern (bad for stoch. independence)
- Auswertungsaufwand hoch
Definition gebundenes Antwortformat
alle Antwortmöglichkeiten vollständig vorgegeben
Gebundene Antwortformate - 2 Vorteile
- schnelle Auswertung (oft automatisch)
2. kein Interpretationsspielraum fuer Auswerter
Gebundene Antwortformate - Nachteil
unterschiedliche Interpretation der Antwortvorgaben (von verschiedenen Teilnehmern)
Was ist das haeufigste Antwortformat in der Persönlichkeits- und Einstellungsforschung?
die Einstufungs- oder Ratingskala (z.B. von „trifft zu“ bis „trifft nicht zu“ oder von „sehr gut“ bis „sehr schlecht“)
Ratingskalen - was sind die 3 Gestaltungselemente?
- Abstufung (n Stufen, n=?)
- Polarität
- Verankerung
Ratingskalen - Zahl der Abstufungen - was ist praktisch das psychometrische Optimum?
5-9 Stufen (zu wenige Stufen - zu wenig information; zu viele - ueberfordern VPN)
Ratingskalen - Zahl der Abstufungen - gerade vs ungerade Zahl von Stufen - 2 thoughts
- n=ungerade: gut, wenn neutrale Mittelstufe angeboten werden soll
- n=gerade: gut, wenn Proband sich entscheiden muessen soll
Ratingskalen - Abstufungen - thoughts on Ausweichkategorie (“weiss nicht”, “keine Angabe”)?
Kann Akzeptanz erhoehen, wird wegen der Erhöhung des Anteils fehlender Werte mit Auswertungsproblemen erkauft
Ratingskalen - Polaritaet - Definition unipolar/bipolar
- unipolar - Existenz eines logischen Minimums (e.g., „nie“)
- Bipolar: Extremauspraegungen durch gegensätzliche Begriffe gekennzeichnet
Ratingskalen - Verankerung
- Was sind Endpunkte?
- Wie sind Endpunkte identifiziert/beschrieben - Zahlen, Gesichterskala (think pain!), Worte (fast immer/fast nie)
- Sind nur Endpunkte oder auch alle Zwischenwerte klar identifiziert?
Ratingskalen - welches Skalenniveau messen sie? 2 thoughts
- Allgemein messen Ratingskalen nur Ordinalskalen
2. Oft Annahme dass Auswertung als Intervallskala ok ist
Ratingskalen - was sind Eigenschaften die Auswertung als Intervallskala erlauben?
(1) je mehr Skalenstufen je Item
(2) je mehr Items aggregiert werden
(3) je gleichmäßiger die Abstände zwischen den Skalenstufen von den Testteilnehmern empfunden werden
Ratingskalen - in welchen Situationen werden oft asymmetrische abstufungen gewaehlt/unterstellt?
um bei seltenen/sozial erwünschten Merkmalen in solchen Bereichen der Skala besser differenzieren zu können, in denen sich die Antworten sonst häufen würden
Ratingskalen und Anfälligkeit für Antworttendenzen - 3 causes for concern
- Antwort i.S., der sozialen Erwuenschtheit
- generelle Tendenz zur Zustimmung oder Ablehnung von Aussagen
- Bevorzugung bestimmter Skalenbereiche wie der Mitte oder den Extremen
Ratingskalen und dichotome Auswahlaufgaben - wichtiges Auswertungsproblem?
50% Chance der richtigen Antwort beim Raten… Erfordert deswegen viele Aufgaben… just don’t use them!
Mehrfachauswahlaufgabe - what is an important consideration when evaluating the alternative answers (particularly when only 1 option is allowed)?
sind die Antwortalternativen disjunkt
Mehrfachauswahlaufgaben in Leistungstests - Definition Distraktoren
falsche Antwortalternativen
Mehrfachauswahlaufgaben in Leistungstests - Distraktoren - Einfluss auf Schwierigkeit des Tests?
Schwierigkeit des Items hängt ganz wesentlich auch von der Wahl der Distraktoren ab
Mehrfachauswahlaufgaben bei Persönlichkeits- und Einstellungstests - forced-choice item, how do they work?
Praesentiere Antwortalternativen zusammen, die bei freier Auswahl ähnlich häufig bevorzugt würden, mit der Instruktion, genau eine davon auszuwählen
Mehrfachauswahlaufgaben bei Persönlichkeits- und Einstellungstests - forced-choice item, when are they usually considered?
Wirkt gegen die Tendenz zu sozial erwünschtem Antwortverhalten (Auswahl zwischen Alternativen die entweder beide allg. gut oder allg. schlecht sind)
Mehrfachauswahlaufgaben bei Persönlichkeits- und Einstellungstests - forced-choice item - 2 caveats
- Aufwand bei der Konstruktion erheblich
2. Verbesserung der Güte (e.g., Personalauswahlverfahren) empirisch nicht klar
Mehrfachauswahlaufgaben - Def. ipsative Messung
Forced Choice item bei dem die Antwortalternativen verschiedenen Merkmalen zugeordnet sind (statt verschiedenen Auspraegungen eines einzelnen Merkmals)
Mehrfachauswahlaufgaben - ipsative Messung - statistisches caveat
fehlende stochastische Unabhängigkeit der Antwortalternativen (implizit - Wahl von A ist Entscheidung gegen Alternativen, fuehrt zu künstlichen negativen Korrelationen zwischen Merkmalen)
Ordnungsaufgaben - wann sind sie besonders geeignet?
zur Abfrage von Wissen und Kennt-nissen in sehr kompakter und ökonomischer Form
Ordnungsaufgaben - was macht sie problematisch (2 thoughts)?
- Erhoehte Ratewahrscheinlichkeit durch sukzessiven Ausschluss von Antwortmöglichkeiten
- Wahrscheinlichkeit von Folgefehlern mit jeder Zuordnung innerhalb eines Items
Was sind 2 wichtige Reihenfolgeeffekte bei der Zusammenstellung von items in einem Fragebogen?
Assimilationseffekt
Kontrasteffekt
Reihenfolgeeffekte - was sind Strategien, dagegen?
- zufällige Reihung der items
- Platzierung inhaltlich zusammenhaengender items weit weg von einander (e.g., OCEAN-OCEAN)
- Powertest - Ordnung in ansteigender Schwierigkeit (wirkt gegen Entmutigung)
Wann haben wir einen Rohtest?
erste geordnete Itemsammlung
Was sind die 3 Ziele eines Pretests?
Pruefung der Items auf
- Verständlichkeit
- Eindeutigkeit
- Akzeptanz
Wie vergleichen sich Pretest und “echter” Test?
gleiche Zielgruppe
kleinere Stichprobe
ggf. Moeglichkeit, qualitativen feedback zu items zu geben
Fuer welches Inventar ist BFI die Abkuerzung?
Big Five Inventory; (BFI, John & Srivastava; deutsch von Lang, Lüdt-ke & Asendorpf, 1999)
KTT: Welche zwei Werte sind besonders wichtig in der Itemanalyse?
Itemschwierigkeit
Trennschaerfe (des Items mit dem gesamten Test)
KTT: Deskriptive Analyse des Datensatzes - erster Schritt?
Rekodierung
KTT: Rekodierung - was ist es und warum muessen wir es machen?
- Warum: Items sind oft unterschiedlich gepolt; d.h. hohe Werte stehen manchmal für hohe, manchmal für niedrige Ausprägungen des jeweiligen Merkmals
was: umdrehen
KTT: Rekodierung - wie komme ich zum SPSS Befehl (p59)?
TRANSFORMIEREN -> UMKODIEREN IN DIE-SELBEN VARIABLEN
oder
UMKODIEREN IN ANDERE VARIABLEN
SPSS 101: was sind die zwei Optionen fuer die Ausfuehrung eines jeden Befehls?
- hit “OK”: execute immediately
- hit “EINFUEGEN”: creates syntax document, can execute using arrow
ALWAYS CHOOSE option #2!!
SPSS: Wie komme ich zur deskriptiven Datenanalyse (Tabellenoutput)?
ANALYSIEREN -> DESKRIPTIVE STATISTIKEN -> DESKRIPTIVE STATISTIK, OPTIONEN wahlen
SPSS: Wie komme ich zur deskriptiven Datenanalyse (graphischer output, e.g., Histogramme)?
ANALY-SIEREN -> DESKRIPTIVE STATISTIKEN -> EXPLORATIVE DATENANA-LYSE -> DIAGRAMME
Explorative Datenanalyse, deskriptive Statistik, was bedeutet Schiefe
rechtssteile Verteilung
Explorative Datenanalyse, deskriptive Statistik, was bedeutet Exzess (Kurtosis)
breitgipflige Verteilung
Explorative Datenanalyse, deskriptive Statistik, welcher Test besagt of die Daten normalverteilt sind?
Kolmogorov-Smirnov-Tests (über EXPLORATIVE DATENANALYSE)
Explorative Datenanalyse, deskriptive Statistik, welcher Wert informiert ueber die Itemschwierigkeit?
Mittelwert
Explorative Datenanalyse, deskriptive Statistik, wie ist Itemschwierigkeit formal definiert?
P=Nr/N*100
Nr= Anzahl der Probanden, die Aufgabe richtig (i.S. des Aufgabenkriteriums)
gelöst haben
P: Schwierigkeitsindex ohne Korrektur
Explorative Datenanalyse, deskriptive Statistik, wie ist Itemschwierigkeit bei Persoenlichkeitstests zu interpretieren?
Anteil der i.S. einer hohen Ausprägung des Konstrukts
gegebenen Antworten
Explorative Datenanalyse, deskriptive Statistik, Schwierigkeitsindex mit Zufallskorrektur, formale Definition
Pzk={Nr-Nf/(m-1)}*(100/N)
PZK = Schwierigkeitsindex mit Zufallskorrektur Nf= # falsche Antworten
Schwierigkeitsindex - Modifikation wenn nicht alle Fragen beantwortet sind (Zeitbegrenzung)?
benutze im Nenner Nb (statt N), Nb= Anzahl der berbeiteten items; Index heisst dann Schwierigkeitsindex mit Inangriffnahmekorrektur
Schwierigkeitsindex - Transformation und Schwierigkeitsanalyse bei Ratingskalen
Transformierung der Antwortskala so, dass das theoretische Minimum den Wert Null annimmt (analog zu null richtigen Lösungen)
Schwierigkeitsindex - Zusammenhang Itemschwierigkeit und Informationshaltigkeit
ist Itemschwierigkeit im Durchschnitt gleich dem Mittelwert der Skala, ist Trennschaerfe maximal (reverse - if avg=max or min, no information… duh)
Definition Skala
Anazahl aufsummierter oder gemittelter Items; sollen dieselbe Eigenschaft/ Fähigkeit erfassen
(Eigen-)Trennschaerfe und Bedeutung in der KTT
der wichtigste Indikator , wie gut jedes einzelne Item das zugrunde liegende Merkmal abbildet (Prototypikalitaet)
(Eigen-) Trennschaerfe - statistische Definition/Approach
korrigierte Korrelation (Part-whole-Korrektur) einer Aufgabe mit einer Skala
Fremdtrennschaerfe, Definition
Korrelationen von Items mit den Skalen oder Testwerten anderer Fragebögen oder mit Kriterien (e.g., Berufserfolg)
Fremdtrennschaerfe - wann ist sie konzeptionell besonders wichtig?
externale Skalenkonstruktion
Berechnung der Trennschärfe mit der Skala, Part-whole-Korrektur - Motivation
Item geht in Skala ein; fuehrt ohne Korrektur zu Ueberschaetzung der Trennschaerfe
Berechnung der Trennschärfe mit der Skala nach Part-whole-Korrektur - formula
Produkt-Moment-Korrelation
nach Part-Whole-Korrektur, p69
Trennschaerfe - part-whole Korrektur - wann ist sie besonders wichtig (2 drivers)?
- je kuerzer Skala (few items)
2. Je heterogener die Skala ist
Wann wird eine Skala als homogen bezeichnet?
wenn items hoch positiv korreliert sind
Skalenhomogenitaet und - heterogenitaet, link to item selection/ exclusion (2 considerations)
- Zu homogen -Redundanz (dreimal das gleiche fragen - not smart)?
- negative Trennschaerfe - definitiv Ausschluss aus der Skala
Trennschaerfe - statistical concerns to watch for
- Trennschaerfe ist Korrelation - alles, was Varianzen beeinflusst, kann verzerren
- Watch out for extreme value (rare here, given limite selections in a Ratingskala), bimodal distributions
- niedrive Varianz dank schiefer Verteilung
What kind of considerations matter most when selecting items - statistics or substantive considerations
INHALTLICH; blinde Anwendung von Trennschaerfe-Analyse ist sehr gefaehrlich
Trennschaerfeanalyse in SPSS - Befehle
ANALYSIEREN -> SKALIERUNG -> RELIABILITÄTSANALYSE, p. 70
Trennschaefeanalyse - welcher Wert wird oft als Faustregel fuer min acceptable gesehen (Faustregel)
0.3; if less, consider eliminating item (but - always think first…)
Item selection - before making the final call - which 4 factors should you consider together?
- Item-Schwierigkeit
- Trennschaerfen
- andere deskriptive Statistiken (Varianz, Korrelationen mit Aussenkriterien etc.)
- inhaltliche Gesichtspunkte
Was ist das am weitsten verbreitete Modell der PTT Testkonstruktion?
Rasch-Modell
PTT - was ist die Grundfrage, welche die Modelle beantworten wollen?
wie kommen Antworten auf Items zustande; macht Untersuchung von Antwortmustern wichtig
PTT - Rasch-Modell - von welchen zwei Parametern haengt die Lösungswahrscheinlichkeit für ein bestimmtes Item ab?
- Fähigkeit oder Eigenschaftsausprägung einer Person
2. Schwierigkeit eines Items
PTT - Rasch Modell - wie ist die Beziehung zwischen Person Parameter, Item Parameter und Itemanwort?
probabilistisch
PTT - Rasch-Modell - statistische Interpretation des ungewichteten Summerwertes der Itemantworten?
ist erschoepfende Statistik (korrekt nur wenn Rasch-Modell nicht durch Modelltests abgelehnt wurde)
Def. erschoepfende Statistik (bzgl. ungewichteter Summenwerte der Itemantworten im Rasch-Modell)?
Summenwert einer Person liefert alle Informationen über die Fähigkeitsausprägung der Person
PTT - Rasch-Modell - wie viele Dimensionen hat ein item?
eine; i.e., Antwort auf ein Item ist komplett auf eine einzige Fähigkeits- oder Eigenschaftsausprägung zurückzuführen (nut bei Gueltigkeit des Modells)
PTT - Rasch-Modell - Eindimensionalitaet - formelle Definition, weniger strikte Variante?
Korrelation zwischen den Items eines Tests verschwindet nach Auspartialisierung der latenten Eigenschaft (d.h. bei deren konstanter Ausprägung); lokale Unabhängigkeit.
PTT - Rasch-Modell - Eindimensionalitaet - formelle Definition, striktere Variante?
lokale stochastische Unabhängigkeit; ist gegeben, wenn für jede einzelne Person die Lösungswahrscheinlichkeiten zweier bel. Items multipliziert werden dürfen um kombinierte Lösungswahrscheinlichkeit beider Items zu ermitteln
PTT - Rasch-Modell - 3 Eigenschaften
- Summenwert ist erschoepfende Statistik
- Eindimensionalitaet
- Spezifische Objektivitaet
PTT - Rasch-Modell - Def. spezifische Objektivitaet
Objektivitaet der Vergleiche zwischen verschiedenen Personen ist gegeben (unter Geltung des Rasch-Modells)
PTT - Rasch-Modell - spezifische Objektivitaet - 2 Invarianzen
- über die spezifischen Items und Maße, die verwendet werden
- über die spezifischen Personen, an denen die Items kalibriert werden
PTT - Rasch-Modell - griechischer Buchstabe fuer Personen Parameter?
theta
PTT - Rasch-Modell - griechischer Buchstabe fuer Item Parameter?
sigma
PTT- Rasch-Modell - logische Beziehung zwischen Person Parameter und der latenten Variable
die beiden sind identisch; e.g., Intelligenz
PTT - Rasch Modell - logische Abfolge in Schaetzung von Item- und Personenperameter?
Schätzung der Personenparameter setzt die Kenntnis der Itemparameter voraus
PTT-Rasch-Modell - mit welcher Methode werden Item-Parameter normalerweise geschaetzt?
conditional Maximum-Likelihood-Methode (cML)
PTT - Rasch-Modell - was ist die Skalierung der Personen-Faehigkeit?
Differenzskalenniveau (logarithmierte Verhältnisskala)
PTT - Rasch-Modell - Personen-Faehigkeit - was ist die Messeinheit?
Logit-Einheit (abstrakte Einheit); explanatory methaphor - how many Orangen does ist take to make one liter of orange juice?
PTT - Rasch-Modell - Personen-Faehigkeit - Messeinheit - welche Transformation fuehrt zur Logit-Einheit
Logit-Transformation (duh); note - Intelligenzskala ist KEINE Logit Transformation, sondern T-Wert Transformation
PTT - Rasch-Modell - in welchem Bereich liegen Personen- und Itemparameter normalerweise?
zwischen -3 und +3 (aber prinzipiell minus/plus unendlich)
PTT - Rasch-Modell - Personen- und Itemparameter - wie interpretieren wir niedrige (hohe) Werte?
niedrig: leichte items, geringere Faehigkeit
hoch: schwierige items, hoehere Faehigkeit
PTT - Rasch-Modell - Personen- und Itemparameter - mathematische Verknuepfung, Interpretation
- verknuepft durch Division von theta (Person parameter) durch sigma (Schwierigkeit)
- Quotient ist Wahrscheinlichkeit, das Problem zu loesen in Abhaengigkeit von PersPar., It.Par.
PTT - Rasch-Modell - Personen- und Itemparameter - mathematische Verknuepfung - graphische Darstellung
x-Axis: ratio (or difference) theta (person parameter) and sigma (it.par.); note: this assumes identical units…!
y-Axis: Probability to solve problem
graph: like S-curve, called item-characteristic curve (ICC)
PTT - Rasch-Modell - item-characteristic curve (ICC) - Ermittlung der Itemschwierigkeit
Step 1: Find where y=0.5 (odds to answer item correctly are 50:50)
Step 2: go right from x-axis until hit curve
Step 3: drop straight down to x-axis to find theta/sigma
PTT - Rasch-Modell - ist Normstichprobe erforderlich zur Interpretation der Ergebnisse?
NEIN - kann Loesungswahrscheinlichkeit direkt berechnen
PTT - Rasch-Modell - wo finde ich die Formel zur berechnung der Loesungswahrscheinlichkeit eines items?
p83
PTT - Rasch-Modell - Modelltest - was ist die einfachste Methode (erste Methode)?
der Grafische Modelltest
PTT - Rasch-Modell - Modelltest - Grafischer Modelltest
Streudiagramm; Schaetzung der Itemparameter aus zwei Teilstichproben; wenn Modell gueltig ist, sind itemparameter unabhaengig von Stichprobe, alle Werte auf Winkelhalbierenden (y-x), see Abb. 3.16
PTT - Rasch-Modell - Modelltest - was ist der einzige bewaehrte formale (statistische) Test?
Andersen Likelihood-Quotienten-Test; statistische Umsetzung des grafischen Modelltests
PTT - Rasch-Modell - Modelltest - was sind 2 alternative, weniger bewaehrte formale (statistische) Test?
Pearson-χ²-Test (Chi)
Bootstrap-Methode
PTT - Rasch-Modell - thought on Trennschaerfe wenn Modell gueltig
dichotomes Modell: alle items haben die gleiche Trennschaerfe ordinale Modelle (mehrere geordnete Alternativen, e.g., Likert): Trennschaerfen muessen nicht gleich sein, aber Antwortschwellen sind geordnet
PTT - zwei Erweiterungen zum Rasch Modell
- Annahme unterschiedlicher Diskriminationsmacht der Items (Trennschärfe)
- Beruecksichtigung der Effekte des Ratens (Rateparameter)
PTT - wie heisste das Modell welches das Rasch-Modell um Trennschärfeparameter (βi) erweitert?
Birnbaum Modell
PTT - mathematische Definition der Trennschaerfe?
Steigung einer Tangente am Wendepunkt (p = .50) der ICC-Funktion
PTT - wie heisste das Modell welches das Rasch-Modell um Trennschärfeparameter (βi) UND Ratewahrscheinlichkeit γi (gamma) erweitert?
3-Parameter-Modell
PTT - und Trennschaerfe - thought?
if Trennschaerfe not equal for items, may have logical issues (see p87/88). If items measure same thing, why would it make sense that odds of scoring high are much better (given a specific person parameter theta) than another item? does item measure something else too?
PTT - 3-Parameter-Modell - thoughts on usability
just do NOT use it. use other factors to control for guessing (e.g., think carefully about distraktors)
PTT - ordinales Rasch-Modell - welches Konzept ersetzt die ICC?
Category Characteristic Curves“ (CCC) oder Kategorienfunktionen (da es mehrere Schwellen gibt…)
PTT - ordinales Rasch-Modell - anderer Name?
Partial-Credit-Modell
PTT - wie heisst die Klasse der Modelle die sowohl quantifizieren und klassifizieren?
Mixed-Rasch-Modelle
PTT - Mixed Rasch Modelle - Grundidee
Mixed-Rasch-Modell sucht nach Personengruppen, die sich in ihrem Antwortmuster maximal unterscheiden (e.g., verschiedene Problemloesungsmuster); in jeder sub-Gruppe gilt normales Rasch-Modell
PTT -in welcher Weise sind Mixed-Rasch-Modelle sind für die Testkonstruktion sehr nützlich?
koennen Verletzungen der Eindimensionalität-Annahme für jedes Item anzeigen
Faktorenanalyse - was ist der historische Entstehungskontext?
theoretische Intelligenzforschung (Spearman, 1904)
Faktorenanalyse - mathematisch/statistischer Hintergrund?
lineares Modell
Faktorenanalyse - konzeptionelle Grundidee
Zusammenfassung vieler manifeste Variablen (z.B. Items) zu wenigen latenten Variablen (z.B. Konstrukte)
Faktorenanalyse - wichtige Abgrenzung von multipler Regression
Regression - Beziehung abhaengiger/unabhaengiger Variables
Faktorenanalyse - Aufklaerung der Datenstrukture von Variablen auf derselben logischen Ebene
Faktorenanalyse - welcher Forscher hat die Faktorenanalyse verallgemeinert und wie heisst sein Ansatz?
Cattell (1957); Kovariationsschema
Cattell’s Kovariationsschema - sources of variation, number correlation matrices?
3 sources - variables, subjects, situations
6 correlation matrices
Faktorenanalyse in diesem Kurs - mit welcher Cattell-technique laesst sie sich vergleichen?
R-Technik
Faktorenanalyse - 3 Zwecke nach Thompson (2004)
- Prüfung der Gültigkeit (Validität) theoretischer Modellannahmen re: Struktur eines Variablensatze, Messinstruments (aka Faktorielle Validitaet)
- Entwicklung von Theorien über die interne Struktur psychologischer Konstrukte/Manifestationen
- Datenreduktion; vereinfachende Beschreibung eines Datensatzes durch Zusammenfassung von Variablen zu (übergeordneten) Faktoren
Faktorenanalyse -was sind die zwei spezifischen Klassen von Methoden
- Explorative Faktorenanalyse (EFA); aelter
2. Konfirmatorische Faktorenanalyse (CFA)
EFA vs CFA - welches Verfahren ist besser zur Pruefung von Modellannahmen?
CFA!
EFA - was sind die beiden Hauptvarianten nach Thompson (2004)?
- Hauptkomponentenanalyse (principal components analysis: PCA)
- Hauptachsenanalyse (principal axis factor analysis: PAF
EFA - PCA vs PAF - was sind die Hauptunterschiede?
Anwendungszweck
- PCA: Datenreduktion
- PAF: Aufdeckung latenter Strukturen
Faktorenanalyse - was sind die 3 grundlegenden logischen Schritte?
- Extraktion einer kleineren Anzahl latenter Variablen (Faktoren); Faktor - gewichtete Summe beobachteter Variablen
- Rotation der vorlaeufigen Faktoren im geometrischen Raum
- Berechnung der Faktorwerte der Vpn
EFA - Voraussetzungen -
- Substanzielle Korrelation der Items
- Stichprobe gross genug
- Vertilungeigenschaften ok
EFA - Voraussetzungen - 4 Tests fuer substanzielle Korrelation
- Bartlett-Test auf Sphärizität (in SPSS implementiert)
- Kaiser-Meyer-Olkin-Koeffizient (KMO), sollte hoch sein
- Kommunalitaet
- MSA- Koeffizient (measure of sample adequacy)
EFA - Voraussetzungen - Test fuer substanzielle Korrelation - Bartlett Test - desirable outcome?
beobachtete Korrelationsmatrix weicht signifikant von der vollständigen Unabhängigkeit der Variablen in der Population (sog. Diagonal- bzw. Identitätsmatrix) ab
EFA - Voraussetzungen - Test fuer substanzielle Korrelation - KMO Koeffizient - desirable outcome?
KMO-Koeffizient sollte möglichst hoch sein (keinesfalls unter .50)
EFA - Voraussetzungen - Test fuer substanzielle Korrelation - KMO Koeffizient - was misst er?
den gemeinsamen Varianzanteil der Items relativ zu deren spezifischen Varianzanteilen
EFA - Voraussetzungen - Test fuer substanzielle Korrelation - Kommunalitaet - desirable outcome?
sollte Wert von .20 i.d.R. nicht unterschreiten
EFA - Voraussetzungen - Stichprobengroesse - absolutes Minimum
Anzahl der Variablen; Faustregel (bei guenstiger Situation): N>60
EFA - Voraussetzungen - Stichprobengroesse - n allgemeine Richtlinien
N groesser je
- mehr Items insgesamt
- weniger Items je Faktor
- weniger reliabel die Items sind
Faktorenanalyse - welche 2 Annahmen re: Verteilungseigenschaften stehen hinter Faktorenanalyse?
- kontinuierliche Messung mindestens auf Intervallskalenniveau
- Normalverteilung
Faktorenanalyse - Annahmen re: Verteilungseigenschaften hinter Faktorenanalyse - Erfuellung?
Annahmen in der Regel NICHT erfuellt - weder Intervallskala noch Normalverteilung
Faktorenanalyse - Verletzung der Annahmen re: Verteilungseigenschaften hinter Faktorenanalyse - ein cross-check post hoc?
Inspektion der deskriptiven Itemstatistiken; Methodenartefakt wahrscheinlich wenn
a) innerhalb desselben Faktors vorwiegend Items mit ähnlichen Verteilungseigenschaften
b) across factors, different distribution properties
Faktorenanalyse - Annahmen re: Verteilungseigenschaften hinter Faktorenanalyse - addtl requirement for ML?
multivariate normal distribution; never met, can’t test fotr it in SPSS either…
Faktorenanalyse - 3 Strategien bei unguenstigen Verteilungseigenschaften
- Daten transformieren (e.g., log-linear)
- Zusammenfassung von items zu Paeckchen (parcels) - particularly in CFA
- Analyse von tetrachorischen oder polychorischen Korrelationen statt Matrix der Produkt-Moment-Korrelationen
EFA - Interpretation der Faktor-Ladungen?
Korrelation zwischen Item und Faktor
EFA - Interpretation der quadrierten Faktor-Ladungen?
Anteil gemeinsamer Varianz an der Gesamtvarianz der beteiligten Variablen
EFA - was ist die Ladungsmatrix?
- Zeilen: Variablen
- Spalten: Faktoren
- Matrixzellen: Ladungen
EFA - bei unkorrelierten Faktoren - wie wird die Kommunalitaet berechnet?
Zeilensummer der quadrierten Ladungen
EFA - Interpretation der Kommunalitaet (bei unkorrelierten Faktoren)?
Anteil der Varianz eines Items, der durch alle extrahierten Faktoren gemeinsam aufgeklärt werden kann
EFA - Kommunalitaet (bei unkorrelierten Faktoren) - Beziehung zur Reliabilitaet?
Untergrenze für die Schätzung der Reliabilität des Items
Logisches Grundproblem der Faktorenanalyse?
Kommunalitäten müssen geschätzt werden, bevor Faktorenanalyse durchgeführt werden kann und damit auch bevor die Anzahl der Faktoren und deren Ladungen bekannt sein können, aus denen die Kommunalität definitionsgemäß besteht
PCA und anfängliche Schätzung der Kommunalität - mathematisches Vorgehen
Einsetzen von Einsen in der Hauptdiagonalen der Korrelationsmatrix
PCA und anfängliche Schätzung der Kommunalität - mathematisches Vorgehen - inhaltliche Interpretation
anfängliche Schätzung der Kommunalität geht von einer vollständigen Aufklärung der Varianz des Items durch die Summe der Faktoren aus
PAF und anfängliche Schätzung der Kommunalität - mathematisches Vorgehen
Einsetzen der quadrierten multiplen Korrelationskoeffizienten R² zwischen dem jeweiligen Item und allen anderen Items
PAF und anfängliche Schätzung der Kommunalität - mathematisches Vorgehen - Vergleich zu PCA
PAF ist konservatives (R² in der Regel
Welches Diagram zeight den Zusammenhang zwischen Varianz und Reliabilitaet?
Abb. 4.2
PCA und PAF - was passiert nach der anfaenglichen Schaetzung der Kommunalitaet?
iterative Loesung, genaue Vorgehensweise unterscheidet sich nach Algorithmus
PCA und PAF - gibt es immer eine Loesung?
PCA: JA
PAF: muss nicht sein (algorithm can fail to converge)
PCA - was ist das Prinzip der PCA?
- Extraktion eines neuen Variablensatzes aus den urspr. Variablen
- neue Variablen nach ihrer Bedeutung geordnet
- jede Komponente klaert Maximum der gesamten (verbleibenden) Varianz aller beteiligten Variablen auf
PCA - mathematische Erklaerung der Vorgehensweise (note - PCA is in reality a single step process - only PAF is iterative)
- imagine stepwise identification of components
- First step look for line in p-dimensional space (p=# of variables) that minimizes distance to all points (subjects and variables)
- Subsequent steps - extract the line that is uncorrelated to first, explains max of remaining variance
PCA, PAF - basic thought re: number of factors
usually want to reduce the number of variables - thus have to find a logical way to know when to stop adding components/factors
What is the key metric when assessing the value of a factor/component to explain variance?
Eigenwert; berechnet als Spaltensumme der quadrierten Ladungen eines Faktors/einer Komponente (>1 gut,
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll
- Kaiser-Guttman-Kriterium (KG-Kriterium)
- grafische Analyse des Eigenwerteverlaufs, Scree-Test
- statistische Methoden
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - KG Kriterium
extrahiere in einer PCA alle Komponenten deren Eigenwert größer Eins ist.
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - Scree-Test
sortiere Eigenwerte der Groesse nach, trage sie in ein Diagramm ein und verbinde die Punkte. Extraktion hoert auf, wenn Liene flach wird
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - 3 Signifikanztests
Bartlett Test
Chi-Square Test (nur fuer ML Faktorenanalyse)
Parallelanalyse und Minimum-Average-Partial-Test (MAP-Test)
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - statistische Kriterien - Bartlett Test - Grundidee
Teste, ob Residualmatrix nach Extraktion von n Faktoren noch von der id-Matrix abweicht
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - statistische Kriterien - Bartlett Test -Problem
Oft Extraktion zu vieler Faktoren, insbesondere bei grossem N
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - statistische Kriterien - Bartlett Test - Grundidee (4 steps)
Generiere Zufallsmatrix mit gleichem Rang wie die empirische Matrix
Extrahiere Faktoren aus der Zufallsmatrix und ordne Eigenwerte
Vergleiche Zufallseigenwerte mit empirishen Eigenwerten
Extrahiere empirische Eigenwerte solange sie hoeher als Zufallseigenwerte sind
PCA, PAF - 3 Regeln wann Komponenten-/Faktorenextraktion aufhoeren soll - statistische Kriterien - Bartlett Test - Problem
as n gets large, random matrix converges to id, too many factors get extracted
PCA, PAF -Interpretation der Faktoren/Komponenten - basic thought
PCA/PAF sind rein mathematisch - Interpretation ist Aufgabe des Forschers!
PCA, PAF - was meint der Begriff der Einfachstruktur (ideal outcome)
jedes Item laedt hoch auf einen bestimmten Faktor und auf die anderen niedrig oder gar nicht
PCA, PAF - was meint der Begriff der Rotation
veraendern der Lage der Faktoren im Faktorraum; drehen der Achsen so dass sie sich einigen Punkten annaehern und von anderen entfernen
PAC, PCA - Effekt der Rotierung der Faktoren?
- Annaeherung an Ideal der Einfachstruktur
2. Erhaltung der Gesamtvarianz der extrahierten Faktoren unter Veraenderung der Verteilung der Varianz auf Faktoren
PCA, PAF - Rotierung - was sind die 3 grundsaetzlichen Optionen?
orthogonal
oblique
Prokrustes
PCA, PAF - Definition orthogonale Rotation
Achsen stehen im Faktorraum zueinander im rechten Winkel; keine Korrelation zw. Faktoren
PCA, PAF - Definition orthogonale Rotation
Achsen stehen im Faktorraum zueinander NICHT im rechten Winkel; moegliche Korrelation zw. Faktoren
PCA, PAF - wie entscheiden wir uns zw. Definition orthogonale Rotation
inhaltliche Ueberlegungen!! note - Korrelation bedeutet Redundanz, aber Unkorreliertheit oft theoretisch nicht zwingend (e.g., OCEAN)
PCA, PAF - Definition Prokrustes-Rotation
Versuch eine erwartete oder früher gefundene Faktorenstruktur anhand der empirischen Daten zu reproduzieren
Was ist verbreitetste Verfahren der orthogonalen Rotation?
Varimax-Rotation
Varimax-Rotation - Ziel
Minimierung der Komplexitaet der Faktoren durch maximieren der Unterschiede der Ladungen innerhalb eines Faktors
Was sind 2 Alterniven zu Varimax im set der orthogonalen Rotationsverfahren?
Quartimax
Equamax
Was ist das Ziel von Quartimax?
Maximiert Eindeutigkeit der Zuordnung der Items zu einem Faktor
Was ist das Ziel von Equamax?
Mittelweg zwischen Varimax (max delta Ladungen innerhalb eines Faktors) und Quartimax (max Eindeutigkeit der Zuordnung item-faktor)
Was 2 verschiedene Verfahren der obliquen Rotation (Namen)?
Promax
Direkte Oblimin Rotation
Promax Rotation - Idee
potenziere Ladungen einer orthogonalen Loesung (e.g., 4) -laesst kleine Ladungen typischerweise verschwinden
Direkte Oblimin Rotation - Idee
laesst über die Einstellung des sog. Delta-Wertes eine Variation zwischen max Korreliertheit (Delta = 0) und Orthogonalität (Delta = -4) zu
Grundidee - was ist der Output einer Rotation?
- Sturkturmatrix ist neue Ladungsmatrix (oder -matrizen)
- bei obliquer Rotation auch noch Korrelationsmatrix der rotierten Komponenten bzw. Faktoren (aka Primaerfaktoren)
Faktorenanalyse zweiter Ordnung - Durchfuehrung
Orthogonale Rotation der Primaerfaktoren
Faktorenanalyse zweiter Ordnung - Interpretation
Identifikation hoeherer Strukturen (e.g., OCEAN - erst Unterstrukturen, dann Big 5)
Faktorenanalyse zweiter Ordnung - wie heissen Outputs
Mustermatrix und Strukturmatrix (neue Ladungsmatrizen)
Definition Strukturkoeffizienten?
Elemente der Strukturmatrix (i.e., von der Rotation erzeugte Ladungmatrix)
Was sind die Elemente der Mustermatrix?
die partiellen standardisierten Regressions- gewichte des Items mit den rotierten Faktoren
Wie werden die Elemente der Mustermatrix oft genannt?
Faktormuster-Koeffizienten (factor pattern coefficients)
Warum ist es gut, den Begriff Ladung (loading) zu vermeiden, insbesondere bei obliquer Rotation?
mehrdeutig (meinen wir Struktur- Koeffizienten oder Faktormuster-Koeffizienten?) NB: Beide sind bei othogonaler Rotation identisch
Definition Markiervariable
Item laedt auf einen Faktor hoch und gleichzeitig auf alle anderen niedrig lädt
Idee - Unterdrueckung von Ladungen (in SPSS)
unterdruecke relativ unbedeutende Ladungen z.B.
Interpetation von Faktoren und Konzept der Ueber-Determiniertheit - Idee
ein Faktor soll durch möglichst viele Variablen mit hohen Ladungen definiert sein
Interpetation von Faktoren und Konzept der Ueber-Determiniertheit - Begruendung
Gefahr der Interpretation von Zufallsfaktoren, besonders bei kleinen Stichproben
Rolle von Signifikanztests zur Beurteilung der Bedeutsamkeit von Faktorladungen?
Signifikanztest sind eher ungeeignet; auch kleine Ladungen oft stat. signifikant, insbesondere bei grossen Stichproben
Def. Faktorwerte (einer Vpn?)
gewichtete Kombination der Items, die zu dem jeweiligen Faktor beitragen
Faktorwerte - Berechnung - Durchfuehrung?
Regressionsrechnung (Voreinstellung in SPSS)
Faktorwerte - Berechnung - Regressionsoutput?
z-standardisierte Variablen, Mittelwert Null (per definitionem)
CFA gehoert zu welcher Verfahrensgruppe?
Lineare Struktur-Gleichungsmodelle (structural equation modelling, SEM; auch Kovarianzstrukturanalys)
Kernbereich der Anwendung des structural equation modelling?
Prüfung zuvor spezifizierter theoretischer Modelle
structural equation modelling - methodischer Kern (3 pieces)?
- Modellierung der latenten und der manifesten Messebene,
- Verbindung beider Ebenen
- Prüfung der Modellannahmen
structural equation models - wie werden sie ueblicherweise dargestellt?
Pfad-Diagramme
SEM Pfad-Diagramme - wie werden latente Variablen visuell identifiziert?
Kreise oder Ellipsen, griechische Buchstaben
SEM Pfad-Diagramme - wie werden latente Variablen visuell dentifiziert?
rechteckige Kästchen, lateinische Buchstaben
SEM Modelle - was sind die 7 Klassen von Variablen?
Eta: latente endogene Ksi: latente exogene y: Indikator lat. endog. x: Indikator lat. exog. Epsilon: Residuum y Delta: Resduum x Zeta: Residuum eta
SEM Modelle - was sind die 2 prinzipiellen Wege, Parameter fuer Pfadddiagramme zu bestimmen?
- Schaetzung durch Programm
2. Festlegung durch Forscher (!!)
SEM Modelle und Pfad-Diagramme - wie werden Pfad-Parameter indiziert?
mit zwei Indizes
- Ziffer 1: Ziel
- Ziffer 2: Ursprung
SEM Modelle: lambda steht fuer Pfade zwischen welchen Variablen?
zwischen latenten Variablen und ihren Indikatoren (lambda-z und lambda y)
SEM Modelle: was bezeichnet der Begriff Strukturmodell?
Beziehungen ausschließlich der latenten Variablen
SEM Modelle: was bezeichnet der Begriff Messmodell der exogenen Variablen?
die exogenen latenten Variablen und die dazugehörigen Indikatoren (x)
SEM Modelle: was bezeichnet der Begriff Messmodell der endogenen Variablen?
η-Variablen und den y-Indikatoren
SEM Modelle: was untersucht man in einer einfachen CFA der Primaerfaktoren?
betrachten ausschließlich des Messmodells der exogenen Variablen
SEM Modelle: was untersucht man in einer CFA zweiter Ordnung (zusaetzlich zur CFA der Primaerfaktoren)?
Strukturmodell, aber kein Messmodell der endogenen Variablen (endogene Sekundärfaktoren ergeben sich indirekt aus Kovarianz der Primärfaktoren).
SEM Modelle: Wieviele Matrizen brauchen wir, um ein vollstaendiges SEM Model zu spezifizieren?
8
SEM Modelle: Wieviele Gleichungen (in Matrixschreibweise) brauchen wir, um ein vollstaendiges SEM Model zu spezifizieren?
?
SEM Modelle: Wieviele Kovarianzmatrizen liegen vor:
4;
1 fuer die latenten exogenen Variablen (Phi);
3 fuer Residuen (Psi, Theta-Epsilon, Theta-delta)
SEM Modelle: Was sind die 6 typischen Schritte in einer SEM Analyse
- Modellspezifikation
- Bestimmung der Identifiziertheit des Modells
- Design und Datenerhebung
- Durchfuehrung der SEM Analyse (4 Unterschritte)
- Ggf. Modifikation und Respezifikation des Modells
- Dokumentation und schriftlicher Bericht
SEM Modelle: Was sind die 6 typischen Schritte in einer SEM Analyse - 4 Unterschritte im Schritt Durchfuehrung
a. Festlegung von Datenmatrix und Schätzalgorithmus
b. Evaluation der Passung zwischen Daten und Modell (fit)
c. Berücksichtigung von und ggf. Vergleich mit alternativen Modellen
d. Interpretation der Parameter
SEM und CFA: Beziehung
CFA ist SEM Analyse die sich auf das Messmodell der exogenen Variablen bezieht
SEM - Modellspezifikation: Vergleich der Pfad-Diagramme fuer EFA und CFA - key insights?
Pfadmodell der EFA komplizierter, da EFA alle Koeffizienten schaetzt, waehrend CFA das explizit spezifiert
SEM - Modellspezifikation: Pfad-Diagramme und Moegliche a priori Beschraenkung von Parametern
- Gleich-Null-Setzen oder anderen Wert festlegen
- Bestimmte Parameter gleichsetzen
- Ungleichungs-Beschraenkungen
SEM-Analyse - Identifizierbarkeit: 3 moegliche prinzipielle Situationen
Model is
- under-identified
- just identified
- over-identified
SEM-Analyse - Identifizierbarkeit: uebliche Situation (der 3 prinzipiellen Situationen) und Begriff Freiheitsgrad
- Ueblich: over-identification (mehr mehr Bekannte als Unbekannte) - muessen schaetzen
- Freiheitsgrad: # Bekannte minus # Unbekannte
SEM-Analyse - Identifizierbarkeit: Was bezeichnet das Problem der Skalierung?
Berechnete Parameter legen nur relative Beziehungen fest, absolute Hoehen sind willkuerlich
SEM-Analyse - Identifizierbarkeit: Problem der Skalierung - uebliche Loesung?
Festlegung einer Variablen als Referenzvariable (alternativ - Fizierung einer Varianz)
SEM-Analyse - Identifizierbarkeit: Welche Variable wird oft als Referenzvariable gewaehlt?
die mit der hoechsten Reliabilitaet
SEM-Analyse - Identifizierbarkeit: allgemeine Identifikation vs Identifikation der Teilmodelle - thought
Teilmodelle koennen unterspezifiziert sein obwohl Modell insgesamt ueberspezifiert ist!!
SEM-Analyse - Identifizierbarkeit: Was ist ein Problem, das Schaetzung trotz Ueberidentifikation unmoeglich machen kann
Hohe Korrelation der exogenen Variablen (a la Multi-Kollinearitaet)
SEM Analyse - was ist der besser Ausgangspunkt (Korr oder Kov Matrix)?
Kovarianzmatrix
SEM Analyse - warum ist Kovarianz-Matrix der besser Ausgangspunkt fuer Schaetzungen (und nicht Korr-Matrix)?
Korrelationsmatrix kann zu fehlerhaften Schaetzungen fuehren
SEM Analyse - warum kann Kovarianz-Matrix manchmal NICHT als Ausgangspunkt fuer Schaetzungen genommen werden?
Metrisches Skalenniveau ist eine der Annahmen - oft nicht erfuellt (gerade nicht fuer Fragebogen-Testitems)
SEM Analyse - was ist der statistisch akzeptable Ausgangspunkt fuer Schaetzungen wenn die Kovarianzmatrix NICHT benutzt werden kann?
dichotome Items: Matrix der tetrachorischen Korrelationen;
multivariate Ratingskalen: Matrix der polychorischen Korrelationen
SEM und Ausgangspunkt fuer Schaetzungen - Alternative zur Korrelations-Matrix wenn kein metrisches Skalenniveau vorliegt?
Zusammenfassung mehrerer Items zu Miniskalen (aka parcels) - v.a. wenn so (annaehernd) metrische Skalierung resultiert
SEM Schaetzung - was sind 2 Klassen von alternativen Verfahren?
- non-iterative Verfahren (oft step 1)
2. iterative Verfahren
SEM Schaetzung: was sind 2 non-iterative Verfahren?
- instrumental variables (IV)
2. two-stage least squares (TSLS)
SEM Schaetzung - was ist eine wichtige Beschraenkungen non-iterativer Verfahren (und wie werden sie deshalb eingesetzt)?
kann Fit nicht Pruefen; deswegen sind Verfahren NICHT fuer endgueltige Schaetzung geeignet (nur fuer Generierung des starting points)
SEM Schaetzung und iterative Verfahren - 6 moegliche (Dimensionen re:) Anforderungen
- Stichprobengroesse
- Skalenniveau
- multivariat Normal
- empirische Matrix positiv definit
- Fitfunktion skaleninvariant
- Parameter skalenfrei
SEM Schaetzung - was bedeutet positiv definit?
Alle Eigenwerte der empirischen Matrix sind positiv (aka - Determinante positiv); required in order to be able to invert matrix (used for ML, GLS)
SEM Schaetzung und positive Definitheit - was kann zur Verletzung der Annehme fuehren?
Multikollinearitaet…!
SEM Schaetzung und Anforderung der Skalen-Invarianz - inhaltliche Begruendung?
Skalen oft willkuerlich gewaehlt - sollten keine Information enthalten
SEM Schaetzung - 4 verbreitete iterative Methoden?
ML
GLS
Unweighted LS (ULS)
Asymptotically Distribution Free (ADF)
SEM Schaetzung - ML - 2 Eigenschaften
- Schaetzungen asymptotisch korrekt mit asymptotisch normalverteilten Fehlern
- skaleninvariant und skalenfrei
SEM Schaetzung - ML - Anforderungen
multivariate Normalverteilung (robust ggueber Verletzung, Schiefe
SEM Schaetzung - unweighted LS - 3 thoughts
- entspricht einer Variante der PAF in der EFA
- why attractive - few requirements or assumptions
- why bad: nicht skalenfrei oder skaleninvariant, variances large
SEM Schaetzung - Asymptotically Distribution Free (ADF) - 3 thoughts
- Gruppe verwandter Methoden - WLS, DWLS, ERLS
- Vorteil: keine/wenige Verteilungsannahmen, skaleninvariant, skalenfrei, haben Pruefstatistiken
- Nachteil: hohen Anforderungen an Stichprobengroesse (oft 4-stellig!)
SEM Analyse – Schaetzung – 2 gravierende Probleme bei iterativen Verfahren?
- Nichtkonvergenz
2. Heywood cases
SEM Analyse – Schaetzung – gravierende Probleme bei iterativen Verfahren – Heywood cases – Definition
Einzelbefunde, die eigentlich unmöglich sind, z.B. negative Varianzen oder Korrelationen > 1
SEM Analyse – Schaetzung – 2 Klassen von Tests zur Guete der Loesung
- Chi-Quadrat Test
2. Vielzahl der Fit-Indizes
SEM Analyse – Schaetzung –Tests zur Guete der Loesung – Chi-Quadrat Test – Grundidee (re: Vorgehensweise)
Prueft H0 dass das Modell zur beobachteten Datenstruktur passt, als mit der Stichprobengröße gewichteter Wert der Diskrepanzfunktion
SEM Analyse – Schaetzung –Tests zur Guete der Loesung – Chi-Quadrat Test – 2 thoughts re: results
- Theoretische Annahme ist H0; signifikanter Befund fuehrt zur ABLEHNUNG der H0
- Wahrscheinlichkeit eines signifikanten Befunds (Ablehnung!) steigt mit N, Freiheitsgraden – paradox!
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Fit-Indices – Grundidee
Starte mit Chi-Quadrat, korrigiere Ergebnisse um den Paradoxen entgegenzuwirken
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Fit-Indizes – 2 Klassen
- absolute Fit Indizes
2. komparative Fit Indizes
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes – Grundidee
Vergleich des Modells – freie Schaetzung vs. Schaetzung unter Restriktionen
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes – 2 Unterklassen
- Badness of Fit
2. Goodness of Fit
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes – Badness of Fit Indizes - 2 Beispiele
- (Standardized) Root Mean Square Residual: (S)RMR
2. Root Mean Square Error of Approximation: RMSEA
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes – Badness of Fit Indizes – Interpretation
Je hoeher die Werte, desto schlechter die Passung
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes –Goodness of Fit-Indizes –2 Beispiele
Goodness of Fit Index (GFI) Adjusted GFI (adjusted based of degrees of freedom)
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes –Goodness of Fit-Indizes –Interpretation
Ausmaß der Verbesserung gegenüber „no model at all“;wie R² Anteil durch das implizierte Modell aufgeklärter Varianz an der Gesamtvarianz
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Absolute Fit-Indizes –Goodness of Fit-Indizes –caveat
von Anwendung wird in der neueren SEM-Literatur aufgrund der Sensitivität gegenüber Veränderungen der Stichprobengröße abgeraten
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Komparative Fit-Indizes –basic idea
Fit als proportionale Verbesserung gegenüber dem Nullmodell (independence model), bei dem alle Kovarianzen auf den Wert Null fixiert werden (aka maximale Restriktion vollst. Unabhängigkeit)
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Komparative Fit-Indizes – Typen
Typ 1, 2 oder 3; je höher die Typenklasse, desto mehr Informationen gehen ein
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Komparative Fit-Indizes – Interpretation der Ergebnisse
Je hoeher, desto besser die Passung
SEM Analyse – Schaetzung –Tests zur Guete der Loesung –Komparative Fit-Indizes – Beispiele
- Tucker-Lewis-Index (TLI, in LISREL als Non-Normed Fit Index NNFI bezeichnet)
- Comparative Fit Index CFI.
More: Tabelle 6.1 (incl. cut off values!)
SEM Analyse – Schaetzung – Tests zur Guete der Loesung – general considerations
Can never really solve for quality of test/fit
- There may always be a better model you didn’t look at
- Fit may be poor even though you have the (theoretically) best possible model
SEM Analyse – Schaetzung – Modellvergleich – 2 Grundklassen von Vergleichen
Vergleich genesteter Modelle
Vergleich NICHT genesteter Modelle
SEM Analyse – Schaetzung – Modellvergleich – key metric to compare nested models
Delta Chi-Quadrat Test
SEM Analyse – Schaetzung – Modellvergleich – key metric to compare non-nested models (what not to use)
NOT Delta Chi-Quadrat Test
SEM Analyse – Schaetzung – Modellvergleich – key metric to compare non-nested models (3 alternatives to consider)
- Expected Cross Validation Index (ECVI)
- Akaike’s Information Criterion (AIC)
- Consistent AIC (CAIC)
SEM Analyse – Schaetzung – Modellvergleich – key metric to compare non-nested models (3 alternatives to consider) – how to interpret results
Tests only give you rank order of models (can’t interpret differences)
SEM – Definition der Äquivalenz von Messungen (eines Konstrukts)
Messungen untereinander austauschbar im hypothetischen Fall dass Testteile oder auch Mess-Gelegenheiten völlig frei von Fehlereinflüssen sind
Voraussetzungen fuer Reliabilitaetsschaetzung - Grundidee
KTT nimmt an, dass Messungen unter vergleichbaren bedingungen oft wiederholt werden. Frage hier ist, wie vergleichbar Messungen zwei verschiedenen Tests sind
Tau-Aequivalenz von zwei Messungen (des gleichen Werte, e.g., eine Person in 2 IQ Tests) - 3 Stufen
- tau-aquivalent: Beide Messungen messen der gleichen Wert (identisch!)
- essentiell tau-aequivalent: Beide Messungen koennen sich durch additive Konstante unterscheiden
- tau-kongenerisch: Messwerte koennen in linearer transformation dargestellt werden (Konstante und multiplikativer Faktor)
Modell paralleler Messungen (des gleichen Werte, e.g., eine Person in 2 IQ Tests) - 2 Stufen
- Streng parallel: Unkorreliertheit der Fehler beider Messungen plus Tau-Aequivalenz.
- Essentiell parallel: Unkorreliertheit der Fehler beider Messungen plus essentielle Tau-Aequivalenz.
Modell tau-aequivalenter Messungen (des gleichen Werte, e.g., eine Person in 2 IQ Tests) - 2 Stufen
Tau-aequivalent: Unkorrelierte Messfehler, wahre Werte gleich; Fehlervarianzen NICHT gleich
essentiell tau-aequivalent: wahrer Wert unterscheidet sich durch eine Konstante
Modell tau-kongenerischer Messungen (des gleichen Werte, e.g., eine Person in 2 IQ Tests) - 2 Stufen
Messfehler unkorreliert, Messungen haben verschiedene Einheiten (da wahre Werte lineare Transformation - additiv und multiplikativ verknuepft)
SEM - Grade der Äquivalenz von Messmodellen – Def. essentiell tau-äquivalente Messungen
Wie tau-äquivalente Messungen, aber Mitelwert kann um eine Konstante verschoben sein; note - dieses Modell ist das der Faktorenanalyse
SEM - warum werden korrekte Modelle wegen Fit-Indizes oft faelschlich abgelehnt?
Spezifische Annahmen oft auf Indikatoren fokussiert, von denen es oft viele gibt - Varianz der Einzelitems wirkt wie lautes weisses Rauschen, dass Theorie ueberdeckt
SEM - was ist Voraussetzung fuer Interpretation einzelner geschaetzter Parameter?
Modell muss insgesamt einer Pruefung standhalten
SEM - Analyse der geschaetzten Parameter mit Lisrel - was bekommen wir zur Verfuegung gestellt? (3 parts)
- unstandardisierten Parameter
- (teil-) standardisierte Lösung
- vollständig standardisierte Lösung
SEM - Lisrel output - Interpretation der unstandardisierten Parameter
Ladungen entsprechen z.B. unstandardisierten Regressions-Koeffizienten
SEM - Lisrel output - Interpretation der teil-standardisierten Parameter
standardisiert sind nur die latenten Variablen, nicht die Indikatoren
SEM - Lisrel output - Interpretation der vollständig standardisierten Parameter
Interpretation wie der Musterkoeffizienten der EFA als standardisierte Regressionskoeffi-zienten bzw. als Korrelationen (wenn Indikator nur auf einen Faktor laedt)
SEM - geschaetzte Parameter - Signifikanzpruefung?
Durch Standardfehler, t-Werte, Konfidenzintervalle; note - can only use w unstandardized estimates
SEM - geschaetzte Parameter - Interpretation der quadrierten multiplen Korrelationen der beobachteten Variablen?
Schätzungen der Reliabilität
SEM - Lisrel output - was sind die sogenannten Modofikationsindizes?
Geben für jeden auf Null fixierten Parameter an, welche Verbesserung für den χ²-Wert zu erwarten ist, wenn der betreffende Parameter freigesetzt würde.
SEM - Lisrel output - Modofikationsindizes - warum sind sie gefaehrlich?
geht gegen das Prinzip der CFA und ist ggf rein explorativ (that said - if value high, maybe you did get something wrong…)
Wie werden Itemwerte normalerweise zu einer Skala zusammengefasst?
Summe oder Mittelwert
Vier Ueberlegungen, wenn man ggf fehlende Werte in die Skalenbildung mit einzubeziehen kann
- viele items in der Skala
- homogene items
- geringe Konsequenzen der Verzerrung
- wenige fehlende Werte
Einbeziehung fehlender Werte in die Skalenbildung - was ist Obergrenze (Faustrege)
5%-10%; aber ist begruendungspflichtig, gilt nur bei guten Randbedingungen…
SPSS Befehl zur Berechnung von Skalenrohwerten
TRANSFORMIE-REN -> VARIABLE BERECHNEN -> FUNKTIONSGRUPPE: ALLE -> MEAN
Formel zur z-Transformierung einer Skala?
z = (X – M) / SD; M - mean, SD = stddev
SPSS Befehl zur z-Transformation?
im Menu DESKRIPTIVE STATISTIK -> DESKRIPTIVE STATISTIK
Wie funktoniert die IQ Skala?
Mittelwert 100, SD=15
Wie funktioniert die stanine Skala?
9 Auspraegungen, SD=2; Extremwerte werden bei den Polen 1 und 9 subsumiert
Wie funktioniert die Centil- oder C-Skala?
wie stanine, aber 11 pole (min=1, max=11)
Definition PR-Normen
Prozenrang-Normen (percent of respondent w value equal to or below vutoff)
SPSS Befehl zum Berechnen der Prozent-Raenge?
- TRANSFORMIEREN -> RANGFOLGE BILDEN
- Variablen auswaehlen
- RANGTYPEN -> PROZENTRÄNGE
welche mathematische Prozedur normalisiert PR-Werte?
Flaechentransformation
Vierfelder-Schema der kriterienorientierten Klassifikation - was sind die beiden Achsen?
- Klassifikation durch Test - Ja/Nein
2. Kriterium in Wahrheit erfuellt - ja/nein
Vierfelder-Schema der kriterienorientierten Klassifikation - wie heissen die 4 Felder
- Treffer/hit, RP
- Verpasser (miss), FN
- Falscher Alarm, FP
- Korrekte Ablehnung, RN
Vierfelder-Schema der kriterienorientierten Klassifikation - Def. Trefferquote
RP / (FN + RP) = Sensitivität (Anteil der richtig klassifi-zierten Personen unter allen Personen, die das Kriterium tatsächlich erfüllen)
Vierfelder-Schema der kriterienorientierten Klassifikation - Def. Verpasserquote
FN / (FN + RP) = 1 – Sensitivität (Anteil der falsch klassifizierten Personen unter allen Personen, die das Kriterium tatsächlich erfüllen)
Vierfelder-Schema der kriterienorientierten Klassifikation - Def Quote korrekter Ablehnungen
RN / (FP + RN) = Spezifität (Anteil der richtig klassifizierten Personen unter allen Personen, die das Kriterium nicht erfüllen)
Vierfelder-Schema der kriterienorientierten Klassifikation - Def Quote falscher Alarme
FP / (FP + RN) = 1 – Spezifität (Anteil der falsch klassifizierten Personen unter allen Personen, die das Kriterium nicht erfüllen)
Vierfelder-Schema der kriterienorientierten Klassifikation - welche Analyse-Methode hilft bei der Bestimmung der Schwellenwerte?
ROC-Analyse
Vierfelder-Schema der kriterienorientierten Klassifikation - was ist der Tradeoff bei der ROC Analyse?
Sensitivität und Spezifität
Welches Regelwerk ist in D-land wichtig fuer Testanwendung?
DIN 33430; Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen
Was sind die 3 traditionellen psychometrischen Guetekriterien?
Objektivität, Reliabilität und Validität; note - this author combines O and R
Objektivitaet - allgemeine Definition (i.e., wann ist ein Test objektiv)?
Ein Test ist in dem Ausmaß objektiv, in dem die Testergebnisse unabhängig vom Untersucher zustande kommen
Objektivitaet - 3 Teilanspekte?
- Durchführungs-Objektivität
- Auswertungs-Objektivität
- Interpretations-Objektivität
Durchführungs- Objektivität - Definition
das Ausmaß, in dem Testergebnisse frei von Schwankungen zw. Bedingungen unterschiedlicher Durchführungs-gelegenheiten zustande kommen
Auswertungs-Objektivität - Definition
das Ausmaß, indem verschiedene Auswerter desselben Testbogens zu denselben Ergebnissen kommen
Auswertungs-Objektivität - wann ist sie i.d.R. in Frage gestellt?
bei offenen Antwortformaten (aber - man kann immer mehrfach auswerten lassen, wenn das Ergebnis wichtig ist)
Interpretations-Objektivität - Definition
das Ausmaß der Übereinstimmung in der Interpretation bei gleichen Testergebnissen
Reliabilitaet - technische Definition (again)
Anteil der Varianz der „wahren Werte“ (lies: der systematischen Variation) an der gesamten Testvarianz
Reliabilitaet - warum ist sie in der Praxis weniger relevant?
In empirischen Reliabilitätsschätzungen lassen sich intendierte Varianz-Komponenten nicht von systematischen Fehlern unterscheiden (beide erhoehen gemessene Reliabilität)
Was sind 4 Arten der Reliabilitätsschätzung?
- interne Konsistenz
- Retest-Reliabilitaet
- Paralleltest-Reliabilität
- Interrater-Reliabilität
Reliabilitätsschätzung - at a high level, what exactly are we estimating?
Abschätzung des Wertes für rtt, d.h. der (nicht quadrierten!) Korrelation eines Tests mit sich selbst
Reliabilitätsschätzung - interne Konsistenz - Grundidee
Test einmal erhoben; Test aufgeteilt, so dass Test-Teile miteinander korreliert werden koennen
Reliabilitäts-Schätzung - interne Konsistenz - unter welchen Bedingungen ist sie problematisch?
- Heterogene Tests (verschiedene Aspekte eines Konstrukts)
2. Speed-Tests
Reliabilitäts-Schätzung - interne Konsistenz -Beziehung zur Homogenitaet (und deren Messung)?
be careful! Messung interner Konsistenz setzt Homogenitaet (Eindimensionalitaet) voraus, und umgekehrt koennen auch heterogene Tests intern konsistente Ergebnisse liefern…
Homogenitätsindex - wie laesst es sich messen (besser als durch interne Konsistenz)? 2 ideas
- mittlere Interitemkorrelation (MIC) sowie deren Streuung
2. PTT Modelltests
Reliabilitäts-Schätzung - interne Konsistenz - einfachste Implementierung?
Test-halbierungs- oder Split-Half-Reliabilität
Reliabilitäts-Schätzung - interne Konsistenz -Standardmass?
Cronbach’s alpha
Cronbachs alpha - was misst es logisch gesehen?
Mittelwert der Konsistenzkoeffizienten über alle denkbaren Aufteilungen des Tests
Cronbachs alpha - was ist die mess-theoretische Annahme?
Messungen sind tau-aequivalent
Cronbachs alpha, wo steht die Formel?
p173
Cronbachs alpha, wie lautet die Formel?
r/(c-1)*{1 -sum(Si-squared)/sum(Sx-squared)}
Si-squared: Varianz des Test-Teils
Sx-squared: Varianz der Gesamtwerts der Skala (rises w covariances)
c number of items
Cronbach’s alpha - was sind 2 Alternativen?
- Guttman
2. Kuder-Richardson 20 (KR-20)
Wann sollte man Guttman einsetzen (statt Cronbach alpha)?
wenn einzelne negative Kovarianzen zwischen Items auftreten, ohne dass Cronbach- insgesamt auffällig gering ausfällt
Wann sollte man Kuder-Richardson 20 (KR-20) einsetzen (statt Cronbach alpha)?
dichotome items
Retest-Reliabilität, basic idea
Test wird von der gleichen Gruppe von Personen zweimal bearbeitet
Retest-Reliabilität, biggest challenge
Wahl des geeigneten zeitli-chen Intervalls zwischen beiden Messzeitpunkten (too short - memory effects, too long - change in what we are trying to measure…)
Retest-Reliabilität - Faustregel fuer Zeitintervall zwischen Messungen?
4 Wochen - 6 Monate
Parallel-Test-Reliabilität, basic idea
Konstruktion zweier unabhaengiger aber paraleler Formen eines Tests. Einsatz bei der gleichen Stichprobe
Parallel-Test-Reliabilität, ist Schaetzung i.d.R. zu hoch oder zu niedrig?
Eher zu niedrig, da sowohl die Parallelität der Formen als auch die Konstanz der Durchführungsbedingungen kaum perfekt zu erreichen sind
Parallel-Test-Reliabilität, 2 thoughts on where and how often it is measured?
- generally rare, given effort required
2. Mainly used for IQ test (abschreiben verhindern…)
Interrater-Reliabilität - basic idea
Äquivalenz der Beurteilungen mit dem gleichen Verfahren getesteter Personen durch verschiedene Untersucher (link to objectivity!)
Interrater-Reliabilität - wo ist sie besonders wichtig?
bei weniger strukturierten Verfahren wie Interviews oder Beobachtungen
Interrater-Reliabilität - wofuer steht die Abkuerzung ICC?
Intraklassenkorrelation (intra-class correlation)
Interrater-Reliabilität - ICC - key idea?
Maß für den zwischen den Beurteilern geteilten Varianzanteil und liegt deshalb zwischen 0 und 1; aehnlich dem Cronbach alpha (mit Beurteilern als items)
Interrater-Reliabilität - ICC - wie kann man es mit SPSS aufrufen?
ANALYSIEREN -> SKALIERUNG -> RELIABILITÄTSANALYSE -> STATISTIKEN;
KORRELATIONS-KOEFFIZIENT IN KLASSEN
Reliabilitaetskoeffizienten - welche Hoehe muss man anzielen?
haengt davon ab
- Einsatz (wie folgenschwer?)
- Einzeldiagnostik vs Gruppe?
Reliabilitaets-Koeffizienten - welche Hoehe muss man anzielen - COTAN Schwellen?
1 (wichtige Einzelfall-Entscheidung): 80%
2. 70%
3 (Gruppen-Untersuchungen). 60%
Reliabilitaet und PTT - was wird hier gemessen?
die spezifische Objektivität (d.h. der Unabhängigkeit der Messwerte von der untersuchten Item- und Personenstichprobe)
Reliabilitaet und PTT - welche Theorie verallgemeinert das Reliabilitaets-Konzept der KTT auf die PTT?
Generalisierbarkeits-Theorie von Cronbach, Gleser, Nanda und Rajatnaram (1972)
Generalisierbarkeits-Theorie von Cronbach et al - wie oft wird sie eingesetzt
selten - hoher Aufwand; wenn ueberhaupt, dann Einsatz nur bei kriterienorientierten Tests
Validitaet - US Definition
the degree to which accumulated evidence and theory support specific inter-pretations of test scores entailed by proposed uses of a test
Validitaet - worauf bezieht er sich
nicht Test, sondern Schlussfolgerungen die ein Test erlaubt
Was sind die 3 Facetten der Validitaet?
(1) Inhalt
(2) Konstrukt
(3) externe Kriterien
Inhaltsvaliditaet - basic idea
Übereinstimmung der Testinhalte (d.h. der Items inkl. Stamm und Antwortvorgabe) mit dem zugrunde liegenden Merkmal des Tests
Inhaltsvaliditaet - bei welchem Schritt der Testentwicklung spielt es eine besondere Rolle?
Am Anfang - bei der Ableitung der Items aus dem definierten Merkmalsbereich
Konstruktvalidität - basic idea
Korrektheit der Interpretation von Testergebnissen als Indikatoren theoretischer Konstrukte
Konstruktvalidität - Cronabch’s Idee zur empirischen Umsetzung?
Nomologisches Netz bestehend aus
- Bereich der Theorie; - Bereich des Beobachtbaren
- logische Regeln die beide verbinden (und schrittweise Ueberpruefung der Regeln)
Konstruktvalidität - Cronbach’s Idee zur empirischen Umsetzung - praktische Einsatzfaehigkeit?
Gering; psychologische Theorien oft zu schwach und wenig formal
Konstruktvaliditaet: Cronbach’s 3 Strategien zur Ueberpruefung?
- logisch-argumentatives Vorgehen (a la Inhaltsvaliditaet)
- experimentelle Pruefung
- korrelative Analysen
Konstruktvaliditaet: 2 Facetten der konstrukt-bezogenen Evidenz?
- Faktorielle Validitaet
2. Konvergente/ diskriminante Validitaet
Konstruktvaliditaet: Definition faktorielle Validitaet
Bestätigung der intendierten faktoriellen Struktur eines Tests
Konstruktvaliditaet: faktorielle Validitaet - praktische Bestimmung
idealerweise - CFA, PTT
Praktisch - EFA
Konstruktvaliditaet: Beziehung zur Homogenitaet?
Homogenitaet normalerweise als positiv fur K-Validitaet angesehen; theoretisch angemeessen nur bei eindimensionalen Konstrukten
Konstruktvaliditaet: Was ist das Problem wenn man Conbach’s alpha zur Abschaetzung von Homogenitaet (und potentiell K-Validitaet) einsetzt?
can game the system - just ask (essentially) the same question many times - get you REALLY high C-alpha
Konstruktvaliditaet: Definition konvergente, diskriminante Validitaet?
Untersuchung der Korrelation mit Aussenvariablen
Konstruktvaliditaet: Idee konvergente Validitaet
ist Korrelation hoch wo sie (aus theoretischen Gruenden) hoch sein sollte?
Konstruktvaliditaet: Idee diskriminante Validitaet
ist Korrelation niedrig wo sie (aus theoretischen Gruenden) niedrig sein sollte?
Konstruktvaliditaet: Pruefung auf konvergente und divergente Validitaet - einfachster Fall?
bivariate Korrelationen, ideally inferenz-statistisch abgesichert
Konstruktvaliditaet: Pruefung auf konvergente und divergente Validitaet -Attenuations- oder Minderungskorrektur - basic idea
psychologische Tests sind nicht perfekt reliabel, latente Korrelation wird deshalb tendenziell unterschaetzt. counter- measure - Attentuations-Korrektur
Konstruktvaliditaet: Wer hat wann den klassischen Ansatz zur Pruefung der K-Validitaet entwickelt und wie heisst der Ansatz?
Campbell und Fiske (1959); Multi-Trait-Multi-Method Matrix (MTMM-Ansatz)
Konstruktvaliditaet: Multi-Trait-Multi-Method Matrix - basic idea
eine Mehrzahl von Konstrukten wird mit unterschiedlichen Methoden mehrfach gemessen
Konstruktvaliditaet: Multi-Trait-Multi-Method Matrix - 2 Durchfuehrungs-alternativen
- Korrelations-Analyse
2. CFA
Kriterienbezogene Validitaet: Definition
sämtliche Hinweise auf Validität aufgrund des beobachteten Zusammenhangs mit externen Variablen, für die theoretisch ein Zusammenhang zu erwarten ist
Kriterienbezogene Validitaet: prominente Beispiele
Schulerfolg, berufliche Leistung, korrekte Diagnose
Kriterienbezogene Validitaet: praktische Messung
bivariater Korrelationskoeffizient rtc
Kriterienbezogene Validitaet: Faustregeln fuer Abschaetzung der Effektstaerke bei Messwiederholung
schwach: r=0.1, d-0.2
mittel: r=0.3, d=0.5
stark: r=0.5, d= 0.8
Kriterienbezogene Validitaet: Definition Effektstaerke d - allgemein
d = (Mt1 - Mt2) / St.gesamt; St.gesamt = (N1 * St1 + N2 * St2) / (N1 + N2)
Kriterienbezogene Validitaet: Definition Effektstaerke d - Wiederholungsmessung
d = 2r / sqrt(1 - r²)
Kriterienbezogene Validitaet: Inkrementelle Validitaet - Definition
Beitrag, eines neuen Testz über bereits vorhandene zur Aufklärung des Kriteriums
Kriterienbezogene Validitaet: Inkrementelle Validitaet - praktische Messung
delta R-squared in einer hierarchischen Regression
Kriterienbezogene Validitaet: Inkrementelle Validitaet - Schwellen fuer Effektstaerke nach Cohen (1988)
schwach: 0.02
mittel: 0.15
stark: 0.35
Variable f-squared ist korrigiertes delta-R-squared
Soziale Erwunschtheit - zweo moegliche Gegenmassnahmen
- undurchschaubare items (subtile Items)
- Force choice zwischen gleichermassen erwuenscht erscheinenden Alternativen
- objektive Tests
Einzelfalldiagnostik -2 additional considerations
- Hoehere Anforderungen an Guetekriterien
2. Normierung (Vergleichbarkeit)
Einzelfalldiagnostik: Anforderungen laut COTAN an Groesse einer Norm-Stichprobe
L1: N=300
L2: N=200
L3: N=100
Einzelfalldiagnostik: 4 Dimensionen an Anforderungen re: Norm-Stichprobe
- Groesse
- Repraesentativitaet
- Aktualitaet der Erhebung
- Uebertragbarkeit auf die Fragestellung
Einzelfalldiagnostik: Konzept Norm-Differenzierung
unterschiedliche Normtabellen für unterschiedliche Subpopulationen, Fragestellungen, oder beides
Einzelfalldiagnostik
KEY FORMULAS P212
KTT - Definition Reliabilität
Quotient der Varianz des wahren Wertes und der Summe aus Varianz des wahren Werts und Varianz des Fehlers (immer
Definition Eigenwert
Spaltensumme der quadrierten Ladungen aller Faktoren fuer ein Item (in der Ladungsmatrix)
Definition Kommunalitaet
Zeilensumme der quadrierten Ladungen aller Items auf einen Faktor
Was ist die Interpretation des Eigenwertes?
Varianz des Faktors gemessen in Einheiten der Varianz des Items (n.b. – Itemvarianz in der PCA ist immer 1)
Eigenwert geteilt durch die Zahl der Items, Interpretation
Anteil der durch den Faktor aufgeklaerten Varianz des gesamten Tests
Bestimmung der Identifziertheit eines Modells - 3 Schritte
Schritt 1: berechne p*(p-1)/2, mit p=Zahl der manifesten Variablen;
Schritt 2: erfasse die Anzahl der zu schaetzenden Parameter: Anzahl der Faktoladungen plus Anzahl der Fehlervarianzen plus Varianzen der latenten Variablen plus Korrelationen zwischen latenten Variablen minus Zahl der Restriktionen (mindestens eine, da ja ein Faktorwert pro latenter Variable gleich 1 gesetzt werden muss);
Schritt 3: berechne die Zahl der Freiheitsgrade (#1 minus #2) – sollte groesser als Null sein – je groesser desto besser…!
Wir wird Itemschwierigkeit (Prozentwert) berechnet?
Transformiere Skala, so dass der Minimalwert Null ist und berechne den Mittelwert der transformierten Skala.
Dividiere den Mittelwert der Skala durch das Maximum und druecke als Prozentwert aus
EFA - wann liegt Strukturmatrix und Mustermatrix vor?
Wenn Faktoren korreliert sind
EFA - Strukturmatrix und Mustermatrix- Definition und Unterschiede
Strukturmatrix: enthält Korrelationen
Mustermatrix: Korrelationen sind auspartialisiert; Matrix enthält semipartialisierte Regressionsgewichte
EFA - korrelierte Faktoren- wie berechne ich die Kommunalität?
Mit der Mustermatrix!
Was ist die Fundamental- Gleichung der Faktoranalyse?
R=L•L’+V
R - Varianz der wahren Werte
L - Ladungsmatrix
V - Fehlervarianz
Inhaltlich, welche Frage beantwortet ein semipartielles standardisiertes Regressionsgewicht?
Um wieviele Standardanweichungen aendert sich die y Variable wenn sich die x Variable um eine Standard-Abweichung veraendert
Was enthält die Strukturmatrix?
Korrelationen der Items mit den Faktoren (NICHT auspartialisiert)
Was enthält die Mustermatrix?
Die partiellen standardisierten Regressionsgewichte der items mit den Faktoren
Wie berechnet man den Kaiser-Meyer-Olkin (KMO) Koeffizient (3 Schritte)?
- Berechne die Korrelationsmatrix aller items. Summiere alle Elemente oberhalb der Hauptdiagonale (i.e., alle quadrierten Korrelationskoeffizienten)
- Berechne die Matrix der quadrierten Partialkorrelationskoeffizienten aller Items
- Dividiere Ergebnis von 1 durch Summe Ergebnis von 1 und Ergebnis von 2.
interpretation: Min(KMO)=0, wenn Korrelationen Null. Max(KMO)=1, wenn Partialkorrelationen null/sehr klein (i.e., spezifische Varianzanteile sehr klein