4. Exploratorische Faktorenanalyse Flashcards
Nenne die Ziele einer Faktorenanalyse
- möglichst viel Information
- möglichst wenige latente Faktoren
–> Hypothesengenerierung
Korrelationen zwischen Items geben Aufschluss über __________
Homogenität
wieso werden Faktorenanalysen eingesetzt?
EFFEKTIV
weniger auwändig als einzelne Korrelationen zu beurteilen
Definiere “Faktorenanalyse”
heuristisches Instrument zur Identifizierung homogener Itemgruppen
Im Gegensatz zur Konfirmatorischen Faktorenanalyse dient die Exploratorischen Faktorenanalyse der…
- erstmaligen Datenreduktion
- Überprüfung der Daten
- Hypothesengenerierung
=> Möglichmachen der konfirmatorischen Testung
Wieso sollte die EFA nicht Ende des Forschungsprozesses sein?
Gefahr: “Overfitting”
Faktorstruktur kein Beleg dafür, dass Faktorwert __________________ ist
Ausdruck des latenten Konstrukts
Nenne die Voraussetzungen einer exploratorischen Faktorenanalyse
Substanzielle Korrelationen
Unverzerrte und lineare Zusammenhänge
Hinreichend große Itemanzahl und Stichprobe
intervallskalierte Variablen
Wie kann geprüft werden, dass “Substanzielle Korrelationen” vorliegen?
- KMO-Kriterium
- Bartlett-Test
Nenne die Nullhypothese des Bartlett-Tests.
H0 = alle Korrelationen sind null
also Signifikanz –> es liegt mind. eine Korrelation vor
Was für einen KMO-Koeffizienten kann man erwarten bei großer Partialkoeffizienten?
kleiner KMO-Koeffizient
Was ist eine “hinreichend große Itemanzahl und Stichprobe”?
Items x 5 = Minimum
N>100
Pro Faktor mind. 4 Items
Nenne die Ausnahmen für “Linearität”
nicht adäquat:
schwach monotone und kurvilineare Verläufe
Nenne eine Alternative (statt Faktorenanalyse) für kategorial-geordnete Daten.
Mplus
Wie kann man “unverzerrte Zusammenhänge” als Voraussetzung überprüfen?
- Identifikation von Ausreißern (inhaltlich und statistisch)
- Prüfung der Histogramme jeder Variablen (Unterschiedliche Itemverteilungen?)
Was ist bei unterschiedlichen Itemverteilungen sinnvoll?
Logarithmierung
Nenne die zwei Arten von geometrischen Modellen
Personenraum
Faktorenraum
Beschreibe die Achsen und Punkte im Personenraum
Achsen: n Versuchspersonen
Punkte: m items
Beschreibe die Achsen und Punkte im Faktorenraum
Achsen: q Faktoren
Punkte: m Items
Personenraum: Der ___________ (von beiden Probanden) bestimmt die Lage der Punkte im Personenraum
Schnittpunkt der Werte
Faktorenraum: nenne die zwei Arten der Rotation
Orthogonale Rotation
Oblique Rotation
Faktorenraum: Orthogonale Rotation
Winkel zwischen Itemvektoren und einer Achse möglichst gering, mit anderen Achsen (möglichst) im 90° Winkel (Einfachstruktur)
Faktorenraum: Oblique Rotation
Faktoren dürfen korrelieren (Winkel ungleich 90°)
Definiere die “Faktorladung” bei einer orthogonalen Rotation
Korrelation zwischen einem Item und einem Faktor
Definiere die “Faktorladung” bei einer obliquen Rotation
Partielle standardisierte Regressionsgewichte
Definiere “Kommunalität” (orthogonale Rotation)
aufgeklärte Varianz (quadrierte Ladungen) eines Items über alle extrahierten Faktoren
Definiere “Kommunalität” (oblique Rotation)
aufgeklärte Varianz (quadrierte Ladungen) eines Items über alle extrahierten Faktoren
inkl. Faktorinterkorrelation
Je höher die __________ eines Items, desto besser wird ein Item durch die Faktoren repräsentiert
Kommunalität
Worauf bezieht sich der Begriff “Einfachstruktur”?
Struktur der Faktorladungsmatrix
Definiere “Einfachstruktur”
Partielle standardisierte Regressionsgewichte eines Items…
- auf einem Faktor sehr hoch
- auf den restlichen Faktoren nahe 0
Definiere “Eigenwert”
wieviel Varianz ein Faktor an allen Items aufklärt
Was ändert sich durch Rotation?
Die eigenwerte der einzelnen Faktoren
NICHT die Gesamtvarianz aller Items
Definiere “Faktorwert”
Wert einer Person auf einem Faktor
Definiere “Spezifizität”
systematische Varianz eines Items, die durch nur einen Faktor erklärt wird
Varianz eines Items in der Faktorenanalyse =
Kommunalität + Spezifität + Messfehler
Was verursacht das Kommunalitätsproblem?
Die EINZIGARTIGKEIT der Items
- -> Faktorenmodell kann Korrelationsmatrix nicht perfekt replizieren
- -> Kommunalitäten müssen geschätzt werden
Wo findet man die Kommunalitäten?
Replizierte Werte der Hauptdiagonalen
Welche Methode?
Ziel: reine Dimensionsreduktion
Hauptkomponentenanalyse
Welche Methode?
Ziel: Beziehungsmuster zwischen Variablen erklären
Hauptachsenanalyse
Maximum-Likelihood-Verfahren
Hauptachsen- und Hauptkomponentenanalyse :
Beschreibe den Rechenvorgang
RECHNERISCH GLEICH
- Einsetzen der Anfangskommunalitäten in die Diagonale der Korrelationsmatrix
- Extraktion der voreingestellten Faktorenanzahl
- Kommunalität wird über Summation der quadrierten Ladungen neu ermittelt. (Diese Schätzung sei näher an der „wahren“ Kommunalität)
- Dieser Prozess wird wiederholt bis der Unterschied zwischen zwei aufeinander folgenden Kommunalitätsschätzungen gering ist
- Abbruchkriterium
Hauptachsenanalyse: Ziel?
Zusammenhänge zwischen Items auf latente Variable zurückführen
Hauptkomponentenanalyse: Ziel?
viel Information, wenige Faktoren
Wie unterscheidet sich die Hauptachsenanalyse von der Hauptkomponentenanalyse?
Hauptachsenanalyse: gemeinsame Varianz
Hauptkomponentenanalyse: GESAMTVARIANZ
Hauptachsenanalyse: ANFANGSKOMMUNALITÄTEN?
quadrierte multiple Korrelation
Hauptkomponentenanalyse: ANFANGSKOMMUNALITÄTEN?
1
Hauptachsenanalyse: PROBLEM?
Unterschätzung der Reliabilität
Hauptkomponentenanalyse: PROBLEM?
Überschätzung der Reliabilität
Hauptkomponentenanalyse: ANWENDUNG?
nur bei Tests mit hoher Reliabilität
Hauptkomponenten sind keine _________________
latenten Variablen
Hauptkomponentenanalyse: Vorteil?
unkomplizierte Methode, die immer Lösung herbeiführt
Maximum-Likelihood-Verfahren: Interpretation?
Wie lässt sich die „Ursache“ in der Grundgesamtheit bezeichnen, die für die Korrelationen zwischen den Items verantwortlich ist?
Nenne die Voraussetzungen des Maximum-Likelihood-Verfahrens?
- Ausreichend große Stichproben
* Multivariate Normalverteilung (AMOS)
Wie heißt der Modelltest des MLV?
χ 2 -Test:
das angenommene Modell anzunehmen oder zu verwerfen
Maximum-Likelihood-Verfahren:
auf was wird die Anfangskommunalität gesetzt?
Quadrierte multiple Korrelation des Items mit allen anderen Items
MAXIMUM-LIKELIHOOD-VERFAHREN:
Wie wird die Anzahl der Faktoren bestimmt?
Goodness-of-Fit-Test (significant Extraktion eines weiteren Faktors)
MAXIMUM-LIKELIHOOD-VERFAHREN:
Anwendung?
- Bei Normalverteilung
* Wenn Rückschlüsse auf die Struktur in einer Population gezogen werden sollen
Wie viele Faktoren sollen extrahiert werden?
Nenne die zwei Aspekte die hier berücksichtigt werden sollen.
- Inhaltliche Plausibilität der Faktoren
* Wie gut reproduzieren die Ladungen der Faktoren die beobachtete Korrelationsmatrix?
Nenne die 2 A PRIORI Methoden die zur Bestimmung der Faktorenanzahl zur Verfügung stehen
- hypothetisches Modell
2. Ausmaß der Varianzaufklärung
Nenne die 4 A POSTERIORI Methoden die zur Bestimmung der Faktorenanzahl zur Verfügung stehen
- Eigenwert >1
- Scree-Plot
- Parallelanalyse
- MAP-Test
Scree-Plot nach…
Cattell
Parallelanalyse nach…
Horn
Erfasse kurz die Methode “Hypothetisches Modell” zur Faktorenbestimmung
theoriegeleitet
begründung, warum nicht KFA berechnet wird???
Erfasse kurz die Methode “Ausmaß der Varianzaufklärung” zur Faktorenbestimmung
a priori festlegung wie viel Gesamtvarianz mind. aufgeklärt werden soll
Erfasse kurz die Probleme die bei der Methode “Eigenwert > 1” zur Faktorenbestimmung, auftreten können
- Kommunalität eines Items kann niedrig sein, obwohl Fragebogen-Item reliabel ist
- Eher Überschätzung
Erfasse kurz die Methode “Scree-Plot”
– Knick im Scree-Plot (von links nach rechts)
– Eigenwerte VOR dem Knick = mitgezählt
– Knickpunkt selber nicht
(vor Rotation)
Nenne das Problem mit der Scree-Plot Methode
Subjektivität
Erfasse kurz die Methode “Parallelanalyse”
Simulation von Eigenwerten aus normalverteilten Zufallsvariablen.
Extraktion: Faktoren, mit Eigenwerten über den zufällig erzeugten Eigenwert
Besschreibe den Vorgang des MAP-Tests
- Auspartialisieren der ersten Komponente aus den Korrelationen zwischen den Items.
- Ermittlung der mittleren quadrierten Partialkorrelation der Residualmatrix.
- Auspartialisierung der 2. Komponente aus der Residualkorrelationsmatrix.
- Wiederholung, bis keine weitere Reduktion
- Anzahl = wo sich die niedrigste mittlere quadrierte Partialkorrelation ergibt
Welche Methoden zur Bestimmung der Faktorenanzahl sind EMPFOHLEN?
MAP-Test
Parallel-Analyse
(mehrere Extraktionskriterien sinnvoll)
Faktorenanzahl:
______________ ist problematischer als ______________
- Unterfaktorisierung
2. Überfaktorisierung
Was ist das Ziel der Rotation?
möglichst eindeutige Beschreibung der Items durch die Faktoren
= EINFACHSTRUKTUR
Wie unterscheiden sich oblique und orthogonale Rotationen?
orthogonal: Unkorreliertheit der faktoren bleibt erhalten (rechtwinklig)
oblique: Korreliertheit der Faktoren bleibt erhalten
(schiefwinklig)
Nenne die drei Methoden zur orthogonalen Rotation
VARIMAX
QUARTIMAX
EQUIMAX
Nenne die drei Methoden zur obliquen Rotation
DIRECT OBLIMIN
DIRECT QUARTIMIN
PROMAX
Welche der orthogonalen Rotationstechniken wird am häufigsten angwandt?
VARIMAX
Welche der obliquen Rotationstechniken wird am häufigsten angwandt?
DIRECT QUARTIMIN
Für oblique Rotationen werden zwei unterschiedliche Matrizen angegeben:
Nennen Sie sie
Mustermatrix
Strukturmatrix
Erfasse den Unterschied zwischen Mustermatrix und Strukturmatrix
Mustermatrix: partielle standardisierte Regressionsgewichte der Items auf den Faktoren
Strukturmatrix: Korrelationen zwischen Items und den Faktoren
Welche Faktorenlösung ist leichter zu interpretieren?
Orthogonal oder Oblique?
Orthogonal
wieso würde eine oblique rotation manchmal zwingend sein?
theorie
korrelierte Faktoren angenommen