Exploratorische Faktoranalyse (EFA) Flashcards
Zweck
- Datenreduktion
- Prüfung der Konstruktvalidität bei Fragebögen und Tests
exploratorische FA
für Hypothesengenerierung
Angewendet, wenn keine Hypothesen
- zur Art und Anzahl von Faktoren vorliegen
- zur Zuordnung beobachteter Variablen zu einem Faktor
Grundidee:
- Items werden latenten Dimensionen (Faktoren) anhand ihrer Antwortähnlichkeit (Korrelation) zugeordnet
–> d.h. Iteminformationen mit weniger Faktoren beschrieben
konfirmatorische FA
für Hypothesenprüfung
Faktorladungen
Korrelationen zwischen dem Item und dem neugebildetem Faktor.
ODER
wie stark wird die Variation im item durch den Faktor erklärt
ODER
Zusammenfassung zwischen der Antwort auf dem item und der Ausprägung die dieselbe Person auf dem Faktor hat.
- Ausmaß, wie stark die Ausprägung der Itemantwort von einem oder mehreren Faktoren beeinflusst wird
- Bei unkorrelierten Faktoren: Korrelation Item Faktor
- Bei korrelierten Faktoren: semipartielles Regressionsgewicht
durch mathematische Prozeduren werden Faktoren extrahiert, Variation in den Items jeweils durch einen Faktor erklärt.
Definitionsgleichung
Standardisierte Messung einer Person auf einem Item = Summe der gewichteten Faktorwerte + Fehlerterm
zvi = λ i1 f v1 + λ i2 f v2 + … + λ iq f vq + ε vi
λ = Faktorladung f = Faktorwert ε = Fehlerterm
zvi = z Wert einer Person v auf einem Item i λi1 = Ladung der Items i auf Faktor 1 fv1 = Faktorwert der Person v auf Faktor 1 λi2 = Ladung der Items i auf Faktor 2 fv2 = Faktorwert der Person v auf Faktor 2 εvi = Fehler der Person v bei der Messung des Items i
Faktorwert
Ausprägung einer Person auf einem Faktor
Eigenwert eines Faktors
Hinweis auf die “Wichtigkeit”
- die durch den Faktor erklärte Varianz
- Bei unkontrollierten Faktoren: Summe der quadrierten Faktorladungen aller Variablen
niedriger Eigenwert: irrelevante Faktoren
je höher, desto relevanter der Faktor
“Summe der quadrierten Faktorladungen über alle Itmes hinweg”
• Relativer Anteil, den ein Faktor an der gemeinsamen Varianz aller
Items aufklärt (PFA)
• Relativer Anteil, den eine Komponente an der Gesamtvarianz aller Items aufklärt (PCA)
• PCA: wenn größer 1 erklärt Faktor mehr Varianz als eine Variable
(für Abbruchskriterium wichtig)
Kommunalität einer Variable
– die durch alle Faktoren aufgeklärte Varianz einer Variable
– Bei unkorrelierten Faktoren: Summe der quadrierten Ladungen über alle Faktoren
“Summe der quadrierten Faktroladungen über alle Faktoren hinweg”
- bei PCA maximal 1
- bei PFA maximal so groß wie Reliabilität der Variablen
Einzigartigkeit (Uniqueness)
- 1-h2
(h2 = Kommunalität)
-Varianz eines Items , die das Item mit keinem anderen teilt
-Setzt sich aus Spezifität systematischer Varianzanteil, der nicht durch andere Faktoren erklärt werden kann ) und Messfehler des Items zusammen
Erforderliche Festlegungen
1 Extraktionsmethode
2 Abbruchkriterium
3 Rotationsmethode
Extraktionsmethoden
Am häufigsten
- Hauptkomponentenanalyse
- Hauptachsenanalyse
- Maximum- Likelihood- Faktorenanalyse
Hauptkomponentenanalyse (principal component analysis: PCA)
obwohl relativ unrealistische Annahmen gemacht werden, ist die Hauptkomponentenanalyse immerhin relativ häufig in der Literatur eingesetzt, rechnerisch einfacher als andere Formen der Varianzanalyse, in Statistik Programmen meisten das default Programm.
(als Kreis dargestellt, με κομματακια)
Gesamtvarianz besteht aus Faktor 1,2,3,4,…. + nicht extrahierte Faktoren
Hauptachsenanalyse (principal axes factor analysis: PFA)
- Annahme: Variablen enthalten auch Varianz durch Messfehler
- Ziel: Identifikation latenter Konstrukte
- Faktoren erklären Beziehung der Variablen (wahre Varianz, nicht die gesamte vrianz wie vorher, deswegen geringer)
- Schätzung der wahren Varianz (= Reliabilität) einer Variable (meist quadrierte multiple Korrelation jeder einzelnen Variablen mit allen anderen Variablen)
- unerklärter Varianzanteil enthält systematische und unsystematische Varianz (Messfehler hier enthalten)
Maximum- Likelihood (ML)
- Ziel: latente Faktoren als Ursache für Korrelation in der Population aufdecken
- Schätzt aus Stichprobenkorrelationsmatrix Populationsmatrix (aus dieser werden dann die Faktoren extrahiert)
- Erfordert große Stichprobe und multivariate Normalverteilung der Variablen
- Möglichkeit zu Modelltest χ2- Test ) (Vorteil der Methode, man kann überprüfen, ob die Faktorenstrukur der Datenstruktur entspricht
- H0 : Das Modell passt zu den Daten
Abbruchkrieterium
- Anzahl der Faktoren festlegen
- nicht triviale Faktoren (Informationsverdichtung könnten wir so nicht erreichen)
- Kaiser Kriterium:
- alle Faktoren mit Eigenwert > 1, erklären mehr Varianz als eine Variable
- Problem: häufig Überschätzung der Faktorenzahl, da zufällig Eigenwerte > 1 möglich
•Scree Test/ Screeplot (grafisch) :
- Eigenwerte der Faktoren gegen Faktorenzahl abgetragen (nach Größe)
- -> alle Faktoren vor dem Knick extrahiert