Exploratorische Faktoranalyse (EFA) Flashcards

1
Q

Zweck

A
  • Datenreduktion

- Prüfung der Konstruktvalidität bei Fragebögen und Tests

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

exploratorische FA

A

für Hypothesengenerierung

Angewendet, wenn keine Hypothesen

  • zur Art und Anzahl von Faktoren vorliegen
  • zur Zuordnung beobachteter Variablen zu einem Faktor

Grundidee:
- Items werden latenten Dimensionen (Faktoren) anhand ihrer Antwortähnlichkeit (Korrelation) zugeordnet

–> d.h. Iteminformationen mit weniger Faktoren beschrieben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

konfirmatorische FA

A

für Hypothesenprüfung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Faktorladungen

A

Korrelationen zwischen dem Item und dem neugebildetem Faktor.
ODER
wie stark wird die Variation im item durch den Faktor erklärt
ODER
Zusammenfassung zwischen der Antwort auf dem item und der Ausprägung die dieselbe Person auf dem Faktor hat.

  • Ausmaß, wie stark die Ausprägung der Itemantwort von einem oder mehreren Faktoren beeinflusst wird
  • Bei unkorrelierten Faktoren: Korrelation Item Faktor
  • Bei korrelierten Faktoren: semipartielles Regressionsgewicht

durch mathematische Prozeduren werden Faktoren extrahiert, Variation in den Items jeweils durch einen Faktor erklärt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definitionsgleichung

A

Standardisierte Messung einer Person auf einem Item = Summe der gewichteten Faktorwerte + Fehlerterm

zvi = λ i1 f v1 + λ i2 f v2 + … + λ iq f vq + ε vi

λ = Faktorladung
f = Faktorwert
ε = Fehlerterm
zvi = z Wert einer Person v auf einem Item i
λi1 = Ladung der Items i auf Faktor 1
fv1 = Faktorwert der Person v auf Faktor 1
λi2 = Ladung der Items i auf Faktor 2
fv2 = Faktorwert der Person v auf Faktor 2
εvi = Fehler der Person v bei der Messung des Items i
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Faktorwert

A

Ausprägung einer Person auf einem Faktor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Eigenwert eines Faktors

A

Hinweis auf die “Wichtigkeit”

  • die durch den Faktor erklärte Varianz
  • Bei unkontrollierten Faktoren: Summe der quadrierten Faktorladungen aller Variablen

niedriger Eigenwert: irrelevante Faktoren
je höher, desto relevanter der Faktor

“Summe der quadrierten Faktorladungen über alle Itmes hinweg”

• Relativer Anteil, den ein Faktor an der gemeinsamen Varianz aller
Items aufklärt (PFA)
• Relativer Anteil, den eine Komponente an der Gesamtvarianz aller Items aufklärt (PCA)
• PCA: wenn größer 1 erklärt Faktor mehr Varianz als eine Variable
(für Abbruchskriterium wichtig)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Kommunalität einer Variable

A

– die durch alle Faktoren aufgeklärte Varianz einer Variable
– Bei unkorrelierten Faktoren: Summe der quadrierten Ladungen über alle Faktoren

“Summe der quadrierten Faktroladungen über alle Faktoren hinweg”

  • bei PCA maximal 1
  • bei PFA maximal so groß wie Reliabilität der Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Einzigartigkeit (Uniqueness)

A
  • 1-h2
    (h2 = Kommunalität)
    -Varianz eines Items , die das Item mit keinem anderen teilt
    -Setzt sich aus Spezifität systematischer Varianzanteil, der nicht durch andere Faktoren erklärt werden kann ) und Messfehler des Items zusammen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erforderliche Festlegungen

A

1 Extraktionsmethode
2 Abbruchkriterium
3 Rotationsmethode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Extraktionsmethoden

A

Am häufigsten

  • Hauptkomponentenanalyse
  • Hauptachsenanalyse
  • Maximum- Likelihood- Faktorenanalyse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hauptkomponentenanalyse (principal component analysis: PCA)

A

obwohl relativ unrealistische Annahmen gemacht werden, ist die Hauptkomponentenanalyse immerhin relativ häufig in der Literatur eingesetzt, rechnerisch einfacher als andere Formen der Varianzanalyse, in Statistik Programmen meisten das default Programm.

(als Kreis dargestellt, με κομματακια)
Gesamtvarianz besteht aus Faktor 1,2,3,4,…. + nicht extrahierte Faktoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hauptachsenanalyse (principal axes factor analysis: PFA)

A
  • Annahme: Variablen enthalten auch Varianz durch Messfehler
  • Ziel: Identifikation latenter Konstrukte
  • Faktoren erklären Beziehung der Variablen (wahre Varianz, nicht die gesamte vrianz wie vorher, deswegen geringer)
  • Schätzung der wahren Varianz (= Reliabilität) einer Variable (meist quadrierte multiple Korrelation jeder einzelnen Variablen mit allen anderen Variablen)
  • unerklärter Varianzanteil enthält systematische und unsystematische Varianz (Messfehler hier enthalten)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Maximum- Likelihood (ML)

A
  • Ziel: latente Faktoren als Ursache für Korrelation in der Population aufdecken
  • Schätzt aus Stichprobenkorrelationsmatrix Populationsmatrix (aus dieser werden dann die Faktoren extrahiert)
  • Erfordert große Stichprobe und multivariate Normalverteilung der Variablen
  • Möglichkeit zu Modelltest χ2- Test ) (Vorteil der Methode, man kann überprüfen, ob die Faktorenstrukur der Datenstruktur entspricht
  • H0 : Das Modell passt zu den Daten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Abbruchkrieterium

A
  • Anzahl der Faktoren festlegen
  • nicht triviale Faktoren (Informationsverdichtung könnten wir so nicht erreichen)
  • Kaiser Kriterium:
  • alle Faktoren mit Eigenwert > 1, erklären mehr Varianz als eine Variable
  • Problem: häufig Überschätzung der Faktorenzahl, da zufällig Eigenwerte > 1 möglich

•Scree Test/ Screeplot (grafisch) :

  • Eigenwerte der Faktoren gegen Faktorenzahl abgetragen (nach Größe)
  • -> alle Faktoren vor dem Knick extrahiert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Abbruchkriterium: Parallelanalyse

A

-Vorgehen:

  1. Zufallsdaten generiert (z.B. 1000 Datensätze)
    - die den empirischen Daten entsprechen
  2. Extrahieren von Faktoren
  3. Alle Faktoren extrahieren,

wenn empirische Eigenwerte > gemittelte Eigenwerte aus Parallelanalyse oder

wenn empirische Eigenwerte > 95 . Perzentil der zufällig erzeugten Eigenwerte