Faktoranalyse Flashcards

Vorbereitung für den Präsenztest Faktoranalyse (Statistik II)

1
Q

Was ist ein Index und wofür braucht man ihn?

A

x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie erstellt man einen gewichteten Index?

A
  1. Voraussetzungen prüfen: corr var1 var2 var3; fre var1; fre var2; fre var3
  2. Variablen präfigieren: cap drop präfix*; gen präfixvarname = oldvarname
  3. Missing values umcodieren: recode präfix* (missing =.)
  4. Index erstellen: gen index = faktorpräfixvar1 + faktorpräfixvar2 + faktor*präfixvar3
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie z-standardisiert man eine Variable bzw. eine schon präfigierte Variablenliste?

A

cap drop zvar
egen zvar = std(oldvar)

cap drop zpräfix*
egen zpräfixvar1 = std(präfixvar1)
egen zpräfixvar2 = std(präfixvar2)…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Für welche Probleme und Variablen ist die Faktoranalyse geeignet?

A
  • Datenreduktion -> senkt Multikollinearität und reduziert Messfehler
  • hochkorrelierte Daten werden zu Messinstrument zusammengefasst
  • Gewichtung kann empirisch erfolgen (trotzdem theoretisch fundiert!)
  • Ziel: latente Konstrukte operationalisieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist ein Faktor?

A
  • Formelzeichen: Fi
  • gemeinsames latentes Konstrukt, welches Varianz auf mehreren Indikatoren beeinflusst
  • kann also Antwortverhalten bei mehreren Fragen erklären
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist eine Faktorladung?

A
  • Formelzeichen bii (erst Item, dann Faktor)

- gibt an, mit welchem Gewicht der Faktor auf jeweiligen Indikator wirkt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist die Kommunalität?

A
  • Formelzeichen: h2 (h Quadrat)
  • Anteil der Varianz eines Indikators, der durch Faktoren erklärt wird
  • Formel: Faktorladungen quadrieren und aufsummieren
  • oder: h2 = 1 - U
  • Wertebereich 0 bis 1, bei 1 wird die Varianz des Indikators vollständig durch den Faktor erklärt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Uniqueness?

A
  • Formelzeichen Ui
  • andere Aspekte neben dem Faktor, die Indikator beeinflussen (Restvarianz)
  • Alternativerklärungen und/ oder Messfehler
  • gilt nur für einen Indikator
  • ist unabhängig vom Faktor
  • verschiedene unique Komponenten sind voneinander unabhängig
  • Formel: U = 1 - h2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie berechnet man die Korrelation aus den Faktorladungen im orthogonalen Fall?

A
  • Achtung: man kann immer nur die Korrelation zwischen zwei Variablen berechnen! (ansonsten nur durchschnittliche Korrelation)
  • r (var1, var2) = (b11 x b21) + (b12 x b22)
  • beim Vergleich der modellimplizierten Korrelation mit der empirisch beobachteten Korrelation müssten kleine Unterschiede zu sehen sein => das liegt daran, dass bei modellimplizierter Korrelation die uniquen Komponenten komplett außer Acht gelassen wurden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie berechnet man Kommunalität und Uniqueness?

A
  • h = b11Quadrat + b12Quadrat

- U = 1 - h

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist die PCA und wofür verwendet man sie

A
  • Hauptkomponentenanalyse

- um zu entscheiden, wie viele Faktoren extrahiert werden sollen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche sind die drei Kriterien, um zu entscheiden, wie viele Faktoren extrahiert werden?

A
  1. Kaiser-Gutmann-Kriterium: die Komponenten extrahieren, die Eigenvalue von über 1 haben, damit eine Datenreduktion stattfindet
  2. Screeplot
    pca varlist
    scree
    scree, yline(1)
    die Faktoren extrahieren, die vor dem Knick kommen
  3. cumulative proportion-Kriterium:
    die Faktoren extrahieren, bei denen cumulative proportion 0,6 überschreitet (ab 0,5 akzeptabel in Umfrageforschung; eig 0,9)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist der Kaiser-Meyer-Olkin-Koeffizient und wie kann er interpretiert werden?

A

pca varlist
estat kmo
- gibt an, wie stark die Indikatoren mit den jeweils anderen Indikatoren korrelieren
- sollte min. 0,8 sein
- Indikatoren ausschließen, deren KMO unter 0,8 ist
- unter 0,5 inakzeptabel, weil dann zu starke partiale Korrelation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche faktoranalytischen Verfahren gibt es und wie unterscheiden sie sich?

A

PCF: unterschätzt Uniqueness, überschätzt Kommunalität
fac varlist, pca

PF: Schätzung der Kommunalität über R2, überschätzt Uniqueness, unterschätzt Kommunalität
fac varlist, pf

IPF: Schätzung der Kommunalität wird immer wieder wiederholt –> weder Unter- noch Überschätzung
fac varlist, ipf fac(#)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welches Ziel verfolgt die Rotation

A
  • Faktorladungen so verändern, dass Einfachstruktur hergestellt wird
  • leichtere Interpretierbarkeit der Faktoren ermöglichen
  • Kommunalität und Uniqueness der einzelnen Variablen bleiben gleich, nur Faktorladungen werden verändert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist eine Einfachstruktur?

A
  • Idealtyp: jede Variable lädt auf einem Faktor 1 und auf allen anderen Faktoren 0
  • Regelfall: jede Variable lädt auf einem Faktor hoch (über 0.5) und auf den anderen niedrig (unter 0.2)
  • Markervariable ist Anhaltspunkt für Interpretation des Faktors
17
Q

Was ist der Unterschied zwischen obliquer und orthogonaler Rotation?

A
  • bei obliquer Rotation wird Korrelation zwischen Faktoren zugelassen (Promax [rot, pro], Direct Quartimin [rot, oblique quartimin])
  • bei orthogonaler Rotation wird keine Korrelation zwischen Faktoren zugelassen (Varimax [rot, horst], Quartimax)
  • Kriterium für Obliqueheit:
    rot, pro
    estat common
    wenn Korrelation über 0.15 ist –> oblique Rotation beibehalten
18
Q

Welche Variablen sind nach der Rotation als problematisch anzusehen?

A
  • Kreuzladungen mit DIfferenz < 0.2

- Uniqueness > 0.8 falls Variablen ausgeschlossen wurden

19
Q

Welche Maßnahmen zur Herstellung einer Einfachstruktur gibt es?

A
  • Variablen ausschließen
  • Variablen hinzunehmen (eher nicht)
  • geeignete Rotationstechnik wählen
  • Faktor weniger extrahieren
20
Q

Worauf muss man bei der inhaltlichen Interpretation der Faktoren achten?

A
  • Markervariablen
  • Polung der Variablen
  • Polung der Faktoren
  • negatives Vorzeichen evtl.
21
Q

Wie berechnet man die Anteile der Gesamtvarianz oder gemeinsamen Varianz, die durch die Faktoren erklärt werden?

A
  • im obliquen Fall:
    Gesamtvarianz: (variance von fac 1/ proportion von fac1) / Variablenanzahl
    Gemeinsame Varianz: Proportion der Faktoren ablesen
  • im orthogonalen Fall:
    Gesamtvarianz:
    Gemeinsame Varianz: Proportion der Faktoren ablesen
22
Q

Was ist der Unterschied zwischen Pattern- und Structure-Matrix im obliquen Fall? (Im orthogonalen Fall gibt es keinen Unterschied)

A
  • Structure Matrix gibt Korrelationen zwischen den Faktoren und Variablen an
    [estat structure]
  • Pattern Matrix gibt die Faktorladungen an
    [Rotationsoutput]

????

23
Q

Was ist das Ziel des Scorings?

A
  • durch empirische Gewichtung wird neues Messinstrument erstellt
  • Faktorwerte für eine Untersuchungseinheit vorhersagen können
24
Q

Was ist der Unterschied zwischen dem Regressionsansatz und dem Barlettansatz? (Scoring)

A
  • Bartlett gewichtet Kommunalitäten stärker und diskriminiert Uniqueness
25
Q

Was ist der Unterschied zwischen Faktorladungen und Scores?

A
  • Faktorladung gibt Zusammenhangsstärke zwischen Variable und Faktor an
  • Score gibt Faktorladungen + modellimplizierte Erwartungswerte + Kovarianzen (Leichtigkeitsparameter)
26
Q

Was bedeutet ein Score von 0? Was bedeutet ein positiver bzw. negativer Score?

A
  • ein Score von 0 bedeutet durchschnittliche Ausprägung des Faktors bei einer Untersuchungseinheit (im Vergleich zu den anderen Untersuchungseinheiten!)
  • positiver Score: überdurchschnittliche Ausprägung
  • negativer Score: unterdurchschnittliche Ausprägung
27
Q

Wie ermittle und beurteile ich die Reliabilität? (Güte des Scorings)

A

sum score1 score2 score3 …

  • Standardabweichung soll nah an 1 sein
  • unter 0.9 bzw. 0.8 ist die Reliabilität eingeschränkt
28
Q

Wie ermittle und beurteile ich die Reliabilität? (Güte des Scorings)

A

sum score1 score2 score3 …

  • Standardabweichung soll nah an 1 sein
  • unter 0.9 bzw. 0.8 ist die Reliabilität eingeschränkt
  • Tabelle in Word kopieren
29
Q

Wie ermittle und beurteile ich die Univocalität? (Güte des Scorings)

A

estat common (modellimplizierte Korrelation)
corr scorelist (empirisch beobachtete Korrelation)// pwcorr scorelist, sig [0.05 Signifikanz]
- vergleichen
- Abweichung soll unter 0.1
- überprüft, wie gut moddellimplozierte Korrelation der Faktoren durch Faktorscores wiedergegeben wird

30
Q

Wie ermittle und beurteile ich die Orthogonalität? (Güte des Scorings)

A
  • wie bei Univocalität
  • bei Orthogonalität sind corr-Werte gleich die Abweichungen, da ja estat common Korrelation = 0 annimmt
  • Differenzen soll max 0.1 sein
  • wenn darüber: Güte des Scorings eingeschränkt
31
Q

Wie kann die Modellgüte bestimmt werden?

A
corr varlist/ v_*
estat res 
- vergleichen
- Differenz soll im Schnitt unter 0.05 sein
- über 0.1 ist ziemlich schlecht
32
Q

Welche standarddemographischen Variablen sollen ins Regressionsmodell aufgenommen werden?

A
  • Alter
  • Geschlecht
  • regionale Herkunft (eastwest)
  • Bildung
  • Einkommen

Achtung: missings ggf. rauscodieren!
- inhaltlich benennen

33
Q

Welcher ist der wichtigster Faktor (= welcher Faktor wird in der Regression als abhängige Variable aufgenommen)?

A
  • der Faktor, der am meisten Variation aufklärt

- der Faktor mit dem höchsten Proportion-Wert

34
Q

Welche Werte müssen bei der Regression interpretiert werden?

A
  • RQuadrat: Wie viel Varianz der abhängigen Variable erklärt wird
  • Beta-Koeffizienten: wie groß die Effektstärke pro unabhängiger Variable ist
  • Effekt der unabhängigen Variablen (als Tendenz formulieren)
  • p-Werte = Signifikanz
  • Achtung mit Polung und negativen Vorzeichen
  • Kon
35
Q

Worauf muss ich bei der Regression achten?

A

reg av uv1 - uv5, beta –> um Betawerte zu erhalten