Hauptkomponentenanalyse Flashcards
Wozu dient die Hauptkomponentenanalyse
principal component analysis = PCA
zur Datenreduktion
Was ist das ziel der Hauptkomponentenanalyse
die Zusammenhänge zwischen den Variablen durch wenige Hauptkomponenten darzustellen
Was testet eine Hauptkomponentenanalyse
keine Hypothesen! Stattdessen ist es ein hypothesengenerierendes Verfahren.
Die Hauptkomponentenanalyse besteht aus drei Schritten:
- Extraktion
- Reduktion
- Rotation
Vor Beginn der Hauptkomponentenanalyse werden
die beobachteten Variablen Yi (i = 1,…,p) standardisiert und dann auch als Zi bezeichnet. Dadurch hat jede einzelne Variable Zi eine Varianz von 1.
Hauptkomponentenanalyse – 1. Schritt: Extraktion
Die gesamte Varianz der beobachteten Variablen Zi (i = 1,…,p) wird zunächst durch ebenso viele Hauptkomponenten Hj (j = 1,…,q; q=p) erklärt
Jede Variable ist also eine Linearkombination der Hauptkomponenten.
Prinzipiell werden die Werte so berechnet, dass die erste Hauptkomponente möglichst viel Varianz auf den beobachteten Variablen aufklärt und die anderen Komponenten erklären dann sukzessive weniger
Ladung 𝜆𝑖𝑗 entspricht
der Korrelation der Variablen Zi mit der Hauptkomponente Hj.
Die Hauptkomponenten sind untereinander aufgrund ihrer Orthogonalität
nicht korreliert.
Kommunalität
beschreibt, wie viel Varianz einer Variable 𝑍𝑖 durch alle k Hauptkomponenten gemeinsam aufgeklärt wird.
Die Kommunalität ist eine Eigenschaft
der Variable
Eigenwert 𝛿 ist eine Eigenschaft
der Hauptkomponente j
Er beschreibt den Anteil der Gesamtvarianz aller Variablen, den die Hauptkomponente aufklärt.
Je größer der Eigenwert,
umso mehr Varianz klärt diese Hauptkomponente auf. Bei der Extraktion klärt die erste Hauptkomponente immer am meisten auf & die anderen dann sukzessive immer weniger
Der Eigenwert ist eine Eigenschaft
der Hauptkomponenten.
Varianzaufklärung
beschreibt etwas ähnliches wie der Eigenwert. Hier wird die aufgeklärte Varianz der Hauptkomponente in Relation gesetzt zur Gesamtvarianz aller Variablen. Dadurch ergeben die Hauptkomponenten zusammen zunächst 100%
Kaiser Guttmann Kriterium
alle Hauptkomponenten beibehalten, deren Eigenwert größer als 1 ist
Die Idee ist, dass diese Hauptkomponenten mehr Varianz erklären als eine einzelne Variable hat.