Hauptkomponentenanalyse Flashcards

1
Q

Wozu dient die Hauptkomponentenanalyse

principal component analysis = PCA

A

zur Datenreduktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist das ziel der Hauptkomponentenanalyse

A

die Zusammenhänge zwischen den Variablen durch wenige Hauptkomponenten darzustellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was testet eine Hauptkomponentenanalyse

A

keine Hypothesen! Stattdessen ist es ein hypothesengenerierendes Verfahren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Die Hauptkomponentenanalyse besteht aus drei Schritten:

A
  1. Extraktion
  2. Reduktion
  3. Rotation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vor Beginn der Hauptkomponentenanalyse werden

A

die beobachteten Variablen Yi (i = 1,…,p) standardisiert und dann auch als Zi bezeichnet. Dadurch hat jede einzelne Variable Zi eine Varianz von 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hauptkomponentenanalyse – 1. Schritt: Extraktion

A

Die gesamte Varianz der beobachteten Variablen Zi (i = 1,…,p) wird zunächst durch ebenso viele Hauptkomponenten Hj (j = 1,…,q; q=p) erklärt
Jede Variable ist also eine Linearkombination der Hauptkomponenten.
Prinzipiell werden die Werte so berechnet, dass die erste Hauptkomponente möglichst viel Varianz auf den beobachteten Variablen aufklärt und die anderen Komponenten erklären dann sukzessive weniger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ladung 𝜆𝑖𝑗 entspricht

A

der Korrelation der Variablen Zi mit der Hauptkomponente Hj.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Die Hauptkomponenten sind untereinander aufgrund ihrer Orthogonalität

A

nicht korreliert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Kommunalität

A

beschreibt, wie viel Varianz einer Variable 𝑍𝑖 durch alle k Hauptkomponenten gemeinsam aufgeklärt wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Die Kommunalität ist eine Eigenschaft

A

der Variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Eigenwert 𝛿 ist eine Eigenschaft

A

der Hauptkomponente j

Er beschreibt den Anteil der Gesamtvarianz aller Variablen, den die Hauptkomponente aufklärt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Je größer der Eigenwert,

A

umso mehr Varianz klärt diese Hauptkomponente auf. Bei der Extraktion klärt die erste Hauptkomponente immer am meisten auf & die anderen dann sukzessive immer weniger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Der Eigenwert ist eine Eigenschaft

A

der Hauptkomponenten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Varianzaufklärung

A

beschreibt etwas ähnliches wie der Eigenwert. Hier wird die aufgeklärte Varianz der Hauptkomponente in Relation gesetzt zur Gesamtvarianz aller Variablen. Dadurch ergeben die Hauptkomponenten zusammen zunächst 100%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kaiser Guttmann Kriterium

A

alle Hauptkomponenten beibehalten, deren Eigenwert größer als 1 ist
Die Idee ist, dass diese Hauptkomponenten mehr Varianz erklären als eine einzelne Variable hat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Scree-Test

A

alle Hauptkomponenten oberhalb des Knicks im
Eigenwertsdiagramm beibehalten
Bei größeren PCAs werden meistens weniger Hauptkomponenten durch den Scree Test beibehalten als bei Kaiser Guttmann.
Allerdings gibt es auch Fälle ohne eindeutigen Knick

17
Q

Parallelanalyse

A

werden zufällige Daten mit der gleichen Stichprobengröße & Anzahl an Variablen erzeugt. Die Variablen sind in der Grundgesamtheit unkorreliert. Über die zufälligen Daten wird ebenfalls eine PCA gerechnet und der Eigenwertverlauf wird verglichen. Nur die Hauptkomponenten mit Eigenwerten, die höher sind als bei den zufälligen Daten werden beibehalten.
Bei der Anwendung dieser Methode werden normalerweise viele (50-5000) Datensätze erzeugt und gemittelt

18
Q

Auswirkung der Reduktion

A

Reduktion wird die Zahl der Hauptkomponenten auf k reduziert. Dadurch wird nicht mehr die komplette Varianz jeder einzelnen Variablen durch die Hauptkomponenten erklärt. Die Kommunalitäten sinken also auf weniger als 1 & die addierte Varianzaufklärung der k Hauptkomponenten ergibt weniger als 100%.

19
Q

Warum ist die 1 Lösung der PCA inhaltlich oft nicht gut zu interpretieren ?

A

da viele Variablen auf mehreren Hauptkomponenten hoch laden & es deshalb schwierig ist, zu entscheiden, was die jeweiligen Hauptkomponenten inhaltlich bedeuten.

20
Q

Um die Interpretierbarkeit zu erhöhen,

A

werden die Hauptkomponenten in einem dritten Arbeitsschritt rotiert. Dabei sollen die Ladungen auf einzelnen Hauptkomponenten maximiert werde

21
Q

Es gibt zwei Arten von Rotationen:

A

Orthogonale Rotation

Oblique Rotation

22
Q

Orthogonale Rotation:

A

Die neuen Hauptkomponenten sind ebenfalls unkorreliert.

23
Q

Oblique Rotation:

A

Die neuen Hauptomponenten dürfen nach der Rotation korrelieren.

24
Q

Ein häufig verwendetes Verfahren zur orthogonalen Rotation ist die

A

Varimaxrotation, bei der die Varianz der quadrierten Ladungen auf jeder Hauptkomponente maximiert werden soll.

25
Q

Voraussetzungen der Hauptkomponentenanalyse

A

Die Zusammenhänge zwischen den Variablen sollten linear sein
Es sollten nicht zu viele Ausreißer vorliegen
Die Variablen sollten metrisches Skalenniveau haben
Die Stichprobengröße sollte mindestens 3*Variablenanzahl betragen & größer als 50 sein.

26
Q

Die Kommunalität für jede Variable kann leicht berechnet werden, indem

A

jede Ladung quadriert &dann addiert wird.

27
Q

Der Eigenwert jeder Hauptkomponente kann leicht berechnet werden, indem

A

jede Ladung quadriert & dann addiert wird.