Faktorenanalyse Flashcards
Was ist die Grundidee der Faktorenanalyse?
- Korrelationen zwischen (manifesten) Items werden dadurch erklärt, dass ihnen ein gemeinsames latentes Merkmal (=Faktor) zugrunde liegt
- paarweise Korrelationen trotz Faktor <1 -> neben latenten Merkmal auch andere Faktoren (wie Messfehler) berücksichtigt
2 Arten: konfirmatorische und explorative Faktorenanalyse
- Zusammenhang mehrer Items mit einem (hypothetischen) latenten Konstrukt (=Faktor)
Wie lautet die Formel für das Generalfaktormodell der Faktorenanalyse?
Zᵢ=λᵢ,₁F₁+ δᵢΔᵢ -> ein Faktor
Zᵢ… standardisiertes Ergebnis des Item i
λᵢ,₁… Ladung (=Bedeutung) von Faktor 1 bei Item i
F1… Faktor 1
δᵢ… Ladung (=Bedeutung) aller anderen Einflüsse bei Item 1
Δᵢ… alle anderen Einflüsse (=itemspezifischer Faktor)
= bei jedem Item anders
-> Ähnlich dem Modell der einfachen Regression
Was besagt das multiple Faktorenmodell von Thurnstone?
Zᵢ=λᵢ,₁* F₁+ λᵢ,₂F₂ + … λᵢ,ₘFₘ + δᵢ*Δᵢ
Zᵢ=Σλᵢ,ₕFₕ+δᵢΔᵢ
Was ist die Annahme unkorrelierter Faktoren?
verschiedene Faktoren korrelieren nicht miteinander
Was sind die drei wichtigsten Kennwerte der Faktorenanalyse?
λᵢ,ₐ = die Ladungen der Faktoren
hᵢ² = die Kommunalität des Items
Eig(Fᵢ) der Eigenwert des Faktors
Was besagen die Ladungen in der Faktorenanalyse?
λᵢ,ₐ ist die Korrelation von Item i mit Faktor a
λᵢ,ₐ=ρ(Xᵢ,Fₐ) -> können positiv und negativ sein
λᵢ,ₐ kann als (Konstrukt)Validität des Items i für Faktor a interpretiert werden
Was ist das Bestimmtheitsmaß?
Das Bestimmtheitsmaß ist die quadrierte Ladung
λᵢ,ₐ²
besagt wie stark ein Faktor an einem Item beteiligt ist und wie gut die Ausprägung des Faktors durch das Item vorhersagbar ist/wie reliabel es Faktor misst
Was besagt die Kommunalität eines Items?
Varianzanteil eines Items der durch alle k extrahierten Faktoren erklärt werden kann
hᵢ²=Σλᵢ,ₐ²
unter Annahme dass die Faktoren stabil sind ist die Kommunalität die untere Schranke der Reliabilität des Items
hᵢ²≤rel(Xᵢ)
Kommunalität liegt zwischen 0 und 1
0-> Item kann garnicht durch Faktor erklärt werden
1 -> Item kann vollständig durch Faktor erklärt werden
Was ist der Eigenwert eines Faktors und wofür ist der gut?
wie viel Varianz der jeweilige Faktor von der Gesamtvarianz aller Items erklärt
Eig(Fₐ) = Λ = Σλᵢ,ₐ²
wichtig um Stellenwert eines Faktors zu interpretieren
kann als Maß dafür verstanden werden wie gut der Test die Faktoren misst bzw wie viel Infos die Items über den Faktor liefern
- Kenngröße für die Anzahl zugrunde liegender Faktoren
Eigenwert Λₐ eines Faktors a = Anteil der Varianz den der a-te Faktor an alle Items i hinweg
Wie kann man den Prozentsatz der Gesamtvarianz aller Items berechnen der durch einen bestimmten Faktor erklärt wird?
j = Eig(Fₐ)/k100 = Σλᵢ,ₐ²/k100
k… Anzahl an Items im Test
Wie kann man den Prozentsatz berechnen, den ein bestimmter Faktor von einer durch mehrere Faktoren erklärbare Varianz ausmacht?
j = Eig(Fₐ)/ΣEig(Fᵢ)*100
Eigenwert durch Summe aller Eigenwerte mal hundert
-> je größer desto größer sein Anteil an der “Erklärung” der Korrelation zwischen der Items
Was ist die Parameterschätzung?
- Bestimmung der (unbekannten) Ladungen
- Festlegung der Faktorenzahl
Grundidee: zunächst wird der Faktor mit dem größten Eigenwert “extrahiert”
-> Summe der quadrierten verbleibenden Korrelationen wird minimiert
-> ΣₐΣₑ[Xₐ, Xₑ]-
Was ist die Parameterschätzung?
- Bestimmung der (unbekannten) Ladungen
- Festlegung der Faktorenzahl
- Lösungsweg aufwendig
Grundidee: zunächst wird der Faktor mit dem größten Eigenwert “extrahiert”
-> Summe der quadrierten verbleibenden Korrelationen wird minimiert
-> ΣₐΣₑ[r(Xₐ, Xₑ)-^λₐ,₁^λₑ,₁]=Minimum
dann zweiter Faktor nach selber Grundidee, allerdings mit den Restkorrelationen
r(Xₐ, Xₑ)Rest=r(Xₐ, Xₑ)-^λₐ,₁^λₑ,₁
r = Restkorrelation von Item a und b nach Extraktion von Faktor 1
unterschiedliche Schätzmethoden
Welche Extraktionsverfahren kennen wir und wozu werden sie verwendet?
- extraktion der Faktoren aus Daten
2 häufigste Verfahren: - Hauptachsenanalyse (principal axis)
- Kauptkomponentenanalyse (principal components)
Welche Extraktionsverfahren kennen wir und wozu werden sie verwendet?
- extraktion der Faktoren aus Daten
2 häufigste Verfahren: - Hauptachsenanalyse (principal axis)
-> auf einen Faktor ladende Items zusammenfassen - Kauptkomponentenanalyse (principal components)
-> Ursachen für hohe Korrelationen zwischen Items
finden
Was passiert bei der Hauptkomponentenanalyse? Principal Component Analysis (PCA)
- Annahme: Varianz wird vollständig durch gemeinsamen Faktor erklärt
- alle Kommunalitäten (auch die Korrelationen eines Items mit sich selbst) = 1
–> es werden so viele Faktoren extrahiert wie es Items gibt - weder statistische Annahmen getroffen noch Faktoren extrahiert
verwendet Kompositscores “Hauptkomponenten”: soll interindividuelle Unterschiede optimal abbilden
im Prinzip können für p Itemvariablen stets p Hauptkomponenten gebildet werden aber Bedeutung der Hauptkomponenten nimmt sukzessive ab
wesentliches: Eigenwerte, Eigenwertvektoren
-> darf NICHT wie EFA behandelt werden, zB darf keine Faktorenrotation durchgeführt werden
Was passiert bei der Hauptachsenanalyse?
Principal Factor Analysis (PFA)
Annahme: Varianz=Kommunalität+Einzelrestvarianz
- alle Kommunalitäten (auch die Korrelationen eines Items mit sich selbst) < 1
- Ziel: nur durch gemeinsame Faktoren erklärbare Varianz beschreiben
- Kommunalitätenproblem: Kommunalitäten zu Beginn der Datenanalyse nicht bekannt
–> Faktoren werden zuerst mittels Hauptkomponentenanalyse geschätzt und iterativ verbessert = Kommunalitäteniteration
Welche Kriterien gibt es bei der Bestimmung der Faktorenzahl?
- Faktorenzahl wird a priori festgelegt
- alle Restkorrelationen sind nahe 0 (z.B.:<.2)
- Kaiser Kriterium: Eigenwert des zuletzt extrahierten
Faktors < 1 -> (Infos über Faktor < Infos über
einzelne Items) - Elbow Kriterium: Verlauf des Eigenwertediagramms
(Screeplot) - Parallelanalyse
keine generellen Vorschriften, Grad der Subjektivität ist relativ hoch
Was ist das Elbow Kriterium?
Eigenwertetabelle
jene Stelle wird gesucht, an der Verlauf abflacht
-> Faktoren vor dem Knick werden berücksichtigt
Was passiert bei der Parallelanalyse in der Faktorenanalyse?
- es werden 100 Datensätze von Zufallszahlen erzeugt
- Anzahl Items & Stichprobenumfang enspricht empirisch gewonnenem Datensatz
-> Faktorenanalyse -> Eigenwerte pro Faktor gemittelt
–> relevante, nichttriviale Faktoren sind jene, deren Eigenwerte über jeden der gemittelten Parallelanalyse liegen