Faktoranalys Flashcards

1
Q

Vad är en faktoranalys?

A

Ett samlingsnamn för dimensionsreducerande statiska metoder för att kunna åskådliggöra underliggande strukturer i data. Samvariationen mellan 2 eller fler variabler genom att mäta ett antal bakomliggande.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är en dimension?

A
Vi kan beskriva varje punkt i rummet omkring oss mha 3 koordinationer: y,z,x (en i y-led, en i z-led och en i x-led). 
Antalet dimensioner = antalet variabler som vi mäter!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dimensionsreduktion

A

ex ett foto, där har 3 dimensioner reducerats till 2 dimensioner, ändå kan den information vi vill åt finnas kvar.
Antalet dimensioner kan reduceras genom att vikta ihop variabler, det resulterar i att ”nya” variabler fås fram som tar olika mycket hänsyntill de gamla. Det är detta som görs mha faktoranalys.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är en faktor?

Faktor = latent variabel = komponent

A

Genom en faktoranalys försöker vi slå ihop variabler till faktorer som beskriver datan så bra som möjligt, detta skapar faktorer, den nya sammanslagna variabler.

Om faktorer är lätta att tolka har vi lyckats göra datan med överskådlig ex. Big 5.

Dessa faktorer kan vara något ”verkligt”, kanske inte. Om man klumpar ihop variabler som inte har med varandra kan vi få godtyckliga, meningslösa faktorer, det behöver inte finnas något samband mellan variablerna i faktorn.
Exempel: g-faktor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur väljer faktoranalysen ut faktorer?

A

Faktoranalysen väljer ut de faktorer som förklarar mest av variansen i vårt datamaterial. I en faktorlösning kommer den första faktorn förklara mest varians, den andra näst mest varians osv.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Egenvärde:

A

till varje faktor hör ett direkt mått på hur mycket av den totala variansen som den faktorn förklarade, dvs. förklarad varians av en faktor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Total varians

A

sammanlagd spridning i alla variabler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Korrelationsmatiser och kovariansmatris

A

Dessa börjar man göra med vid en faktoranalys, man ser hur mkt varje variabel korrelerar med varandra så man vet vilka variabler som hör ihop. Korrelationsmatrisern avgör vilka variabler som hör ihop. Varje variabler bidrar med variansen 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är faktorladdning och hur kan det visualiseras?

A

hur mycket varje variabel korrelerar med just den faktorn. För att räkna ut egenvärde måste vi kvadrera alla faktorladdningar för varje faktor och sedan summera dem.

Dessa faktorer kan sedan plotas på en component plot, för att se hur bra variablerna korrelerar med faktorerna. Man vill att datapunkterna ska hamna på linjen så de har korrelation 1.0 i drömscenarion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dubbelladdning

A

om en variabel korrelerar med fler faktorer, detta är inte önskvärt!

Ett problem man kan minska genom rotering.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är rotering?

A

vid rotering vill man undersöka ifall man kan hitta en bättre vinkel att titta på datan ifrån. För optimera och undersöka om fler kluster finns, dvs fler grupper/ny faktor. Detta innebär att man roterar hela koordinationssystemet så att varje variabel så mycket som möjligt hamnar på endast en faktor.
Det finns två typer av rotering: ortogonala (varimax) och oblik (ortotran).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hur påverkas faktorladdningen av rotering?

A

Genom detta så kommer den förklarade variansen hos faktorerna att omdistribueras. Vid rotering kommer faktorladdningen att ändras! Exempelvis kommer faktor 1 förmodligen inte att förklara lika mycket varians som innan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad kan rotering resultera i? Vilket problem kan kvarstå?

A

Rotering görs i förhoppning att hitta en mer lättolkad faktorlösning som är mer teoretisk meningsfull.

Efter en rotering kan dock problemet att lösningen inte täcker in tillräckligt av en variabels varians, då kan man antingen lägga till ännu en faktor eller så kan det vara så att den variabeln tas ut ur vår analys, den kanske inte mätte det den tänkte mäta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Communalities

A

Beskriver hur mycket av variansen i en variabel som förklaras av de faktorer vi tog med i lösningen.
Med andra ord, Hur mycket variansen i en variabel som beskrivs av alla extraherade faktorer.
Communality för en variabel i EN faktor = faktorladdningen2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad finns det för Två kriterier för att välja bort en variabel?

A
  1. ta bort variabeln om den inte har en enda signifikant faktorladdning
  2. ta bort variabeln om vår lösning förklarar mindre än 50% av variansen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Kommer egenvärden att förändras nämnvärt efter en rotation? Varför?

A

Ja, den kommer att förändras eftersom vid en rotation förändras faktorladdningarna genom att en rotation omdistruberar den förklarade variansen hos faktorerna, vilket innebär att egen värdarna förändras.

17
Q

Beskriv två sätt att utefter data bestämma hur många faktorer som ska vara med i en faktorlösning. Beskriv båda dessa sätt och resonemanget bakom dem.

A
  1. Egenvärden över 1, annars har man hittat på en variabel/faktor som förklarar mindre än ursprungsvariabeln. på Egenvärden räknas ut från faktorladdningarna hos variablerna i faktorn (kvadrera och summera). Om dessa är över 1 så väljer man att behålla faktorn.
  2. Armbågen i scree plot, innebär att man plottar ut datan i en graf sedan kollar man hur lutningen ser ut och där den börjar plana ut talar då om hur många faktorer som man ska välja.