Faktoranalyse Flashcards

1 og 2. Læringsmål: Studenten kan kritisk analysere og formidle relevant forskning, og behersker metodiske og statistiske uttrykksformer. Studenten har utviklet et kritisk perspektiv for å vurdere anvendelsesområde for ulike statistiske tester, kjenner til *viktigheten av statistisk styrke og effektstørrelser.* Studenten har innsikt i -bruksområder, -fordeler, - forutsetninger og - begrensninger med de ulike statistiske tester samt kvantitativ metode generelt.

1
Q

Hva er en faktor?

A

En faktor= latent variabel er ikke direkte målt og noe man antar er en underliggende variabel for målte observerbare variabler (items) i et datasett.

Faktoranalyse tillater å estimere faktorene uten å ha målt de gjennom kjente variabler (items)

faktor = latent variabel = sirkel = “cluster” = et konsept som måles gjennom flere relaterte observerte variabler (faktoren har ingen kolonne i det råe datasettet)

Antagelse:
Antagelse: Umålte dimensjoner står bak msk. atferd
- som ikke kan måles direkte!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvordan skille en faktor i ANOVA seg fra en faktor i faktoranalyse?

A

I kontekst ANOVA Faktor = kategorisk variabel, mens i kontekst faktoranalyse er faktor = latent variabel
Wiki: latent variables are _variables that can only be inferred indirectly through_a mathematical model from other observable variables that can be directly observed or measured

I ANOVA er del av forskningsdesignet deler deltakere/caser i grupper.
I faktoranalyse antar vi at flere variabler/items er forårsaket av en underliggende variabel (faktor)
- denne faktoren forklarer korrelasjoner mel. items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er et item i kontekst FA?

A

item = observert variabel = rektangel = målt variabel, en variabel som vi har faktiske data for (dvs. en kolonne i datasettet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er unikhet i FA kontekst?

A

unikhet = uniqueness = hvor mye av variansen i et item er ikke forklart? som er spesifikk for hvert item

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er faktoranalysens tre mål?

A

1) Datareduksjon
- handler om å redusere antall variable
- prøver å finne den delen av varian som flere spm. deler m hverandre og ikke med andre spm.
- gjør data enklere å håndtere (f.eks. to-faktor teori)
2) Dimensjonalitet
Estimere antall dimensjoner i dataene
1. for å finne ut om det finnes underliggende dimensjoner i et stort sett variabler
2. hvor mange faktorer
3) Faktorstruktur
- finn latente variabler (faktorvariabler) som forklarer korrelasjoner mel. et sett av variabler
- ekstrahere latente verdier for faktorene (personal norms vs. attittude osv.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvilke trinn har man i faktoranalyse?

A

Først samler man inn data, så leter man etter faktorer så reduserer man??????
1) Bestemme antall faktorer
2) Ekstrahere faktorene
3) Rotere faktorene
4) presisere og tolke faktorene

I praksis: ofte en sirkulær prosess (iterativ) basert på en innledende FA, parametre er ofte tilpasset.
- identifisere orphans = ? og evt. droppe de
- valg antall faktorer
- valg rotasjonsmetode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er en iterativ prosess?

A

sirkulær prosess

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er forutsetningene for en faktoranalyse

A
  • kontinuerlige variabler
    ———– men kan lage korrelasjonstabeller m andre typer variabler og bruke dem som input

1) det er en underliggende faktor som kan forklare en del av variansen hos items
ALTSÅ
- FAKTORABILITET = en forutsetning
–er det en faktorstruktur i korrelasjonsmatrisen?
Sjekk med
1. Kaiser-Meyer-Olkin test (KMO) for Measure of Sampling Adequacy (MSA):
— viser om de korrelasjonene mel. par av variabler kan forklares av de andre variablene i matrisen
* KMO/MSA > 0.8 typisk fint,
- KMO/MSA < 0.6 ikke brukbar
* Sjekk også KMO/MSA for individuelle variabler
2. Bartlett’s test
- er det signifikant avvik av korrelasjonsmatrisen fra identitetsmatrisen?
- * Det betyr at man vil forkaste H0 og ser derfor etter en signifikant p-verdi i Bartletts testen
- * signifikantfunn betyr at data er egnet for FA
- bør være signifikant, men testen er oversensitiv (nullhypotese forkastes (nesten) alltid

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvilke spørsmål har vi til faktoranalysen?

A
  • Kan vi redusere datamengden uten å miste for mye informasjon?
    – Kan vi redusere seks spørsmål til noen færre dimensjoner?
    – Hvor mange dimensjoner trenger vi?
    – Er det virkelig to dimensjoner i datamaterialet som forventet?
    – Er de riktige spørsmålene relatert til samme dimensjon?
  • Eller i faktoranalysespråket: Lader de riktige spørsmål på dimensjonene og finnes det ikke noe kryssladninger?
  • kan vi se noe mønster i matrisen (korrelasjonsanalyse)

Eks.
- tre spørsmål skulle måle personlig norm, tre holdninger. Men stemmer det i virkeligheten? Fungerer spørsmålene som forventet?
Faktoranalyse gir svar på dette!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er EFA?

A

i Exploratory Factor Analysis (EFA) er potensielt alle faktorer koblet mot alle variabler * dataene får bestemme hvilke variabler “hører sammen”
“regresjonskoeffisientene” 𝑏11, 𝑏12 osv. heter faktorladninger (factor ATT3 U6 loadings) “feilleddet” u heter unikhet (uniqueness)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er kommunalitet?

A

Kommunalitet er den delen av variansen i variabelen (item) som er forklart av alle faktorene

Kommunalitet (h^2) av en variabel er andel varians i variabelen som er forklart av alle faktorene
* Kommunaliteter tolkes som R2 i regresjon
–Man ønsker å oppnå store kommunaliteter så at et begrenset antall faktorer forklarer mest mulig varians i variablene
* Unik varians av en variabel er derfor 1-kommunalitet (1 – h2)
* Unik varians av X1 er derfor (1 – h2) ( 1 – .64) = .36
* Communality = 1, All variance shared.
* Communality = 0, No variance shared.

Utregning:
kommunaliteten h^2 er andel varians i en variabel som alle faktorer forklarer til sammen
for item x1: (Ladning til F1)^2 + (Ladning til F2)^2 = h^2 = kommunalitet

leder til % forklart total varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er egenverdi?

A

Hver faktor i en faktoranalyse får en egenverdi, som er et mål på hvor viktig en faktor er

Eigenverdi er størst for den første faktoren som trekkes ut og blir mindre og mindre for økende antall faktorer
Eigenverdi brukes for å bestemme antall faktorer fordi man vil bare trekke ut så mange faktorer som man trenger for å beskrive matrisen god nok, man vil ikke ha svake faktorer med lave egenverdier

Man finner egenverdi ved å regne ut summen av alle kvadratene av de kvadrate ladninger
- egeneverdi nedover i tabellen
- er for 1 faktor
- så egenverdi fro F1 = summen av alle de kvadrerete faktorladningene til alle itemsene for F1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er ladningen til en faktor

A

= hvor sterk er relasjonen mellom faktor og item?
altså styrken på korrelasjonen mel. faktor og item.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva er % forklart varians?

A

For hver faktor er det den kvadrerte summen av faktorladningene (egenverdi) delt på antall items

% forklart varians for faktor 1 (F1)= EgenverdiF1/antall items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva er % totalt forklart varians?

A

Kommunalitet (=h^2= ladningF1^2 + ladning F2^2) for hvert item Xn, summert for alle verdiene!

Altså % totalt forklart varians= h^2x1+h^2x2 +… +h^2xn/n =antall items
= prosentfaktor
gjør om til %

i tillegg er % forklart varians for F1 + % forklart varians for F2 = % totalt forklart varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvordan deles totalvariansen i faktoranalyse?

A

deles i
1) felles varians = varians delt av itemsene
2) unik varians = spesifikk for hvert item
1) spesifikk varians (spesifikk til et item, f.eks. ambigious ordlyd)
2) feilvarians

17
Q

Hva er eksplorerende (induktive)måter å ekstrahere faktorer?

A

Eksplorerende (induktiv)
* Principal components (PCA)
* Common factor model (FA)

18
Q

Hva er forskjellene mellom PCA og FA?

A

PCA = Hovedkomponentanalyse= principal components analysis vs. FA = fellesfaktormodell = common factor
– PCA: maximaliser varians forklart av hver faktor
– FA: finn faktorer som forklarer korrelasjonsstruktur i datasettet
* brukes ofte om hverandre men matematisk distinkt
* FA brukes oftest i psykologi,
* i dette kurset bruker vi FA, ikke PCA

PCA:
stammer fra Pearson (1901) og Hotelling (1933)
– Mål: finne den eller de lineære kombinasjoner av de standardiserte variablene som best oppsummerer data, dvs. forklarer variasjon i variablene.

FA:
stammer fra Spearman (1904)– Det er flere forfattere som bare regner varianter av denne som faktoranalyse
– Mål: finne et lite antall av faktorer som gir en lineær rekonstruksjon av felles variasjon.
Uk er variabelens unike varians, som igjen kan tenkes dekomponert i en feilvarians/tilfeldig og spesifikk varians (varians som er spesifikk til et item)

Sammenligning:
– i PCA er alle varians i K items forklart av K-faktorer, men i common factor (f.eks. FA) er bare felles varians forklart

19
Q

Hvordan avgjører man antall faktorer i faktorekstrahering?

A

Hvordan avgjør antall faktorer?
– Vi kan bruke teoretisk resonnering – eller kriterier basert på dataene (Eigenverdier):
* Kaier’s kriterium (Eigenverdiregel)
* Catell’s Scree plot

20
Q

Hva er Kaisers kriterion?

A

En måte å bestemme antall faktorer.
Kaisers kriterion: egenverdien til en faktor må være minst 1.0 (her to faktorer)

21
Q

Hvordan bestemmer man antall faktorer utifra Catell’s Scree Plot?

A

Eigenverdier rangert etter størrelse: Scree-plot
Se etter «knekken» i kurven, ta med antall faktorer som ligger før knekken

22
Q
A
23
Q

Hva er cronbachs alfa?

A

Cronbachs alfa er et mål på intern konsistens og er veldig omdiskutert (men rapporteres likevel)
* Det ligger mellom 0 og +1(når den blir negativt har du en variabel inni som er kodet i feil retning i forhold til de andre) *
Et av problemene med Cronbachs alfa er at den avhenger veldig antall spørsmål som inngår i en skala, jo flere jo bedre blir alfa

Cronbachs alfa er bedre, jo nærmere den ligger 1 ▪ >.90 = eksellent ▪ >.80 = bra ▪ >.70 = akseptabel

Reliabilitet:
Stabilitet og intern konsistens * Stabilitet: Faktorstruktur er konsistent over repeterte målinger/paralle tester
* Intern konsistens: Items måler det samme