Faktoranalyse Flashcards
1 og 2. Læringsmål: Studenten kan kritisk analysere og formidle relevant forskning, og behersker metodiske og statistiske uttrykksformer. Studenten har utviklet et kritisk perspektiv for å vurdere anvendelsesområde for ulike statistiske tester, kjenner til *viktigheten av statistisk styrke og effektstørrelser.* Studenten har innsikt i -bruksområder, -fordeler, - forutsetninger og - begrensninger med de ulike statistiske tester samt kvantitativ metode generelt.
Hva er en faktor?
En faktor= latent variabel er ikke direkte målt og noe man antar er en underliggende variabel for målte observerbare variabler (items) i et datasett.
Faktoranalyse tillater å estimere faktorene uten å ha målt de gjennom kjente variabler (items)
faktor = latent variabel = sirkel = “cluster” = et konsept som måles gjennom flere relaterte observerte variabler (faktoren har ingen kolonne i det råe datasettet)
Antagelse:
Antagelse: Umålte dimensjoner står bak msk. atferd
- som ikke kan måles direkte!!
Hvordan skille en faktor i ANOVA seg fra en faktor i faktoranalyse?
I kontekst ANOVA Faktor = kategorisk variabel, mens i kontekst faktoranalyse er faktor = latent variabel
Wiki: latent variables are _variables that can only be inferred indirectly through_a mathematical model from other observable variables that can be directly observed or measured
I ANOVA er del av forskningsdesignet deler deltakere/caser i grupper.
I faktoranalyse antar vi at flere variabler/items er forårsaket av en underliggende variabel (faktor)
- denne faktoren forklarer korrelasjoner mel. items
Hva er et item i kontekst FA?
item = observert variabel = rektangel = målt variabel, en variabel som vi har faktiske data for (dvs. en kolonne i datasettet)
Hva er unikhet i FA kontekst?
unikhet = uniqueness = hvor mye av variansen i et item er ikke forklart? som er spesifikk for hvert item
Hva er faktoranalysens tre mål?
1) Datareduksjon
- handler om å redusere antall variable
- prøver å finne den delen av varian som flere spm. deler m hverandre og ikke med andre spm.
- gjør data enklere å håndtere (f.eks. to-faktor teori)
2) Dimensjonalitet
Estimere antall dimensjoner i dataene
1. for å finne ut om det finnes underliggende dimensjoner i et stort sett variabler
2. hvor mange faktorer
3) Faktorstruktur
- finn latente variabler (faktorvariabler) som forklarer korrelasjoner mel. et sett av variabler
- ekstrahere latente verdier for faktorene (personal norms vs. attittude osv.)
Hvilke trinn har man i faktoranalyse?
Først samler man inn data, så leter man etter faktorer så reduserer man??????
1) Bestemme antall faktorer
2) Ekstrahere faktorene
3) Rotere faktorene
4) presisere og tolke faktorene
I praksis: ofte en sirkulær prosess (iterativ) basert på en innledende FA, parametre er ofte tilpasset.
- identifisere orphans = ? og evt. droppe de
- valg antall faktorer
- valg rotasjonsmetode
Hva er en iterativ prosess?
sirkulær prosess
Hva er forutsetningene for en faktoranalyse
- kontinuerlige variabler
———– men kan lage korrelasjonstabeller m andre typer variabler og bruke dem som input
1) det er en underliggende faktor som kan forklare en del av variansen hos items
ALTSÅ
- FAKTORABILITET = en forutsetning
–er det en faktorstruktur i korrelasjonsmatrisen?
Sjekk med
1. Kaiser-Meyer-Olkin test (KMO) for Measure of Sampling Adequacy (MSA):
— viser om de korrelasjonene mel. par av variabler kan forklares av de andre variablene i matrisen
* KMO/MSA > 0.8 typisk fint,
- KMO/MSA < 0.6 ikke brukbar
* Sjekk også KMO/MSA for individuelle variabler
2. Bartlett’s test
- er det signifikant avvik av korrelasjonsmatrisen fra identitetsmatrisen?
- * Det betyr at man vil forkaste H0 og ser derfor etter en signifikant p-verdi i Bartletts testen
- * signifikantfunn betyr at data er egnet for FA
- bør være signifikant, men testen er oversensitiv (nullhypotese forkastes (nesten) alltid
Hvilke spørsmål har vi til faktoranalysen?
- Kan vi redusere datamengden uten å miste for mye informasjon?
– Kan vi redusere seks spørsmål til noen færre dimensjoner?
– Hvor mange dimensjoner trenger vi?
– Er det virkelig to dimensjoner i datamaterialet som forventet?
– Er de riktige spørsmålene relatert til samme dimensjon? - Eller i faktoranalysespråket: Lader de riktige spørsmål på dimensjonene og finnes det ikke noe kryssladninger?
- kan vi se noe mønster i matrisen (korrelasjonsanalyse)
Eks.
- tre spørsmål skulle måle personlig norm, tre holdninger. Men stemmer det i virkeligheten? Fungerer spørsmålene som forventet?
Faktoranalyse gir svar på dette!
Hva er EFA?
i Exploratory Factor Analysis (EFA) er potensielt alle faktorer koblet mot alle variabler * dataene får bestemme hvilke variabler “hører sammen”
“regresjonskoeffisientene” 𝑏11, 𝑏12 osv. heter faktorladninger (factor ATT3 U6 loadings) “feilleddet” u heter unikhet (uniqueness)
Hva er kommunalitet?
Kommunalitet er den delen av variansen i variabelen (item) som er forklart av alle faktorene
Kommunalitet (h^2) av en variabel er andel varians i variabelen som er forklart av alle faktorene
* Kommunaliteter tolkes som R2 i regresjon
–Man ønsker å oppnå store kommunaliteter så at et begrenset antall faktorer forklarer mest mulig varians i variablene
* Unik varians av en variabel er derfor 1-kommunalitet (1 – h2)
* Unik varians av X1 er derfor (1 – h2) ( 1 – .64) = .36
* Communality = 1, All variance shared.
* Communality = 0, No variance shared.
Utregning:
kommunaliteten h^2 er andel varians i en variabel som alle faktorer forklarer til sammen
for item x1: (Ladning til F1)^2 + (Ladning til F2)^2 = h^2 = kommunalitet
leder til % forklart total varians
Hva er egenverdi?
Hver faktor i en faktoranalyse får en egenverdi, som er et mål på hvor viktig en faktor er
Eigenverdi er størst for den første faktoren som trekkes ut og blir mindre og mindre for økende antall faktorer
Eigenverdi brukes for å bestemme antall faktorer fordi man vil bare trekke ut så mange faktorer som man trenger for å beskrive matrisen god nok, man vil ikke ha svake faktorer med lave egenverdier
Man finner egenverdi ved å regne ut summen av alle kvadratene av de kvadrate ladninger
- egeneverdi nedover i tabellen
- er for 1 faktor
- så egenverdi fro F1 = summen av alle de kvadrerete faktorladningene til alle itemsene for F1
Hva er ladningen til en faktor
= hvor sterk er relasjonen mellom faktor og item?
altså styrken på korrelasjonen mel. faktor og item.
Hva er % forklart varians?
For hver faktor er det den kvadrerte summen av faktorladningene (egenverdi) delt på antall items
% forklart varians for faktor 1 (F1)= EgenverdiF1/antall items
Hva er % totalt forklart varians?
Kommunalitet (=h^2= ladningF1^2 + ladning F2^2) for hvert item Xn, summert for alle verdiene!
Altså % totalt forklart varians= h^2x1+h^2x2 +… +h^2xn/n =antall items
= prosentfaktor
gjør om til %
i tillegg er % forklart varians for F1 + % forklart varians for F2 = % totalt forklart varians