Introduksjon til faktoranalyse Flashcards
Nevn seks formål for bruk av faktoranalyse
Redusere antall variabler (testledd/items)
Kvantifisere relasjonen mellom variabler og faktorer
Utvikle teori om begreper
Utvikle og validere spørsmålsbatterier
Finne kausale mønstre i en korrelasjonsmatrise
Beregne reliabilitet og validitet
Under Regn Kan Fine Blomster Utvikles
Hva er problemet med CTT (klassisk test teori)
Den sier “O = T + E”, der T er sann skår
Men det er bare når vi konstruerer data at vi faktisk har tilgang til den sanne skåren (T)
Derfor er en mulig løsning å lage en modell med flere variabler
-> faktoranalyse
Hvilke typer faktor analyser er det?
Faktoranalyser kan deles inn i to hoved kategorier;
eksplorerende og konfirmatoriske
Videre har vi da eksplorerende faktoranalyser og ekslorerende prinsipal komponent analyse, og konfirmatorisk faktoranalyse
Hva er en faktorladning (FL)?
FL er en regresjonskoeffisient som uttrykkes med den greske bokstaven lambada.
Den betraktes ofte som en korrelasjon ettersom den representerer styrken og retningen på sammenhengen mellom en faktor og en variabel
Hva er en faktormatrise?
Dette er en faktormatrise;
V1, 2 og 3 er variabler og tallene under F1 er faktorladninger - korrelasjonen mellom en variabel og faktor
Hvordan kan en faktorladning presenteres?
Sti-analyse eller i tabeller kalt faktormatriser
Hvilke to typer faktorladninger er det?
Mønsterkoeffisenter/mønsterladninger - regresjonskoeffisenter mellom faktoren og variablene i en faktor analyse
Strukturkoeffisenter/strukturladninger - korrelasjoner (med antatt kausal retning) mellom faktoren og variablene i en faktoranalyse
Hva sier faktorladningen oss?
Den sier oss hvor mange enheter den observerte variabelen endres med når den latente faktorverdien øker med en enhet.
Hva er en (felles) faktor
En felles faktor er en latent variabel som genererer den variansen et sett av manifeste variabler har felles.
Felles faktoren påvirker altså verdiene i observerte variabler.
Inneholder ikke tilfeldige målefeil
Den grunnleggende hypotesen er at faktoren er årsaken til at manifeste variabler korrelerer. Vi sier derfor at faktoren forklarer kovarians.
Hva er manifeste variabler?
Det er observerte variabler
For eksempel kan manifeste verdier være svar i en spørreundersøkelse
Hva er latente variabler?
De kan ikke observeres.
Det betyr at makroer ikke eksisterer som konkrete variabler i et datasett
Hva er en unik faktor?
En latent variabel som skaper den variansen i en variabel som den ikke deler med andre variabler i modellen.
Den består av både tilfeldig varians (målefeil) og reliabel (systematisk) varians. Det er ikke mulig å finne ut hvor stor andel av den unike variansen som er tilfeldig og reliabel
Hva er tilfeldig varians og reliabel varians?
Tilfeldig varians er tilfeldige målefeil eller støy. En variabel som består av tilfeldig varians kan per definisjon ikke korrelere med andre variabler som også består av tilfeldig varians (da ville den ikke vært tilfeldig men systematisk). Tilfeldig varians kan derfor ikke være felles varians
Reliabel varians er varians som variabelen ikke deler med andre variabler i modellen. Reliabel varians vil påvirke variabelen systematisk, men den påvirker ikke variansen til andre variabler
Hva antar en faktor modell om variansen i en variabel?
Den antar at variansen i en variabel kommer fra en eller flere felles faktorer og fra en unik faktor
Pek ut latent variabel, manifest variabel og unik faktor i et sti-analyse
Hva er en prinsipal komponent?
En PK er en samlevariabel som defineres (skapes) av varians og kovarians i et sett av manifeste variabler.
Vi sier derfor at komponenten ivaretar (inneholder) en viss mengde av variablenes varians.
PK inneholder tilfeldige målefeil.
Hva er forskjellen på en felles faktor og en prinsipal komponent?
PK inneholder tilfeldige målefeil, noe som felles faktor ikke gjør
PK har fokus på varians, mens F har fokus på kovarians
Hvordan beregnet Spearman faktorladning (FL) for 1-faktor modeller?
Som et slags gjennomsnitt av korrelasjonene for hver variabel (i en korrelasjonsmatrise)
Vi trenger minst 3 variabler for å kunne gjøre dette, men det er bedre med flere enn 3
Hvordan beregner du hvor mye av variansen i en manifest variabel som kommer fra en felles faktor F med informasjon om FL
Den beregnes ved å kvadrere faktorladningen fra F
Den beregnes ved å ta kvadratroten av parentesen (1 minus den kvadrerte faktorladningen):
Hvordan beregner du hvor mye av variansen i en manifest variabel som kommer fra U, med informasjon om FL?
Variansen fra U regnes ut ved å kvadrere faktorladningen mellom U og variabelen
Den kan skrives på to måter
Andel varians som kommer fra den unike faktoren regnes ut som 1 minus summen av alle de kvadrerte ladningene fra felles faktorene. Med bare en felles faktor blir likningen som det gule bildet
Hva er formelen for; faktorladning til forklart varians
Hva er formelen for;
fra forklart varians til faktorladning
Hvor mange variabler trengs for å gjøre en faktoranalyse?
Minst tre, men gjerne flere
Hva sier den kvadrerte faktorladningen?
Hvor mye av variansen i en observert variabel som kommer fra faktoren
Hva sier denne formelen?
Den sier at F genererer V1 sammen med U1
V1 er variabel 1
Det røde er faktorladningen
F er fellesfaktor
U1 er unik faktor
Dette forklares også gjennom dette bildet
Hva betyr dette?
F genererer V1 og V2, sammen med U1 og U2
Hva skjer med faktorladningen når det bare er to variabler?
Med bare to variabler blir FL kvadratroten av korrelasjonen mellom de to - derfor må man ha minst 3 variabler i faktoranalyse
Hva betyr det når en faktor ladning er høy?
At faktoren i stor grad har påvirket variansen i hver av variablene og kovariansen mellom dem
Beskriv dette bildet
Dersom vi sammenlikner faktorladningen til en deltaker med korrelasjonene mellom deres observerte skår og den sanne skåren/temp (i lilla boks) så er de helt identiske
Dette er fordi faktorladninger er korrelasjoner mellom en observert variabel (deltakernes gjett på temp) og en felles faktor (temp). Hvor mye de bommet er den unike faktoren (U).
Dermed trenger vi ikke å kunne måle den latente faktoren (temperatur) fordi en faktor analyse klarer å gjenskape den latente variabelen