06_exploratory_analysis_I Flashcards
Geometrisk mean
product_i_to_n(xi)^(1/n)
eller
nroot(product(xi))
Hvad er sample center?
den geometriske mean til hver del af kompositionen i en ny vektor.
(i CLR er det geo-meanen til hver række man bruger…)
Hvordan kan man udregne variansen af en række kompositioner?
Udregn spredningen i log-ratio af de enkelte dele across samples:
T = [t_ij]
t_ij = var(ln(xi/xj))
var = 1/n sum_n(y_i-y_mean)^2
Og den totale varians er lig med:
totvar = 1/2D sum_i_j_to_D(t_ij)
PCA how to
1) CLR transformer
2) SVD med centrering og variansnormalisering
Hvad er loadings
Eigenvector basis - kan bruges til at lave ILR værdier.
Eigenvectorerne for rækkerne altså samplesne. Navngivet efter parts i kompositionen.
Hvad er scores?
Eigenvectorer for søjlerne - altså delene af kompositionen.
Hvad er rays
Et andet ord for loadings - den basis der udspænder et rume der forklarer al variationen inden for samplen.
Hvad er markers
Det samme som scores - oftest plottet som punkter.
Hvad kan længden på rays fortælle os?
Det er proportinelt til standard deviation ag CLR coefficinterne. Lange rays = stor varians i den del af kompositionen.
Anden måde at sige hvad et biplot viser:
Det er en projektion af data matricen på ned på et to-dimensionelt rum på den måpde der forklarer mest varians.
Hvad er 0.0 i et biplot?
Den geometriske gennemsnitsværdi af parts.
Hvad er et link?
Den linje der forbinder to rays
- propertionel til log-ratio for de to dele af kompositionen - dvs hvis der er langt imellem er der stor variation mellem parts.
- clusters af rays = de dele er korreleret
Hvad fortæller vinkler mellem links?
cosinus til vinklen er proportionel med korrelationen mellem log-ratios. lille vinkel = høj korrelation
Markers projiceret på rays:
jo tættere på origin jo mere lig den geometriske mean af det sæt er samplen.
Hvis den er i enden af pilen = ca en standardafvigelse
Markers på links:
Hvis projicionen passer med projitionen af origin på link så er logration for den sample lig med average log ratio for de to parts.