06_exploratory_analysis_I Flashcards

1
Q

Geometrisk mean

A

product_i_to_n(xi)^(1/n)

eller

nroot(product(xi))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er sample center?

A

den geometriske mean til hver del af kompositionen i en ny vektor.

(i CLR er det geo-meanen til hver række man bruger…)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvordan kan man udregne variansen af en række kompositioner?

A

Udregn spredningen i log-ratio af de enkelte dele across samples:

T = [t_ij]

t_ij = var(ln(xi/xj))

var = 1/n sum_n(y_i-y_mean)^2

Og den totale varians er lig med:

totvar = 1/2D sum_i_j_to_D(t_ij)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

PCA how to

A

1) CLR transformer

2) SVD med centrering og variansnormalisering

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er loadings

A

Eigenvector basis - kan bruges til at lave ILR værdier.

Eigenvectorerne for rækkerne altså samplesne. Navngivet efter parts i kompositionen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er scores?

A

Eigenvectorer for søjlerne - altså delene af kompositionen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er rays

A

Et andet ord for loadings - den basis der udspænder et rume der forklarer al variationen inden for samplen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er markers

A

Det samme som scores - oftest plottet som punkter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad kan længden på rays fortælle os?

A

Det er proportinelt til standard deviation ag CLR coefficinterne. Lange rays = stor varians i den del af kompositionen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Anden måde at sige hvad et biplot viser:

A

Det er en projektion af data matricen på ned på et to-dimensionelt rum på den måpde der forklarer mest varians.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er 0.0 i et biplot?

A

Den geometriske gennemsnitsværdi af parts.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er et link?

A

Den linje der forbinder to rays
- propertionel til log-ratio for de to dele af kompositionen - dvs hvis der er langt imellem er der stor variation mellem parts.

  • clusters af rays = de dele er korreleret
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad fortæller vinkler mellem links?

A

cosinus til vinklen er proportionel med korrelationen mellem log-ratios. lille vinkel = høj korrelation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Markers projiceret på rays:

A

jo tættere på origin jo mere lig den geometriske mean af det sæt er samplen.

Hvis den er i enden af pilen = ca en standardafvigelse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Markers på links:

A

Hvis projicionen passer med projitionen af origin på link så er logration for den sample lig med average log ratio for de to parts.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly