01_Introduction Flashcards
What attributes does all compositional data have?
1) Strictly positive
2) Sum of it is constant but meaningless
Difference between fraction and proportion
Proportions are strictly positive.
Hvad finder logaritmen til et tal?
Hvilken potens man skal opløfte basen i for at få tallet.
Hvad er simpsons paradox (amalgamation paradox)?
Når en treatment er bedre i begge tilfælde men overordnet værre fordi den værre proportion har flere tilfælde.
Proportion hyppige fejl:
1) Folk snakker om negative proportioner - e.g. 6 +- 7 %
2) Små proportioner kan være vigtige - e.g. et gram salt ud af 1 kg suppe ikke meget men 2 gram salt kan være meget
3) Proportionelle ændringer - fx børspriser - 50 op og næste dag 50 ned giver 75 % af det oprindelige.
Spurious Korrelations
1) når man normaliserer kan man ofte skabe korrelation -
e. g. x, y og z er ikke korreleret.
x/z og y/z kan være korreleret fordi de deler en nævner - så hvis z er høj bliver både x og y relativt mindre.
Negative correlation bias
Når en del af kompositionen går op skal alle de andre gå ned fordi det er relativ information.
Compositional correlations
Skal være ratioerne der er konstante. Skal være lineære i log-log space. y = x + beta hvor beta i log space er lig alpha i euklidisk space. Altså interceptet skal være lig log(hældningen).
Hvorfor udviklede man CODA?
Mest på grund af spurious correlations.