mini test 2 Flashcards
Pourquoi regrouper les données? 3 raison
comprehension
decision
structure
2 etape du kmeans
assigner aléatoirement les observation
calculer et assigner le observations au centroide
Le meilleur K serait celui avec la valeur de Calinski la plus…
elever
cest quoi le critère de calinski
Ratio entre la variance inter-groupe et la variance intra-groupe
que represente laxe x et y dans un dendrograme
x = observation
y= distance
2 étapes de dendrogramme
1= calculer une matrice de distance
2=trouver la paires de groupe la plus proche et les connecter
Plus on choisit un seuil de distances élevée, XXX notre solution contiendra de groupes.
moins
3 types de distances entrent les groupes de dendrogramme
complete ( les 2 point les plus éloigné)
simple (les 2 points les plus proches )
moyenne (la moyenne entre tout les points)
la méthodes moyenne est sensible aux …
transformations
K-means vs. partitionnement hiérarchique
k-means = on connais le nombre de groupe
PH = technique plus exploratoire utiliser en écologie des communauté
la chose que l’aCP ne peu ps faire
travailler avec des données non linéaires
a quoi sert l’AFC
analyser des abondances d’espèces à travers un gradient environnemental.
AFC est un croisement entre
le chi carré et acp
comment on décrirais le chi carré
Combien les valeurs observées sont loin des valeurs attendues si les proportions d’espèces étaient indépendantes du site et vice-versa
difference entre acp et afc
utilise pas une matrice de variance covariance mais une matrice de compte observé moins attendu
on peu interpreter combien daxe dans un afc et pourquoi
1-2 car se sont des gradients environnementaux
La somme des eigenvalues dans un afc correspond à ..
une inertie (mesure de lindependance entre les ligne et les colonnes)
l’inertie de afc est elever si
les espèces sont associer ensemble
Assomptions de l’AFC
-Toutes les variables mesurées dans les mêmes dimensions physiques (e.g. comptes d’espèces)
● Uniquement des entiers positifs ou zéros
difference entre NMDS et afc
ne sinteresse pas au distance entre les variable mais au distance des observations
a quoi correspond le stresse dans un nmds
AU RESIDUS DE LA RELATION
Idéalement, le stress d’un NMDS devrait être de …
moin que 0,1