Chapitre 2 : Classification Flashcards
Quelles techniques de classification sont du type non supervisées, basées sur l’histogramme de l’image et l’analyse de ses modes?
Techniques de seuillage et de regroupement comme le k-means ou le Meanshift
Avantages du seuillage?
Méthode rapide à calculer
Désavantages du seuillage?
- Des régions connexes peuvent avoir des intensités voisines (des régions qu’on aurait voulu séparer en tant qu’objets distincts peuvent se retrouver du même côté du seuil)
- N’intègre peu ou pas d’information géométrique ou topologique sur les régions.
Quel est le fonctionnement du k-means?
- Choisit la position des centres dans l’espace des caractéristiques en fonction des connaissances sur les classes, ou alors on initialise aléatoirement.
- Affectation : à l’itération i, le pixel j est affecté à une région duquel il est le plus proche.
- M-à-j des centres: Recalcul de la position des centres de chaque région. Position du centre = valeur moyenne des caractéristiques des pixels appartenant à cette classe.
- Test de convergence: Si la nouvelle position des centres des régions est très proche de leur position précédente, on arrête. Sinon, retour à l’étape 2.
Pour le k-means, la position initiale des centres de région aura-t-elle une influence sur le résultat final?
OUI.
Avantages k-means?
Très simple
Inconvénients k-means?
- Exigeant en termes de mémoire
- On doit déterminer le nombre de noyaux
- Sensible à l’initialisation choisie
- Sensible aux observations aberrantes
- Ne trouve que des régions sphériques (distance euclidienne entre le pixel et le centre du cluster)
L’approche meanshift est basée sur quoi?
L’estimation de la densité des probabilités.
On se déplace de proche en proche dans l’espace des caractéristiques pour déterminer là où la densité des points est la plus importance.
On veut conserver juste quelques points représentatifs des points dans cet espace.
Quelle est la procédure de filtrage pour le meanshift?
- Initialisation
- Convergence vers un mode
- On affecte aux éléments présents dans le bassin d’attraction la valeur de niveau de gris moyenne de ces éléments.
Pour le meanshift, c’est quoi le bassin d’attraction?
L’ensemble des positions dans l’espace des caractéristiques qui conduisent au même mode.
Différences entre les techniques de classification non-supervisées et supervisées?
Non-supervisée : on ne dispose pas d’échantillons représentatifs des classes à identifier
Supervisée : on exploite la disponibilité d’échantillons représentatifs des classes
Étapes de la classification basée pixel – Approche non supervisée?
- partitionner l’espace de caractéristiques afin de former des groupes (clusters)
- affecter une classe aux clusters
Étapes de la classification basée pixel – Approche supervisée?
- sélectionner des échantillons représentatifs des classes à identifier
- déterminer des signatures spectrales associées à chaque classe sur la base des échantillons
- appliquer les signatures spectrales à l’ensemble de l’image
Avantages des réseaux de neurones
- Représentation de n’importe quelle dépendance fonctionnelle
- Manipulations minimes avant d’appliquer le réseau de neurones
- Résistance au bruit, au manque de fiabilité des données, aux pannes, parallélisme du réseau
- Simple à manier
- En segmentation, le nombre de clusters est déterminé automatiquement
Inconvénients des réseaux de neurones ?
Le choix des échantillons d’entrainement et leur représentativité influence énormément le résultat de la classification.