Cours 9 - Vision 5 Reconnaissance objets et visages Flashcards
**Qu’est-ce que le modèle de Marr?
- Premier modèle cognitif de la reconnaissance des objets.
- Modèle computationnelle: testé par implémentation sur ordinateur.
- REPRÉSENTATIONS SYMBOLIQUES.
- Traitement sériel à 3 étapes: chacune va construire une représentation symbolique de l’objet et où la reconnaissance de la forme est une étape à part entière.
- MLT: La construction aboutit à une description des différentes parties de l’objet et à leur organisation relative, qui constitue le format de représentation de l’objet en MLT.
- 3 représentations perceptives (symboliques): Ébauche primitive brute, Ébauche primaire, Ébauche 3D.
Comment Marr définit-il la reconnaissance visuel?
Comme un processus de construction symbolique. Donc, le système visuel va construire, à partir d’une stimulus visuel, un certain nombre de représentations symboliques.
**Expliquez les étapes perceptives du modèle de Marr.
Voir diapo 14.
0) Traitement sensoriel
1) Ébauche primitive brute: Fait le traitement des contours et des surfaces.
2) Ébauche primaire complète 2D 1/2 (dépendante du point de l’observateur): Met en place un regroupement et une cohésion des caractéristiques élémentaires extraites à l’ébauche primitive.
3) Ébauche 3D (indépendantes du point de vue de l’observateur): Représentation structurale.
4) Représentation sémantique
Vrai ou Faux? Selon Marr, la perception de l’objet se fait de façon séquentielle.
Vrai. Son modèle en est un sériel, donc l’étape 1 doit absolument être terminée avant que l’étape 2 se produise.
Qu’est-ce que l’ébauche primitive brute dans le modèle de Marr?
1ère étape du modèle suite au traitement sensoriel.
Cette représentation est symbolique et est loin de la représentation complète de l’objet. Cette ébauche est essentiellement basée sur les contours et la surface.
Elle sert d’entrée pour le traitement des processus qui vont avoir pour objectif la construction de la 2ème représentation.
L’objectif est de détecter les lieux de discontinuité de l’intensité lumineuse.
Modèle de Marr.
Pourquoi l’objectif de l’ébauche primitive brute est de détecter les lieux de discontinuité de l’intensité lumineuse?
Car son rôle est de déterminer les contours et la surface de l’objet, ce qui est toute limite liée à une discontinuité lumineuse qui va permettre à l’organisme la ségrégation figure/fond.
Modèle de Marr.
Dans l’ébauche primitive brute, qu’est-ce que le filtrage à fréquence spatiale basse?
Filtre ayant pour objet de couper (enlever) les basses fréquences. Cette opération a pour effet d’accentuer les détails de l’image, les contours et le bruit. Toutes les régions uniformes sont éliminées par cette procédure. Donne l’information du contour local (1).
Voir diapo 16.
Modèle de Marr.
Dans l’ébauche primitive brute, qu’est-ce que le filtrage à fréquence spatiale élevée?
Filtre ayant pour objet de couper (enlever) les hautes fréquences. Cette opération a pour effet de réduire le bruit et d’ajouter du flou (c’est-à-dire d’éliminer les détails de l’image). Donne l’information du contour global (2).
Voir diapo 16.
Modèle de Marr.
Que permet la superposition des réseaux de fréquences spatiales, hautes et basses (ébauche primaire brute)?
De recomposer l’image observée.
Modèle de Marr.
Que permet l’extraction de toutes les variations de luminance (intensité de lumière) dans l’image à l’ébauche primaire brute?
L’extraction dans l’image de toutes les variations de luminance qui donnent des informations sur le contour permet en soi l’extraction de la carte des contours.
Modèle de Marr.
À l’ébauche primaire brute, que sont les (4) éléments distincts permettant l’élaboration de la représentation symbolique de l’image?
- Tâches: notion de région.
- Barres: orientation de l’environnement visuel.
- Bordure: liée à une discontinuité lumineuse.
- Terminaisons: là où s’arrête une information liée à un contour.
Vrai ou Faux? Dans l’ébauche primaire brute du modèle de Marr, l’extraction des caractéristiques élémentaires (variations de luminance) ce fait à cette étape et elles sont organisées en un tout structurées.
Faux. L’extraction des caractéristiques élémentaires (variations de luminance) ce fait à cette étape et elles sont parcellaires (ne sont pas encore organisée en un tout structurées).
Qu’est-ce que l’ébauche primitive complète 2D 1/2 du modèle de Marr?
2e étape du modèle suite à l’ébauche primitive brute.
Les caractéristiques élémentaires extraites durant la première étape y sont maintenant intégrées et regroupées (cohésion).
L’objet est distingué des autres objets qui l’entoure, donc on a accès à la forme globale de l’objet et ce tout dépendant du point de vue de l’observateur.
Vrai ou Faux? À l’ébauche primitive complète 2D 1/2 du modèle de Marr, la représentation perceptive d’un objet est la même pour tout le monde.
Faux. L’ébauche primitive complète 2D 1/2 dépend du point de vue de l’observateur, donc il y a autant de représentations perceptive que d’angles de vues chez chaque personne.
Qu’est-ce que l’ébauche 3D du modèle de Marr?
3e étape du modèle faisant suite à l’ébauche primitive complète.
Elle correspond à l’étape de traitement où des représentations d’objets connus sont activées.
C’est une représentation structurale qui est indépendante du point de vue de l’observateur et de l’angle de vue. Ainsi, à cette étape, la représentation de l’objet et invariante/constante malgré sa forme, son orientation, sa taille, etc. Donc, ça nous permet de reconnaître un objet perçu à partir de différents points de vue.
Modèle de Marr.
Que veut-on dire par le fait que la représentation dans l’ébauche 3D est structurale?
Représentation structurale : Les objets sont composés de primitives visuelles (géons).
Modèle de Marr.
Que permet la représentation sémantique suite au trois ébauches?
Permet d’avoir un accès au sens et aux fonctions de l’objet que l’on regarde.
**Qu’est-ce que le modèle de Biederman?
Théorie de la reconnaissance par composantes:
Modèle cherchant à déterminer quelle est l’information importante afin que l’on puisse reconnaître un objet (caractéristiques qui facilitent la reconnaissance).
Pour Biederman, ce sont les jonctions de lignes, et non les segments de lignes, qui sont primordiales.
Qu’est-ce que l’expérience et les résultats obtenus de Biederman?
Expérience:
Présentation de 3 types de dessins…
- dessin complet,
- dessin où les segments de ligne sont enlevés,
- dessin où les jonctions sont enlevés;
avec des pourcentages d’effacement différents…
- 25 %
- 45%
- 65%
et manipulant le temps de présentation des dessins…
- 100 ms
- 200 ms
- 750 ms
La tâche consiste à reconnaître le plus rapidement possible l’objet du dessin.
Résultats:
- Quand les conditions sont difficiles, temps de présentation de 100 ms, le pourcentage d’erreur moyen est plus élevé que les conditions à 200 et 750 ms.
- Quand le temps de présentation est faible (100 ms) et le taux d’effacement est élevé (65%), alors le pourcentage d’erreur est plus grand avec les dessins où les jonctions ont été effacées.
Donc, Biderman propose la notion de Géon.
*Dans le modèle de Biderman, que sont les géons?
Formes 3D simples qui sont les unités élémentaires de base d’un objet. Donc, sans l’un des géons, la reconnaissance de l’objet est très difficile.
Les relations/configurations entre les géons sont très importantes. Par exemple, une tasse et un sceau ont les deux mêmes géons qui les composent, mais ils ne sont pas positionnés au même endroit… ce qui différencie les deux objets.
Vrai ou Faux? Les objets reconnaissables peuvent être formés en combinant seulement deux ou trois géons.
Vrai.