Cours 4 – Percevoir et reconnaitre les objets Flashcards
Comment reconnaît-on les objets ?
Cellules ganglionnaires rétiniennes et LGN = Taches
Cortex visuel primaire = Barres
Qu’est-ce que le cortex extrastrié?
La région du cortex bordant le cortex visuel primaire et contenant plusieurs zones impliquées dans le traitement visuel (V2, V3, V4, cortex inférotemporal, etc).
Qu’est-ce que la voie du “QUOI”?
Voie ventrale, concerne les noms (identité) et les fonctions des objets, quel que soit leur emplacement.
Qu’est-ce que la voie du “OÙ”?
Voie dorsale, concerne les emplacements et les formes des objets, mais pas leurs noms ou leurs fonctions.
Quel est la différence entre les champs récepteur des cellules extrastriées comparativement à ceux du cortex strié?
Les champs récepteurs des cellules extrastriées sont plus sophistiqué. La taille augmente quand on avance dans le cortex, et donc un plus gros champ récepteur traite plus d’information.
Qu’est-ce que le concept de «boundary ownership»?
Pour une frontière donnée, quel côté fait partie de l’objet et quel côté fait partie de l’arrière-plan ?
Qu’est-ce que le cortex inférotemporal (IT)?
Partie du cortex cérébral dans la partie inférieure du lobe temporal, importante pour la reconnaissance des objets. Elle forme une partie de la voie « quoi ».
À quoi servent les lésions en neuropsychologie?
Apportent des connaissances sur le cortex visuel.
Que se passe-il lorsque le cortex inférotemporal (IT) est lésé?
Des agnosies.
Qu’est-ce qu’une agnosie?
Incapacité à reconnaître les objets malgré la capacité de les voir.
Quels sont les 2 types de prosopagnosie?
Acquise (à la suite d’un accident - ne reconnait plus les visages).
Congénitale/développementale (à la naissance).
Quels sont les propriétés du champ récepteur des neurones de IT?
Ils sont très grand (couvrent la moitié du champ visuel).
Ne répondent pas bien aux taches ou aux lignes.
Répondent bien aux stimuli tels que les mains, les visages ou les objets.
Qu’est-ce que le concept de cellule grand-mère? Est-ce possible?
Il y aurait 1 neurone par objet/concept.
Très peu probable.
Quel est le temps minimal pour la reconnaissance d’objet?
Des études disent en aussi peu de 150ms.
Qu’est-ce qu’un processus “feed-forward”? Dans quel contexte peut-il s’appliquer?
Un processus qui effectue un calcul une étape neuronale après l’autre, sans avoir besoin de rétroaction d’une étape ultérieure à une étape antérieure.
La reconnaissance d’objet.
Qu’est-ce que la théorie de la hiérarchie inversée?
Une proposition de Hochstein & Ahissar (2002) que les processus feed-forward donnent des informations brutes initiales sur les objets en activant des parties de haut niveau du cortex visuel.
Des informations plus détaillées deviennent disponibles lorsque l’activation redescend (feed-back) dans la hiérarchie vers des zones visuelles inférieures où les informations détaillées sont conservées.
Quel est le problème de la reconnaissance d’objet?
Comment votre système visuel passe-t-il des points lumineux, comme les pixels, à des entités entières dans le monde?
Quel est la différence entre les éléments locaux et globaux?
Les éléments locaux sont les parties spécifiques, tandis que globaux sont l’ensemble de l’élément.
Qu’est-ce que la vision de niveau intermédiaire?
Une étape vaguement définie du traitement visuel qui intervient après que les caractéristiques de base ont été extraites de l’image (vision de bas niveau) et avant la reconnaissance d’objet et la compréhension de la scène (vision de haut niveau).
Qu’implique la vision de niveau intermédiaire?
Implique la perception des bords et des surfaces.
Détermine quelles régions d’une image doivent être regroupées en objets.
Pourquoi les détecteurs de bords informatisé ne sont pas aussi performant que les humains?
Car ils ne peuvent pas trouver des bords que les humains voient facilement avec des contrastes de luminosité. Ils ne perçoivent pas la faille.
Qu’est-ce qu’un contour illusoire?
Un contour qui est perçu même si rien ne change d’un côté du contour à l’autre.
Aucune information permet de prédire un bord, mais il y a la perception d’un bord.
Qu’est-ce que la théorie de la Gestalt?
Théorie selon laquelle “le tout est plus grand que la somme de ses parties”.
Que sont les règles de regroupement de la Gestalt?
- Bonne continuation
- Segmentation de texture
- Similarité
- Proximité
- Parallélisme
- Symétrie
- Région commune
- Connectivité
Qu’est-ce que la règle de bonne continuation?
Une règle de regroupement de la Gestalt indiquant que deux éléments auront tendance à se regrouper s’ils se trouvent sur le même contour.
Qu’est-ce que la règle de segmentation de texture?
Découpage d’une image en régions de propriétés de texture communes.
Qu’est-ce que la règle de similarité?
Les éléments similaires ont tendance à se regrouper.
Qu’est-ce que la règle de proximité?
Les objets proches les uns des autres ont tendance à se regrouper.
Qu’est-ce que la règle de parallélisme?
Les contours parallèles appartiennent probablement au même groupe.
Qu’est-ce que la règle de symétrie?
Les régions symétriques sont plus susceptibles d’être considérées comme un groupe.
Qu’est-ce que la règle de région commune?
Les éléments sont regroupés s’ils semblent appartenir à la même région plus grande.
Qu’est-ce que la règle de connectivité?
Les éléments auront tendance à se regrouper s’ils sont connectés.
Que résout les comités de la Gestalt?
Les ambiguïtés.
Que sont les règles du comité de la Gestalt?
Respectez la physique et évitez les accidents!
Qu’est-ce qu’une figure ambiguë?
Un stimulus visuel qui donne lieu à deux ou plusieurs interprétations de son identité ou de sa structure.
Les comités perceptifs ont tendance à obéir aux lois de la physique.
Qu’est-ce qu’un point de vue accidentel?
Une position de visualisation qui produit une certaine régularité dans l’image visuelle qui n’est pas présente dans le monde.
Les comités de perception supposent que les points de vue ne sont pas accidentels.
Qu’est-ce que la discrimination figure-fond?
Déterminer quelle partie de l’environnement est la figure de sorte que celle-ci ressort du fond.
Quels sont les principes de discrimination figure-fond de la Gestalt?
- Entourage
- Taille
- Symétrie
- Parallélisme
- Mouvement relatif
Qu’est-ce que le principe de discrimination de l’entourage dans les règles de discrimination de la Gestalt?
Les zones qui peuvent être considérées comme entourées par d’autres ont tendance à être considérées comme des figures (objets).
Qu’est-ce que le principe de discrimination de la taille dans les règles de discrimination de la Gestalt?
La plus petite région est susceptible d’être la figure.
Qu’est-ce que le principe de discrimination de la symétrie dans les règles de discrimination de la Gestalt?
Une région symétrique a tendance à être considérée comme une figure.
Qu’est-ce que le principe de discrimination du parallélisme dans les règles de discrimination de la Gestalt?
Les régions aux contours parallèles ont tendance à être considérées comme des figures.
Qu’est-ce que le principe de discrimination du mouvement relatif dans les règles de discrimination de la Gestalt?
Si une région se déplace devant une autre, la région la plus proche est représentée.
Qu’est-ce qu’une caractéristique non accidentelle?
Caractéristique d’un objet qui ne dépend pas de la position de visualisation exacte (ou accidentelle) de l’observateur.
Quels sont les 3 types de caractéristiques non accidentelle?
Jonction en T
Jonction en Y
Jonction fléchée
Qu’est-ce qu’une jonction en T?
Indiquent l’occlusion. Le haut du T est devant et la tige du T est derrière.
Qu’est-ce qu’une jonction en Y?
Indiquent les coins faisant face à l’observateur.
Qu’est-ce qu’une jonction fléchée?
Indiquent les coins opposés à l’observateur.
Qu’est-ce que l’effet de supériorité globale?
Les propriétés de l’objet globale (entier) priment sur les propriétés locales (des parties) de l’objet.
Qu’est-ce qu’une figure de Navon?
Information composée d’une autre information (figure locale pour une figure globale).
Quels sont les 5 principes de la vision moyenne?
- Rassemblez ce qui devrait être réuni
- Divisez en deux ce qui devrait être divisé en deux
- Utilisez ce que vous savez
- Évitez les accidents
- Rechercher le consensus et éviter l’ambiguïté
Les neurones de quel aire peuvent reconnaitre les fans, les spirales et les moulinets?
L’aire V4.
Quel est la différence entre une surface qui pointe vers la droite et cette même surface qui ne répond pas lorsque l’aire V4 hérite des informations de l’aire V2?
Le neurone est capable de faire sa part, sauf s’il est le produit d’une occlusion.
Qu’est-ce que la méthode de soustraction (classique)?
Comparaison de l’activité cérébrale mesurée dans deux conditions. La différence entre les images peut montrer les régions cérébrales spécifiquement activées par ce processus mental.
Qu’est-ce que la méthode de décodage?
Utiliser des scans de IRMf afin d’entraîner un modèle informatique à reconnaître l’activité cérébrale de chaque catégorie pour tester le modèle afin de voir s’il peut identifier une image non entraînée.
Qu’est-ce que la théorie des template (gabarits)?
La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même “forme” dans le cerveau.
Qu’est-ce que la description structurelle?
Description d’un objet en termes de ses parties et des relations entre ces parties.
Qu’est-ce que la théorie de la reconnaissance d’objets de Biederman?
Les objets sont reconnus par les identités et les relations de leurs composants.
Qu’est-ce qu’un géons?
Les « ions géométriques » à partir desquels les objets sont construits.
Combien y a-t-il de géons dans le modèle de Biederman?
36 géons.
Qu’est-ce qu’un réseau neuronal profond (DDN)?
Un réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets où de nombreuses instances d’un objet sont montrées au réseau, avec du feedback. Au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé.
Quel est la solution au pseudo-paradoxe de la perception?
Deux segments partageants un coin sur l’image rétinienne partagent vraisemblablement un coin dans le monde.
Les objets ont tendance à être symétriques.
Le monde est tel que nous le percevons, mais le monde est différent pour tous !!
Combien de pourcentage de l’information dans la lumière visible parvient au cortex extrastrié?
Moins de 0,04%.