Cours 4 Flashcards
Comment reconnaît-on les objets ?
Cellules ganglionnaires rétiniennes et LGN =
Taches
Comment reconnaît-on les objets ?
Cortex visuel primaire =
Barres
Comment les taches et les barres deviennent-elles des objets et des surfaces ?
De toute évidence, notre cerveau fait quelque chose d’assez sophistiqué au-delà de V1
Cortex extrastrié =
Région du cortex bordant le cortex visuel primaire et contenant plusieurs zones impliquées dans le traitement visuel
V2, V3, V4, cortex inférotemporal, etc.
Après le cortex extrastrié, le traitement des informations sur les objets est divisé en une voie ___ et une voie ___
Une voie Quoi et une voie Où
La voie Où (dorsale) concerne ___
Les emplacements et les formes des objets (mais pas leurs noms ou leurs fonctions)
La voie Quoi (ventrale) concerne ___
Les noms et les fonctions des objets (quel que soit leur emplacement)
Vrai ou faux
La division Où/Quoi ne tient pas toujours la route
Vrai (preuves qu’elles ne sont pas toujours hermétiques)
Vrai ou faux
Les champs récepteurs des cellules extrastriées sont plus sophistiqués que ceux du cortex strié
Vrai (ils répondent à des propriétés visuelles importantes pour la perception des objets)
En quoi consiste le principe du boundary ownership ?
Pour une frontière donnée, quel côté fait partie de l’objet et quel côté fait partie de l’arrière-plan ?
Est-ce que les cellules de V1 sont capables d’identifier les bordures ?
Oui
Est-ce que les cellules de V1 sont capables d’identifier à qui appartient les bordures (principe de figure-fond) ?
Non (à partir de V2 : début de la vision intermédiaire)
Généralement, les cellules attribuent la figure à la couleur plus ___ de l’image
Foncée
Cortex inférotemporal (IT) =
Partie inférieure du lobe temporal, importante pour la reconnaissance des objets (une partie de la voie Quoi)
Le cortex inférotemporal comprend PPA, FFA, EBA
PPA =
FFA =
EBA =
PPA = scènes
FFA = visages
EBA = corps
Est-ce que, par exemple, si on a une lésion au PPA, on n’est plus du tout capable de reconnaitre des visages ?
Non pas si simple que ça (tout de même difficulté)
Plus on approche du cortex inférotemporal, plus le traitement est ___
Complexe
Lésion (en neuropsychologie) = (2)
(1) Une région du cerveau endommagé
(2) Détruire une partie du cerveau
Qu’est-ce qui conduit à des agnosies ?
Lorsque le cortex IT est lésé
Agnosie =
Incapacité à reconnaître les objets malgré la capacité de les voir
Quelles sont les principales propriétés du champ récepteur des neurones de IT ? (3)
(1) Très grands (certains couvrent la moitié du champ visuel)
(2) Ne répondent pas bien aux taches ou aux lignes
(3) Répondent bien aux stimuli tels que les mains, les visages ou les objets
En quoi consiste la théorie des cellules grand-mère ?
Idée comme quoi un seul neurone a comme job d’identifier grand-mère, un autre neurone qui répond à notre grand-père, un autre neurone qui répond à un autre chose, etc.
Quelle étude supporte la théorie des cellules grand-mère ?
L’étude de Quiroga et al. (sur des patients épileptiques)
En présentant des centaines d’images différentes : un neurone répondait toujours quand il y avait Jennifer Aniston sur une image (ou la voix de Jennifer Aniston)
Quel est le problème avec la théorie des cellules grand-mère ?
Si le neurone meurt, on ne reconnait plus notre grand-mère, par exemple (ce qui est peu plausible)
Vrai ou faux
La reconnaissance d’objets est assez lente
Faux (rapide : 150 ms)
Quelles technologies permettent de mesurer la vitesse de la reconnaissance ?
EEG, MEG
En quoi consiste le processus feed-forward ?
Processus qui effectue un calcul (par exemple, la reconnaissance d’objets) une étape neuronale après l’autre, sans avoir besoin de rétroaction d’une étape ultérieure à une étape antérieure
Qui a proposé la théorie de la hiérarchie inversée ?
Hochstein & Ahissar (2002)
En quoi consiste la théorie de la hiérarchie inversée ? (feed-forward et feed-back)
(1) Les processus feed-forward donnent des informations brutes initiales sur les objets en activant des parties de haut niveau du cortex visuel
Ex : pour reconnaissance visage
(2) Des informations plus détaillées deviennent disponibles lorsque l’activation redescend (feed-back) dans la hiérarchie vers des zones visuelles inférieures où les informations détaillées sont conservées
Ex : pour reconnaitre si visage est en colère
Exemple du problème de la reconnaissance d’objet
Plusieurs images différentes d’éléphants : même si ce ne sont qu’un tas de pixels sur un écran, nous sommes capable d’identifier les éléphants
En quoi consiste l’analogie des cinq personnes aveugles ?
Chaque personne peut toucher une partie de l’éléphant
Isolées : seraient probablement incapables de reconnaitre l’éléphant
Par contre : combinées, seraient probablement capables de reconnaitre éléphant
Possible de recréer l’analogie au niveau visuel
Si on pouvait voir qu’une partie d’une image…
Vision de bas niveau =
Les caractéristiques de base ont été extraites de l’image
Vision de haut niveau =
La reconnaissance d’objet et la compréhension de la scène
Vision de niveau intermédiaire =
Après la vision de bas niveau et avant la vision de haut niveau
Comment trouve-t-on les bords des objets ?
Les cellules du cortex visuel primaire ont de petits champs récepteurs
Vrai ou faux
Les détecteurs de bord informatisés sont aussi performants que les humains
Faux
Parfois, les ordinateurs ne trouvent pas les bords que les humains voient facilement
Contour illusoire =
Un contour qui est perçu même si rien ne change d’un côté du contour à l’autre
Au niveau des contours illusoires, pourquoi est-ce qu’on imagine un contour ?
Le cerveau doit se faire une idée de ce qui est le plus probable (tire la conclusion la plus logique)
À quelle théorie on associe la phrase suivante :
Le tout est plus grand que la somme des parties
Gestalt
En quoi consiste la règle de la bonne continuation ?
Une règle de regroupement de la Gestalt indiquant que deux éléments auront tendance à se regrouper s’ils se trouvent sur le même contour
Vrai ou faux
La bonne continuation n’explique pas tout
Vrai
En quoi consiste la segmentation de texture ?
Découpage d’une image en régions de propriétés de texture communes
La nature même de la segmentation de texture va impliquer des processus comme la ___
Similarité
En quoi consiste la règle de similarité (Gestalt) ?
Les éléments similaires ont tendance à se regrouper
Règles de regroupement :
En quoi consiste la règle de proximité (Gestalt) ?
Les objets proches les uns des autres ont tendance à se regrouper
Règles de regroupement :
Quelle est la limite lorsqu’il y a opposition de la similarité et de la proximité ?
Il ne semble pas y avoir de regroupement spontané
Segmentation et regroupements des textures :
En quoi consiste le principe de parallélisme (Gestalt) ?
Les contours parallèles appartiennent probablement au même groupe
Segmentation et regroupements des textures :
En quoi consiste le principe de symétrie (Gestalt) ?
Les régions symétriques sont plus susceptibles d’être considérées comme un groupe
Segmentation et regroupements des textures :
En quoi consiste le principe de région commune ?
Éléments sont regroupés s’ils semblent appartenir même région plus grande
Segmentation et regroupements des textures :
En quoi consiste le principe de connectivité ?
Les éléments auront tendance à se regrouper s’ils sont connectés
Le regroupement par région commune et le regroupement par connectivité l’emportent sur ___
La règle de proximité
Camouflage =
Exploitation des principes de la Gestalt
Pour arriver à intégrer un tout, on doit travailler en ___
Comité
Les comités de la Gestalt est une métaphore ___
Du fonctionnement de la perception et du cerveau
Les comités doivent intégrer les avis contradictoires et parvenir à un ___
Consensus
Quelles sont les deux principales règles du comité de la Gestalt ?
(1) Respecter la physique
(2) Éviter les accidents
Figure ambigue =
Un stimulus visuel qui donne lieu à deux ou plusieurs interprétations de son identité ou de sa structure
En quoi consiste le point de vue accidentel ?
Une position de visualisation qui produit une certaine régularité dans l’image visuelle qui n’est pas présente dans le monde
Ex : tour perçue comme soutenue par touristes
Une position de visualisation qui produit une certaine régularité dans l’image visuelle qui n’est pas présente dans le monde
Ex : tour perçue comme soutenue par touristes
Faux
Les comités de perception supposent que les points de vue ne sont pas accidentels
Principes de discrimination figure-fond de la Gestalt (5)
(1) Entourage : zone entourée = considérée comme figure
(2) Taille : plus petite région = considérée comme figure
(3) Symétrie : région symétrique = considérée comme figure
(4) Parallélisme : région au contour parallèle = considérée comme figure
(5) Mouvement relatif : région qui se déplace devant une autre = considérée comme figure
En quoi consiste la caractéristique non accidentelle ?
Caractéristique d’un objet qui ne dépend pas de la position de visualisation exacte (ou accidentelle) de l’observateur
Ex : la tour est penchée (ce ne sont pas les touristes qui la tiennent)
Jonctions en T =
Haut du T ?
Tige du T ?
*Voir schéma p.15
Indiquent l’occlusion
Haut du T = devant
Tige du T = derrière
Jonctions en Y =
*Voir schéma p.15
Indiquent les coins faisant face à l’observateur (indice de profondeur)
Jonctions fléchées =
*Voir schéma p.15
Indiquent les coins opposés à l’observateur
En quoi consiste l’effet de supériorité globale ?
Les propriétés globales de l’objet (entier) priment sur les propriétés locales (des parties) de l’objet
Quelle est l’exception à l’effet de supériorité globale ?
Les personnes autistes : ont tendance à porter attention aux détails en premier
Quelles sont les cinq principes de la vision intermédiaire ?
(1) Rassemblement de ce qui devrait être réuni
(2) Division de ce qui devrait être divisé
(3) utilisation de ce que l’on sait
(4) Éviter les accidents
(5) Recherche du consensus et évitement de l’ambiguité
Vrai ou faux
En passant de V1 à IT dans la voie Quoi les neurones répondent à des stimuli de plus en plus complexes
Vrai
Au niveau de V4, les cellules s’intéressent aux stimuli tels que ___
Les fans, les spirales et les moulinets
Il est difficile de savoir exactement ce que les neurones V4 aiment, mais on sait que c’est quelque chose de plus compliqué que des taches ou des barres lumineuses
Quelle technologie peut nous aider à identifier les régions du cerveau qui répondent le mieux à certains stimuli ?
L’imagerie fonctionnelle
En quoi consiste la méthode de soustraction (classique) ?
Comparaison de l’activité cérébrale mesurée dans deux conditions
La différence entre les images peut montrer les régions cérébrales spécifiquement activées par ce processus mental
Quelle est la limite de la méthode de soustraction ?
À la base : présuppose que le neurone ne répond pas aux deux (ne prend pas avantage de toute l’info que notre cerveau peut traiter)
La méthode de soustraction est délaissée pour ___
Permet de comprendre de manière plus précise comment on traite l’info dans notre cerveau
La technique de décodage (IRMf)
Quelles sont les étapes de la méthode de codage ? (3)
(1) Scans IRMf d’un participant regardant de nombreuses images de différentes catégories connues
(2) Entraînement d’un modèle informatique pour reconnaître l’activité cérébrale de chaque catégorie
(3) Test ensuite du modèle informatique pour voir s’il peut identifier une image non entraînée en fonction de ce qu’il a appris
Gabarits (template) versus descriptions structurelles :
En quoi consiste la théorie des templates ?
La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même forme dans le cerveau
Ex : pour une vache donnée, on a un template (gabarit de la vache)
Quelle est la limite de la théorie des templates ?
Il faudrait trop de gabarits
Ex : gabarit pour A attaché, A détaché, A majuscule, A minuscule, etc.
Gabarits (template) versus descriptions structurelles :
En quoi consiste la description structurelle ?
Description d’un objet en termes de ses parties et des relations entre ces parties
Ex : pour reconnaitre la vache, on va considérer les différentes caractéristiques de la vache
Qui est derrière la théorie de la reconnaissance par composants ?
Biederman (1987)
En quoi consiste la théorie de la reconnaissance par composants ?
Soutient que les objets sont reconnus par les identités et les relations de leurs composants
Géons =
Ions géométriques à partir desquels les objets sont construits
Réseau neuronal profond (DNN) =
Réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets
Comment fonctionne les DNNs ? (2)
(1) De nombreuses instances d’un objet sont montrées au réseau, avec du feedback
(2) Au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé
Quelle est la solution au pseudo-paradoxe de la perception ?
Le monde est dans une large mesure à l’intérieur de notre cerveau
Le monde est tel que nous le percevons, mais le monde est différent pour tous !!