Cours 9 - Vision 5 Reconnaissance objets et visages Flashcards

1
Q

**Qu’est-ce que le modèle de Marr?

A
  • Premier modèle cognitif de la reconnaissance des objets.
  • Modèle computationnelle: testé par implémentation sur ordinateur.
  • REPRÉSENTATIONS SYMBOLIQUES.
  • Traitement sériel à 3 étapes: chacune va construire une représentation symbolique de l’objet et où la reconnaissance de la forme est une étape à part entière.
  • MLT: La construction aboutit à une description des différentes parties de l’objet et à leur organisation relative, qui constitue le format de représentation de l’objet en MLT.
  • 3 représentations perceptives (symboliques): Ébauche primitive brute, Ébauche primaire, Ébauche 3D.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment Marr définit-il la reconnaissance visuel?

A

Comme un processus de construction symbolique. Donc, le système visuel va construire, à partir d’une stimulus visuel, un certain nombre de représentations symboliques.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

**Expliquez les étapes perceptives du modèle de Marr.

A

Voir diapo 14.

0) Traitement sensoriel
1) Ébauche primitive brute: Fait le traitement des contours et des surfaces.
2) Ébauche primaire complète 2D 1/2 (dépendante du point de l’observateur): Met en place un regroupement et une cohésion des caractéristiques élémentaires extraites à l’ébauche primitive.
3) Ébauche 3D (indépendantes du point de vue de l’observateur): Représentation structurale.
4) Représentation sémantique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou Faux? Selon Marr, la perception de l’objet se fait de façon séquentielle.

A

Vrai. Son modèle en est un sériel, donc l’étape 1 doit absolument être terminée avant que l’étape 2 se produise.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’ébauche primitive brute dans le modèle de Marr?

A

1ère étape du modèle suite au traitement sensoriel.
Cette représentation est symbolique et est loin de la représentation complète de l’objet. Cette ébauche est essentiellement basée sur les contours et la surface.
Elle sert d’entrée pour le traitement des processus qui vont avoir pour objectif la construction de la 2ème représentation.
L’objectif est de détecter les lieux de discontinuité de l’intensité lumineuse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Modèle de Marr.

Pourquoi l’objectif de l’ébauche primitive brute est de détecter les lieux de discontinuité de l’intensité lumineuse?

A

Car son rôle est de déterminer les contours et la surface de l’objet, ce qui est toute limite liée à une discontinuité lumineuse qui va permettre à l’organisme la ségrégation figure/fond.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Modèle de Marr.

Dans l’ébauche primitive brute, qu’est-ce que le filtrage à fréquence spatiale basse?

A

Filtre ayant pour objet de couper (enlever) les basses fréquences. Cette opération a pour effet d’accentuer les détails de l’image, les contours et le bruit. Toutes les régions uniformes sont éliminées par cette procédure. Donne l’information du contour local (1).
Voir diapo 16.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Modèle de Marr.

Dans l’ébauche primitive brute, qu’est-ce que le filtrage à fréquence spatiale élevée?

A

Filtre ayant pour objet de couper (enlever) les hautes fréquences. Cette opération a pour effet de réduire le bruit et d’ajouter du flou (c’est-à-dire d’éliminer les détails de l’image). Donne l’information du contour global (2).
Voir diapo 16.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Modèle de Marr.

Que permet la superposition des réseaux de fréquences spatiales, hautes et basses (ébauche primaire brute)?

A

De recomposer l’image observée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Modèle de Marr.
Que permet l’extraction de toutes les variations de luminance (intensité de lumière) dans l’image à l’ébauche primaire brute?

A

L’extraction dans l’image de toutes les variations de luminance qui donnent des informations sur le contour permet en soi l’extraction de la carte des contours.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Modèle de Marr.
À l’ébauche primaire brute, que sont les (4) éléments distincts permettant l’élaboration de la représentation symbolique de l’image?

A
  • Tâches: notion de région.
  • Barres: orientation de l’environnement visuel.
  • Bordure: liée à une discontinuité lumineuse.
  • Terminaisons: là où s’arrête une information liée à un contour.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou Faux? Dans l’ébauche primaire brute du modèle de Marr, l’extraction des caractéristiques élémentaires (variations de luminance) ce fait à cette étape et elles sont organisées en un tout structurées.

A

Faux. L’extraction des caractéristiques élémentaires (variations de luminance) ce fait à cette étape et elles sont parcellaires (ne sont pas encore organisée en un tout structurées).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que l’ébauche primitive complète 2D 1/2 du modèle de Marr?

A

2e étape du modèle suite à l’ébauche primitive brute.
Les caractéristiques élémentaires extraites durant la première étape y sont maintenant intégrées et regroupées (cohésion).
L’objet est distingué des autres objets qui l’entoure, donc on a accès à la forme globale de l’objet et ce tout dépendant du point de vue de l’observateur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou Faux? À l’ébauche primitive complète 2D 1/2 du modèle de Marr, la représentation perceptive d’un objet est la même pour tout le monde.

A

Faux. L’ébauche primitive complète 2D 1/2 dépend du point de vue de l’observateur, donc il y a autant de représentations perceptive que d’angles de vues chez chaque personne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que l’ébauche 3D du modèle de Marr?

A

3e étape du modèle faisant suite à l’ébauche primitive complète.
Elle correspond à l’étape de traitement où des représentations d’objets connus sont activées.
C’est une représentation structurale qui est indépendante du point de vue de l’observateur et de l’angle de vue. Ainsi, à cette étape, la représentation de l’objet et invariante/constante malgré sa forme, son orientation, sa taille, etc. Donc, ça nous permet de reconnaître un objet perçu à partir de différents points de vue.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Modèle de Marr.

Que veut-on dire par le fait que la représentation dans l’ébauche 3D est structurale?

A

Représentation structurale : Les objets sont composés de primitives visuelles (géons).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Modèle de Marr.

Que permet la représentation sémantique suite au trois ébauches?

A

Permet d’avoir un accès au sens et aux fonctions de l’objet que l’on regarde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

**Qu’est-ce que le modèle de Biederman?

A

Théorie de la reconnaissance par composantes:
Modèle cherchant à déterminer quelle est l’information importante afin que l’on puisse reconnaître un objet (caractéristiques qui facilitent la reconnaissance).
Pour Biederman, ce sont les jonctions de lignes, et non les segments de lignes, qui sont primordiales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce que l’expérience et les résultats obtenus de Biederman?

A

Expérience:
Présentation de 3 types de dessins…
- dessin complet,
- dessin où les segments de ligne sont enlevés,
- dessin où les jonctions sont enlevés;
avec des pourcentages d’effacement différents…
- 25 %
- 45%
- 65%
et manipulant le temps de présentation des dessins…
- 100 ms
- 200 ms
- 750 ms
La tâche consiste à reconnaître le plus rapidement possible l’objet du dessin.

Résultats:

  • Quand les conditions sont difficiles, temps de présentation de 100 ms, le pourcentage d’erreur moyen est plus élevé que les conditions à 200 et 750 ms.
  • Quand le temps de présentation est faible (100 ms) et le taux d’effacement est élevé (65%), alors le pourcentage d’erreur est plus grand avec les dessins où les jonctions ont été effacées.

Donc, Biderman propose la notion de Géon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

*Dans le modèle de Biderman, que sont les géons?

A

Formes 3D simples qui sont les unités élémentaires de base d’un objet. Donc, sans l’un des géons, la reconnaissance de l’objet est très difficile.
Les relations/configurations entre les géons sont très importantes. Par exemple, une tasse et un sceau ont les deux mêmes géons qui les composent, mais ils ne sont pas positionnés au même endroit… ce qui différencie les deux objets.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou Faux? Les objets reconnaissables peuvent être formés en combinant seulement deux ou trois géons.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Dans le modèle de Biderman, les géons peuvent être caractérisés selon des propriétés/dimensions qui sont invariantes pour reconnaître les objets. Quelles sont-elles?

A
  • Courbure
  • Taille
  • Symétrie
  • Bords
23
Q

Vrai ou Faux? Biderman a établi qu’il y a 38 différents géons étant suffisants pour nous permettre de représenter mentalement une grande partie des objets de notre environnement.

A

Faux. Il y en a 36.

24
Q

Vrai ou Faux? Selon Biderman, notre capacité à reconnaître les objets reposent sur notre capacité à identifier les géons de ceux-ci.

A

Vrai.

25
Q

**Qu’est-ce que le modèle de Riddoch et Humphrey?

A

Modèle basé sur les agnosies visuelles: aperceptives et associatives.
0- Codage des input (mouvements, couleurs, formes, profondeur).
1- Regroupement des bords par colinéarité.
2- Regroupements des caractéristiques en formes.
3- Normalisation.
4- Représentation structurale.
5- Système sémantique.
6- La représentation du nom.

26
Q

Qu’est-ce qu’une agnosie visuelle?

A

Trouble de la reconnaissance visuelle des objets objets ne touchant qu’une seule modalité sensorielle (vision); en l’absence de déficit visuel élémentaire et de déficit majeur d’une autre capacité cognitive.

27
Q

Que sont les (2) classe d’agnosie visuelle et expliquez-les?

A
  • Aperceptives: Le sujet est dans l’incapacité de reconnaître le stimulus cible en raison du mauvais fonctionnement de son système perceptif (à l’exclusion d’un déficit élémentaire). Comprend les agnosie intégratives.
  • Associatives: Le déficit repose sur l’impossibilité à associer le produit de l’analyse visuelle, qui est intacte, avec la connaissance stockée en mémoire que le sujet a sur les propriétés sémantiques et fonctionnelles de ce même stimulus cible.
28
Q

Qu’est-ce que l’agnosie aperceptive?

A

Trouble de la synthèse des informations sensorielles élémentaires multiples traitées de façon indépendantes dans diverses zones d’associations visuelles en une perception structurée.

C’est l’incapacité à reconnaître les objets ou images présentés à la vue alors que tout le système primaire et l’œil sont fonctionnels et en bonne santé (il faut que ces parties là soient intégralement préservées): comportement d’aveugle, rarement isolées, circonlocutions descriptives (il donne des descriptions riches). Mauvais fonctionnement du système perceptif (à l’exclusion d’un déficit élémentaire).

La personne échoue les tests où elle doit décrire les objets qu’elle perçoit visuellement et ceux où elle doit copier un dessin.

29
Q

Qu’est-ce que l’agnosie intégrative?

A

Se traduit par une incapacité à faire une synthèse de ces traits pour en constituer un tout alors que les différents éléments sont reliés entre eux. Serait liée à un déficit des traitements qui sous-tendent les groupements perceptifs et l’intégration des caractéristiques visuelles élémentaires en un objet perceptif cohérent. Malgré un traitement normal des caractéristiques élémentaires de la forme.

Les sujets atteints de ce déficit sont capables de traiter les aspects locaux des formes mais sont dans l’incapacité de les intégrer ensemble afin d’élaborer une forme cohérente.

Cela conduit parfois quand même à reconnaître un objet mais pas à le distinguer parmi d’autres (effet de complexité). (Ex: capacité à reconnaître des objets simples comme une pomme, mais pas les complexe comme un aspirateur.)

30
Q

Qu’est-ce que l’agnosie associative?

A

Correspondent à des troubles de reconnaissance des objets liés à un déficit d’association entre la représentation perceptive dérivée de l’objet et les informations fonctionnelles et sémantiques stockées en mémoire.

Les patients souffrant d’agnosie associative encodent généralement correctement l’objet d’un point de vue perceptif mais sont incapables d’accéder aux informations qui lui sont associées, et sont donc bien souvent incapables de le dénommer et d’en déduire sa fonction.

31
Q

Dans le modèle de Riddoch et Humphrey, quelles sont les caractéristiques élémentaires qui sont codés par le système visuel?

A
  • Mouvements
  • Couleurs
  • Formes
  • Profondeur
32
Q

*Dans le modèle de Riddoch et Humphrey, expliquez en quoi consiste la première étape du modèle.

A

Regroupements des bords par colinéarité:
Organisation des inputs. Les objets sont appréhendés à partir de leurs bords et ces bords sont regroupés selon leur colinéarité.
Cette première étape permet le traitement visuel des objets.

Un déficit à cette étape indique une agnosie aperceptive.

33
Q

*Dans le modèle de Riddoch et Humphrey, expliquez en quoi consiste la deuxième étape du modèle.

A

Regroupements des caractéristiques en formes:
Les caractéristiques de l’objet qui ont été extraites sont combinées pour former des formes globales.

L’impossibilité d’organiser les éléments visuels en une forme globale et de l’impossibilité de discriminer 2 patterns visuels ayant les mêmes traits élémentaires mais pas la même forme globale.

Un déficit à cette étape indique une agnosie intégrative.

34
Q

*Dans le modèle de Riddoch et Humphrey, expliquez en quoi consiste la troisième étape du modèle.

A

La normalisation:
Permet l’invariance de l’objet.
Ce processus peut être non indispensable pour la reconnaissance des objets, donc un déficit à cette étape n’indique pas d’agnosie.

35
Q

*Dans le modèle de Riddoch et Humphrey, expliquez en quoi consiste la quatrième étape du modèle.

A

La représentation structurale:
Représentation mnésique de la forme visuelle de l’objet mais sans le nom de l’objet, ni ses différentes associations. C’est un processus commun à l’imagerie mentale visuelle.

Un déficit à cette étape indique une agnosie associative.

36
Q

*Dans le modèle de Riddoch et Humphrey, expliquez en quoi consiste la cinquième étape du modèle.

A

Système sémantique:
C’est l’ensemble des connaissances d’un sujet indépendantes du mode de présentation des objets. Connaissances sémantiques et fonctionnelles.

37
Q

Expliquez l’expérience en lien avec les bases neuronales liées à la perception des objets?

A

Des neurones du cortex strié chez le singe répondent aux principes de regroupement de la Gestalt.
a) Une barre verticale dans le champs récepteur d’un neurone produit une grande activation.
b) Si on ajoute à la barre verticale des lignes orientées aléatoirement en dehors du champs récepteur du neurone, alors il y a une diminue de l’activation (Pa). (=modulation contextuelle)
c) En plus de la barre verticale et des lignes aléatoires, si on ajoute des lignes toujours hors du champs, mais qui sont alignées avec la barre verticale, alors l’activation augmente. (=organisation gestalt)
Voir diapo 37

38
Q

Expliquez ce qu’est la modulation contextuelle.

A

Les lignes se situant en dehors du champ récepteur du neurone, provoquent une diminution de la fréquence de décharge neuronale. C’est un effet de stimuli en dehors du champs récepteur où le contexte dans lequel la barre apparaît affecte la réponse du neurone face à une ligne verticale.

Le neurone est aussi affecté par l’organisation gestalt même si cette organisation implique des zones en dehors de son champ récepteur: La Similarité et la Continuité
Font que notre ligne verticale dans le champ récepteur se regroupe de façon perceptuelle avec ces autres lignes, augmentant la réponse du neurone.

39
Q

Vrai ou Faux? Les visages sont des vecteurs visuels principaux de l’identité individuelle, et des vecteurs essentiels de communication (verbale et non-verbale), d’intentions et d’émotions entre individus.

A

Vrai. Ce sont des facteurs uniques.

40
Q

Vrai ou Faux? Les mouvements oculaires se dirigent préférentiellement vers les visages d’une scène. Les visages constituent donc des éléments primordiaux d’une scène.

A

Vrai.

41
Q

Quelle est l’aire cérébral responsable de la reconnaissance des visages?

A

L’aire fusiforme des visages (FFA) est située sur le gyrus fusiforme, sur la face inférieure de l’aire temporale (aire inféro-temporale).

42
Q

Que cause une lésion de l’aire fusiforme (FFA)?

A

La prosopagnosie: incapacité à reconnaître les visage.

43
Q

Pourquoi dit-on que la reconnaissance des visages est nécessaire pour notre survie?

A

Car non seulement la reconnaissance des visage est faite grâce à l’aire fusiforme, mais également, une meilleure reconnaissance des visages qui sont menaçants (plus grande activation neuronale)! Ainsi, la reconnaissance des menaces est un aspect lié à la survie des espèces (fuite ou combat).

44
Q

Vrai ou Faux? La FFA répond de manière plus importante en réponse aux visages par rapport à des objets.

A

Vrai. Il s’agit de l’aire fusiforme de la reconnaissance des visages.

45
Q

Vrai ou Faux? La FFA répond de manière plus importante en réponse aux visages intacts par rapport à des visages dont les parties ont été mélangées.

A

Vrai.

46
Q

Expliquez l’expérience réalisé par Andrews et al pour la reconnaissance des visages.

A

Expérience:
L‘utilisation de figures ambiguës (visages et/ou vase) qui donnent lieu à des percepts bi-stables. Observation de la réaction de l’aire fusiforme des visages. Les stimuli sont présentés par paires successives, avec le deuxième stimulus dont le contraste a été modifié pour biaiser la perception vers le visage ou le vase.

Résultats:
Quand l’image est biaisée vers les visages, la réponse neuronale du FFA augmente; alors que lorsque l’image est biaisée vers le vase, la réponse neuronale ne change pas. Montre le rôle du gyrus fusiforme (FFA) dans la perception des visages.

47
Q

Vrai ou Faux? L’activité dans le FFA est plus grande pour des visages de peur que pour des visages neutres.

A

Vrai. Les émotions augmentent la saillance, l’attention portée aux stimuli, ici les visages.

48
Q

En lien avec l’aire fusiforme des visages, que cause une lésion à l’amygdale?

A

Chez un patient dont l’amygdale a été lésée, il n’y a plus de différence d’activité dans le FFA en présence de visages de peur et de visages neutres.

49
Q

Vrai ou Faux? L’aire fusiforme est la seule impliquée dans la reconnaissance des visages..

A

Faux. Il y a aussi des zones négatives qui sont impliquées.

50
Q

Expliquez ce qu’est l’enregistrement EEG.

A

Utilisation d’un EEG: Des potentiels évoqués visuels enregistrent l’activité électrique du cerveau en réponse à différentes catégories de stimuli visuels et moyennent entre elles les réponses évoquées par les stimuli appartenant à la même catégorie.

51
Q

Enregistrement en occipito-temporal a permis de mettre en évidence l’onde négative N170. Qu’est-ce que le N170 en lien avec le FFA?

A

Mise en évidence d’une onde négative, sélective pour les visages, atteignant son maximum d’amplitude aux alentours de 170ms. La N170 est donc une composante évoqué et désigne la modification du potentiel électrique (microvolts) produite par le système nerveux en réponse à une stimulation externe, soit la présentation d’un visage.

Il y a une activation préférentielle dans l’hémisphère droit au niveau occipito-temporal, comparativement à l’hémisphère gauche, à la présentation d’un visage.

52
Q

N170, qui culminent vers 150-200 ms, et sont particulièrement amples en réponse aux visages (peut importe l’angle ou l’orientation) par comparaison à des visages d’animaux, à d’autres objets visuels, et à des patterns sans signification.

A

Ok.

53
Q

Pourquoi la N170 semble refléter des processus spécifiques de l’encodage structural des visages?

A

Car, contrairement au traitement de nombreux objets visuels, encodés à partir des éléments les composant(traitement analytique), le traitement des visages semble reposer de façon cruciale sur l’encodage des relations entre les traits faciaux (traitement configural).