cours 5 Flashcards

1
Q

PERCEPTION DE LA FORME

A

La perception de la forme visuelle est peut-être l’aspect de notre fonctionnement perceptif que l’on prend le plus pour acquis. Pourtant, la problématique de la perception de la forme demeure loin d’être résolue.

On peut noter par exemple que la projection rétinienne d’un objet demeure toujours ambigue quant à sa forme réelle.

La discrimination entre les contours qui délimitent un objet, ceux qui appartiennent à cet objet, et ceux créés par l’ombrage constitue un autre problème que doit résoudre le système visuel.

Parfois, certaines portions du contour d’un objet ne présentent aucun contraste relativement au fond devant lequel il se situe. Nous n’avons pourtant aucune difficulté à percevoir la continuité du contour en question.

Les contours permettent de bien définir les objets
Pas si simple que ça car contour à l’intérieur de l’objet aussi et l’ombrage produit aussi des contour (a, b,c)

L’image rétinienne des objets est souvent partiellement cachée par d’autres, ambiguë ou dégradée?
On arrive quand même à bien deviner ce qu’est sur l’image. On surmonte ses obstacles

Cube de Necker: aspect prédimentionnel. La profondeur est ambiguë

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La forme de la projection rétinienne des objets change selon :
sa taille change selon:

A

La forme de la projection rétinienne des objets change selonle point de vue et sa taille change selon la distance.

Aucune difficulté de reconnaitre que c’est la même chaise: constance de forme

Rapprochement entre visage a et visage b: on sait que c’est la même personne même si pas la même image

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Début du 20e siècle -> Structuralisme (ou élémentarisme):

A

L’expérience perceptive repose sur l’addition de sensations élémentaires.

Triangle « structuraliste » Visage « structuraliste »

Pourquoi on est capable de voir un triangle: à cause de la somme des parties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En termes des traits encodés par l’aire V1, la théorie structuraliste supposerait par exemple que :

A

notre représentation visuelle repose exclusivement sur une simple combinaison, ou addition de l’information captée par les neurones individuels de V1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

1912 -> Gestaltisme:

A

“Le tout est plus que la somme de ses parties.” La perception est fonction de configurations globales.

Triangle gestaltiste et contours subjectifs
La création de mouvement = création de notre cerveau

On voit un triangle parce que notre cerveau le crée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Essentiel de l’approcheGestaltisme:
Question: Quelles sont les règles par lesquelles notre système perceptif intègre des éléments locaux en une représentation globale de la forme?

A

C’est un objectif important de la vision de niveau intermédiaire (« middle vision ») que d’effectuer cette intégration. La vision intermédiaire (autre nom) se distingue de la vision précoce, ou de bas niveau, dont le rôle est d’encoder les propriétés locales de la stimulation (ex: aire V1). Elle se distingue également de la vision de haut niveau, dont la fonction est d’interpréter les scènes visuelles et de reconnaître les objets (perception de la forme globale, capacité à interpréter).

Intermédiaire: différent de bas niveau et haut niveau

Propriété locale = toutes les petites parties de l’image

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

L’approche Gestaltiste a dominé l’approche comportementale pour l’étude de la perception jusqu’aux années 1960. Les travaux menés pendant cette période se sont intéressés particulièrement à deux questions fondamentales pour la perception de la forme:

A
  • l’organisation perceptive
  • la discrimination figure-fond (décider c’est quoi l’objet et le fond sur lequel il est)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

ORGANISATION PERCEPTIVE

A

Les lois ou principes de l’organisation perceptive sont des règles qui guident l’intégration des éléments locaux d’une image en une représentation globale.
Conflit entre les lois, contradiction = système visuel doit décider
Loi donc pas obligatoire car on doit obéir à une et pas faire l’autre = pas bon système

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pragnanz (‘bonne figure’):

A

Les groupements perceptifs effectués par notre système visuel sont ceux correspondant à la structure la plus simple parmi toutes celles possibles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Bonne continuité:

A

Des éléments disparates qui forment un tracé continu seront regroupés ensemble. Les segments d’une ligne interrompue seront regroupés afin de former le tracé le plus régulier possible.

L’organisation perceptive n’implique pas que l’intégration de contours, mais également la segmentation et le regroupement d’éléments de texture.

Structure bleue: élément similaire sur le plan de leur taille, on peut les regrouper ensemble

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Similarité:

A

Des éléments disparates qui sont similaires entre eux auront tendance à être regroupés.
Similarité de formes:
- B: on les voit en colonnes
- A: un gros carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Proximité:

A

Des éléments proches les uns des autres seront regroupés ensemble.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sort commun:

A

Des éléments disparates en mouvement seront regroupés ensemble s’ils ont un mouvement commun.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Familiarité:

A

Des éléments disparates ont tendance à être regroupés s’ils forment une structure qui est reconnaissable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Région commune:

A

Des éléments à l’intérieur d’une région commune seront perçus comme groupés ensemble.
On les regroupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Connectivité:

A

Des éléments connectés les uns aux autres seront perçus comme formant un tout.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Synchronie:

A

Des évènements synchrones sont perçus comme reliés entre eux.
Lumière blanche qui clignote vs lumière noir

18
Q

Bien que l’organisation perceptive soit un atout important pour le système visuel, il arrive que l’application de ces principes nuise à

A

la détection de certains objets (i.e. camouflage).

On retrouve x dans y: principe de détection d’objet qui ne fonctionne pas très bien

Il arrive également que certains principes d’organisation perceptive soient en conflit les uns avec les autres. De tels cas mettent en lumière la nécessité d’un processus décisionnel qui détermine l’interprétation de l’objet à partir des conclusions offertes par chaque mécanisme (i.e. principe).

Biais perceptif

19
Q

Le processus décisionnel est conçu comme reposant sur :

A

l’interaction entre divers mécanismes en compétition (« perceptual committees »), chacun signalant à un degré plus ou moins fort la présence d’une propriété particulière qu’il est chargé de détecter (e.g. le stimulus préféré dans le champ récepteur d’un neurone).
Organisation hiérarchique

20
Q

Modèle « pandémonium » (tumulte et chaos; Selfridge, 1959):

A

chaque démon crie pour signaler la présence du trait qu’il doit détecter. Les démons du niveau plus élevé doivent décider si la propriété qu’ils détectent est présente ou non sur la base de ce signal.

Dans ses versions modernes, le modèle « pandémonium » est conçu comme reposant sur les circuits neuronaux, qui peuvent être simulés par des programmes informatiques.

21
Q

Les décisions sont également affectées par les heuristiques, qui sont des :

A

règles simples qui reposent sur certaines connaissances quant à la manière dont le monde qui nous entoure est habituellement organisé et quant aux règles de la physique.

Réseau de neurone artificiel utilise ça
Interaction ascendante, latérale et descendante

Par exemple, éviter les interprétations qui reposent sur un point de vue accidentel (point de vue unique donnant une interprétation particulière de la scène, qui ne serait pas valable sous d’autres points de vue).

Un autre exemple est celui des figures illusoires, qui seraient perçues sur la base de notre connaissance (implicite) que les objets sont habituellement opaques
– ce qui expliquerait, sur le plan perceptif, l’interruption des contours des éléments inducteurs.

On a l’impression de voir une maison ici/ flèche vers le haut
On a déposé la forme blanche sur les éléments noirs = logique de notre système visuel

22
Q

il arrive à l’occasion que notre système perceptif ne puisse prendre une décision finale sur l’organisation du stimulus, comme dans le cas des:

A

figures ambiguës (i.e. figures qui offrent plus d’une interprétation possible).

Dans de tels cas, notre interprétation (et notre expérience perceptive) alterne entre les deux possibilités.

Figure ambiguë car on n’s pas d’info sur quelle facette est plus probable à être le plus proche de nous
Inversion du cube

Vase-profil de Rubin: est ce que les visages sont dessus le fond blanc ou le vase sur le fond bleu?
Perception globale mais encore ambiguë

23
Q

la ségrégation figure-fond

A

Bien que l’organisation perceptive constitue un aspect important de la vision de niveau intermédiaire, une autre étape importante concerne la ségrégation figure-fond.

Son objectif est de déterminer les portions de l’image qui constituent la figure (i.e. objet) et celles qui constituent le fond. Diviser la figure

La réponse à cette question est souvent loin d’être évidente puisqu’il existe plusieurs interprétations valables.

Quelle est la partie qui constitue la figure? Laquelle constitue le fond?

Les figures ambiguës constituent un outil important pour l’étude de la ségration perceptive. De cette étude émergent certaines propriétés de l’image qui affectent l’assignation figure-fond.

24
Q

Certaines caractéristiques des formes qui ont tendance à être perçues comme la figure:

A

comme la figure:
C’est principe qui influence la ségrégation

1- inclusion (i.e. figure = incluse dans une autre surface)
Partie verte est la figure et bleu = fond

2- petite taille (relativement au reste de l’image)
Plus tes petit, plus tes la forme

3- symétrie
Les partie symétriques = plus figure (ex: rouge = première partie vs jaune dans la deuxième partie)

4- parallélisme
Les lignes vertes (les contours) sont parallèles tandis que pas le bleu

5- bordure
Statique = fond

6- mouvement relatif (éléments en mouvement – i.e. sort commun – sont perçus comme la figure)

7- convexité
Élément convexe (bombé vers l’extérieur) = figure

Ces caractéristiques peuvent parfois être en conflit. Le fait que nous arrivions à résoudre de tels conflits (ici, généralement en faveur de la convexité) indique un certain ordre de priorité des attributs pertinents dans la décision perceptive menant à l’interprétation obtenue.
Convexité peux gagner mais parfois symétrie, ça dépend

25
Q

l’occlusion:

A

Une autre problématique importante que doit résoudre la vision intermédiaire est celle de l’occlusion.

Notamment, comment arrive-t-on à inférer les parties manquantes d’un objet parce qu’il est partiellement caché par un autre?

Le même animal continue d’être là même si occlusion
Super fréquent
Plutôt la règle que l’exception
On peut donc voir la continuité

Notre système visuel résous l’occlusion par la complétion amodale, qui infère les contours cachés par occlusion sur la base de certaines heuristiques. On est capable de comprendre que le contour qui est interrompu existe quand même

Mécanisme de complétion, amodale car pas de modalité sensorielle pour modifier inférence qu’on fait (jamais de moyen de vérifier réponse qu’on a

« Rattachabilité » (« relatability ») Un seul point d’inflexion dans le contour à inférer permet de rattacher (sur le plan perceptif) les contours visibles. La nécessité de supposer deux points d’inflexion ne le permet pas.

26
Q

Intersections de contours

A

Les intersections en T signalent presque toujours un cas d’occlusion alors que ce n’est presque jamais le cas pour les intersections en Y ou en flèche.

Ces différents cas d’intersections constituent des propriétés non- accidentelles – i.e. les seuls cas où la règle n’est pas respectée se produisent sous des points de vue accidentels.

27
Q

Le tout et ses parties

A

L’objectif premier de la vision intermédiaire est de construire une représentation globale des objets. Ceci explique probablement l’effet de supériorité globale.

Stimuli hiérarchiques : grosse lettre formée de petites lettres = supériorité globale
Mesurer expérience perceptive: bien meilleur à nommer globalité du stimulus que les petites lettres

L’information locale des stimuli demeure toutefois disponible, notamment parce que le traitement initial de la stimulation consiste en une décomposition de l’image en ses parties constituantes.

Une heuristique à cet égard semble être que la segmentation d’un objet en ses parties constituantes se fait aux points de concavité maximale des contours.

28
Q

RECONNAISSANCE D’OBJETS

A

Plusieurs théories s’intéressent à notre perception de la forme des objets et à notre capacité à les reconnaître. La reconnaissance d’objets implique une mise en correspondance entre une représentation perceptive et une représentation en mémoire.

29
Q

(« template matching »).
RECONNAISSANCE D’OBJETS

A

Une théorie simple que l’on pourrait imaginer est celle de l’appariement de gabarit
(« template matching »).

Le problème avec une telle approche est que chaque nouvelle instance d’un objet dont la position, l’orientation, la forme exacte, etc. diffère du gabarit d’origine serait reconnue comme un objet différent.

30
Q

descriptions structurales
RECONNAISSANCE D’OBJETS

A

Une approche alternative consiste à supposer des représentations plus abstraites faites en termes des parties constituantes des objets et des relations entre ces parties. Sous certaines conditions, ces « descriptions structurales » peuvent expliquer un aspect important de notre fonctionnement visuel, soit la constance de forme.

31
Q

Constance de forme :

A

Capacité à se représenter la forme de l’objet comme constante malgré un changement de point de vue.

32
Q

théorie de reconnaissance par composantes de Biederman:

A

Une théorie actuelle supposant des descriptions structurales et faisant la prédiction d’une invariance au point de vue dans la reconnaissance d’objets est la théorie de reconnaissance par composantes de Biederman.

Pour la théorie de reconnaissance-par-composantes, notre système visuel décompose les objets en traits primitifs volumétriques appelés géons (pour ‘ions géométriques’). Les objets sont reconnus à partir de leurs composantes, les géons, ainsi que leur arrangement.

Les géons sont des formes 3D simples pouvant être caractérisées selon les dimensions suivantes: bords, courbure de l’axe principal, taille à travers l’étendue de l’axe principal et symétrie. Ces propriétés sont utilisées parce qu’elles sont invariantes au point de vue (excluant les points de vue dits « accidentels »).

33
Q

La théorie de reconnaissance-par-composantes présente toutefois deux limitations importantes:

A

1- Les descriptions structurales obtenues manquent de précision et ne permettent pas certaines distinctions importantes (e.g. entre un livre et une boîte);

2- Contrairement à ce que la théorie prédit, la performance de reconnaissance d’objets n’est pas parfaitement invariante au point de vue – autrement dit, la constance de forme n’est pas parfaite.

Ainsi, la rotation 3D des objets entraîne une diminution des performances dans des tâches d’appariement ou de reconnaissance.
Rotation mentale

Ceci est vrai même pour des objets qui peuvent être bien représentés par une description structurale comme celle supposée par Biederman.

34
Q

Approche basée sur les vues

A

L’approche basée sur l’image explique cet effet de rotation par l’hypothèse que notre système visuel représente la forme en tant qu’image 2D (comme la projection rétinienne)
– une sorte de retour à l’appariement de gabarit.

Dans ce contexte, notre capacité à reconnaitre les objets peu importe leur point de vue est expliquée par:
1- Un processus d’alignement (e.g. rotation mentale) qui met en correspondance l’objet perçu à la représentation en mémoire;

2- L’accumulation en mémoire visuelle des images des différents points de vue d’un objet auquel on a déjà été exposé.

Plus on a accumulé des images des avions, moins on a besoins de faire de retâtions d’image dans notre cerveau

35
Q

différents mécanismes de reconnaissance (niveau de catégorisation):

A

Une possibilité que plusieurs chercheurs envisagent présentement est que notre système visuel disposerait de différents mécanismes de reconnaissance, chacun privilégiant un niveau de catégorisation particulier.
Qu’est-ce que c’est?

Niveau superordonné = animal
Niveau de base = oiseau
Niveau subordonné = cardinal

Distinction entre base (défaut, manière la plus courante de recognition) et subordonné (plus pousser)
Reconnaissance visuel repose sur le niveau de base (reconnaissance par composante)
Reconnaissance subordonné = mécanisme basé sur les vues

Dans cette perspective, le niveau de base pourrait être offert par un système de descriptions structurales alors que la reconnaissance à un niveau subordonné reposerait sur un mécanisme tel celui supposé par la théorie des vues.

36
Q

La reconnaissance visuelle d’une manière générale semble également impliquer une variété de mécanismes spécialisés pour différentes classes de stimuli:

A
  • objets
  • lieux
  • parties du corps
  • matériel écrit
  • visages

Zone du cortex
Subdivision de zone cortical

Dans le cas des visages, il semble exister un parallèle avec la distinction « niveau de base » vs « niveau subordonné » que l’on rencontre dans la reconnaissance d’objets.

Visage en tant que visage :
Invariant à l’inversion
Pas sensible à l’inversion des visages

Visage pour l’identification d’une personne :
Très sensible à l’inversion

37
Q

Bases neurales de la perception de la forme:

A

Cortex IT

38
Q

La présentation de stimuli très différents à chaque œil provoque:

A

de la rivalité binoculaire.

Deux images complètement différentes

On ne peut voir que d’un œil à la fois, avec alternance entre les yeux.

On voit avec seulement un œil mais en alternance

Le stimulus effectif (présenté ici à l’œil droit) n’est détecté par l’animal que s’il y a une réponse significative du neurone de l’aire IT qui lui est sélectif.

Ceci démontre que l’activité des neurones IT est responsable de notre expérience de la forme visuelle.

39
Q

Bases neurales de la perception des visages:

A

Gyrus fusiforme
L’activation maximale de l’aire FFA est observée lorsque la cible est reconnue. L’activation est réduite si un visage est perçu et est presque nulle si le participant ne perçoit pas un visage.

Le traitement perceptif des visages (détection, identification) dépend de l’activité de l’aire FFA.

40
Q

Code spécifique ou code distribué?

A

Une étude récente de Quiroga et al. (2005) suggère la possibilité que l’identité des objets soit représentée selon un code spécifique dans l’hippocampe chez l’humain.

Opéra de Sydney et Temple Baha’i (tous deux identifiés comme l’Opéra de Sydney)

Il est à souligner toutefois que l’information représentée par les neurones en question est indépendante de la forme visuelle – ils représenteraient donc l’identité sous une forme très abstraite. La population de neurones enregistrée est également restreinte et il demeure possible qu’une collection de neurones soient impliqués dans la représentation de l’identité – i.e. code distribué.