Cours 5 Flashcards

groupements perceptifs, discrimination figure-fond, théories de la perception et reconnaissance des objets, spécialisation fonctionnelle, bases neurales.

1
Q

Pourquoi la projection rétinienne d’un objet peut-elle poser problème dans la perception de la forme?

A

Parce que la projection rétinienne est toujours ambiguë quant à la forme réelle de l’objet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel défi majeur se pose dans la perception des formes via la rétine?

A

Plusieurs objets peuvent produire la même image sur la rétine, créant une incertitude quant à leur véritable forme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel problème doit résoudre le système visuel en lien avec les contours d’un objet?

A

Le système visuel doit discriminer entre les contours qui délimitent un objet, ceux qui appartiennent à cet objet, et ceux créés par l’ombrage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que se passe-t-il lorsque certaines portions du contour d’un objet ne présentent aucun contraste avec le fond?

A

Malgré l’absence de contraste avec le fond, nous percevons sans difficulté la continuité du contour de l’objet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La projection rétinienne d’un objet demeure toujours ambigue quant à sa forme réelle. De quelles manières la perception de la forme peut-elle être problématique ? (3)

A
  • La discrimination entre les contours qui délimitent un objet, ceux qui appartiennent à cet objet et ceux créés par l’ombrage constitue un autre problème que doit résoudre le système visuel.
  • L’image rétinienne des objets est souvent partiellement cachée par d’autres, ambiguë ou dégradée (ex: photo flou)
  • La forme de la projection rétinienne des objets change selon le point de vue et sa taille change selon la distance
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Les différentes questions/problématiques de perception ont été examinées sous plusieurs approches différentes. Lesquelles ?

A
  • 20e siècle : structuralisme (ou élémentarisme)
  • 1912 : gestaltisme
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

structuralisme (ou élémentarisme)

A

approche du début du 20e siècle

L’expérience perceptive repose sur l’addition de sensations élémentaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

En termes de traits encodés par l’aire V1, la théorie structuraliste supposerait quoi ?

A

Que notre système visuelle repose exclusivement sur une simple combinaison, ou addition de l’information captée par les neurones individuels de V1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

gestaltisme

A

1912

“Le tout est plus que la somme de ses parties.” La perception est fonction de configurations globales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les règles par lesquelles notre système perceptif intègre des éléments locaux en une représentation globale de la forme ?

A

Grâce à la vision de niveau intermédiaire (« middle vision »).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

quel est l’objectif de la vision de niveau intermédiaire (“middle vision”) ?

A

D’effectuer l’intégration des éléments locaux en une représentation globale de la forme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

quel est l’objectif de la vision précoce, ou de bas niveau ?

A

encoder les propriétés locales de la stimulation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quel est l’objectif de la vision de haut niveau ?

A

d’interpréter les scènes visuelles et de reconnaître les objets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

L’approche gestaltiste a dominé l’approche comportementale pour l’étude de la perception jusqu’aux années 1960. Les travaux menés pendant cette période se sont intéressés particulièrement à 2 questions fondamentales pour la perception de la forme. Lesquelles ?

A
  • L’organisation perceptive
  • La discrimation figure-fond
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quelle approche a dominé l’étude de la perception jusqu’aux années 1960 ?

A

gestaltiste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

quelle était l’approche dominante dans l’étude de la perception au début du 20e siècle

A

structuralisme (ou élémentarisme)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

organisation perceptive

A

Les lois ou principes de l’organisation perceptive sont des règles qui guident l’intégration des éléments locaux d’une image en une représentation globale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pragnanz (“bonne figure”)

A

Le principe de Pragnanz, aussi appelé « bonne figure », est un concept de la théorie de la Gestalt qui explique comment le système visuel organise les informations. Selon ce principe, lorsque notre cerveau est confronté à des stimuli visuels, il les regroupe et les interprète de la manière la plus simple et la plus stable possible.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

bonne continuité

A

Des éléments disparates qui forment un traçé continu seront regroupés ensemble. Les segments d’une ligne interrompue seront regroupés afin de former le tracé le plus régulier possible.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

L’organisation perceptive implique quoi, à part l’intégration de contours?

A

L’organisation perceptive n’implique pas que l’intégration de contours, mais également la segmentation et le regroupement d’éléments de texture.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

similarité

A

Des éléments disparates qui sont similaires entre eux auront tendance à être regroupés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

proximité

A

des éléents proches les uns des autres seront regroupés ensemble

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

sort commun

A

des éléments disparates en mouvement seront regroupés ensemble s’ils ont un mouvement commun

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

familiarité

A

Des éléments disparates ont tendance à être regroupés s’ils forment une structure qui est reconnaissable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

région commune

A

Des éléments à l’intérieur d’une région commune seront perçus comme groupés ensemble.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

connectivité

A

des éléments connectés les uns aux autres seront perçus comme formant un tout

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

synchronie

A

des événements synchrones sont perus comme reliés entre eux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Bien que l’organisation perceptive soit un atout pour le système visuel, ce n’est pas parfait. Expliquez

A

Il arrive que l’application de ces principes nuise à la détection de certains objets (i.e. camouflage).

Il arrive également que certains principes d’organisation soient en conflit les uns avec les autres. De tels cas mettent en lumière la nécessité d’un processus décisionnel qui détermine l’interprétation de l’objet à partir des conclusions offertes par chaque mécanisme (i.e. principe).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Bien que l’organisation perceptive soit un atout pour le système visuel, ce n’est pas parfait. Il arrive que l’application de ces principes nuise à la détection de certains objets (i.e. camouflage). Il arrive également que certains principes d’organisation soient en conflit les uns avec les autres.

De tels cas mettent en lumière la nécessité d’un processus décisionnel qui détermine l’interprétation de l’objet à partir des conclusions offertes par chaque mécanisme (i.e. principe). Qu’est-ce que le processus décisionnel ?

A

Le processus décisionnel est conçu comme reposant sur l’interaction entre divers mécanismes ou compétition (« perceptual committees »), chacun signalant à un degré plus ou moins fort la présence d’une propriété particulière qu’il est chargé de détecter (e.g. le stimulus préféré dans le champ récepteur d’un neurone).

ex : modèle pandemonium

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

modèle pandemomium

A

Le modèle pandemonium (tumulte et chaos) : chaque démon crie pour signaler la présence du trait qu’il doit détecter. Les démons du niveau plus élevé doivent décider si la propriété qu’ils détectent est présente ou non sur la base de ce signal.

Dans les versions modernes, le modèle « pandomenium » est conçu comme reposant sur les circuits neuronaux, qui peuvent être simulés par des programmes informatiques.

Les décisions sont également affectées par des heuristiques, qui sont des règles simples qui reposent sur certaines connaissances quant à la manière dont le monde qui nous entoure est habituellemet organisé et quant aux règles de la physique.

30
Q

Les décisions en lien avec le modèle pandemonium sont également affectées par des heuristiques, qui sont des règles simples qui reposent sur certaines connaissances quant à la manière dont le monde qui nous entoure est habituellemet organisé et quant aux règles de la physique. Donnez 2 exemples.

A

Par exemple, éviter les interprétations qui reposent sur un pdv accidentel (pdv unique donnant une interprétation particulière de la scène, qui ne serait pas valable sous d’autres pdv).

Par exemple, dans les figures illusoires, qui seraient perçues sur la base de notre connaissance (implicite) que les objets sont habituellement opaques - ce qui expliquerait, sur le plan perceptif, l’interruption des contours des éléments inducteurs.

diapo 16

31
Q

Il arrive à l’occasion que notre système perceptif ne puisse prendre une décision finale sur l’organisation du stimulus, comme dans le cas des figures ambuguës (i.e. figures qui offrent plus d’une interprétation possible). Dans de tels cas, que ce passe-t-il ?

A

Dans de tels cas, notre interprétation (et notre expérience perceptive) alterne entre 2 possibilités.

ex : cube de Necker, vase-profil de rubin

32
Q

Figure-fond

A

Son objectif est de déterminer les portions de l’image qui constituent la figure (i.e. objet) et celles qui constituent le fond.

La réponse à cette question est souvent loin d’être évidente puisqu’il existe plusieurs interprétations valables.

Les figures ambiguës constituent un outil important pour la ségrégation perceptive. De cette étude émergent certaines propriétés de l’image qui affectent l’assignation figure-fond.

33
Q

Certaines caractéristiques des formes qui ont tendance à être perçues comme la figure. Quelles sont ces caractéristiques ?

7

A
  1. Inclusion (i.e. figure = incluse dans une autre surface)
  2. petite taille (relativement au reste de l’image)
  3. symétrie
  4. parallélisme
  5. bordure
  6. mouvement relatif (éléments en mouvement - i.e. sort commun - sont perçus comme la figure)
  7. convexité
34
Q

Certaines caractéristiques des formes qui ont tendance à être perçues comme la figure. Ces caractéristiques peuvent parfois être en conflit. Comment arrivons-nous à résoudre de tels conflits?

A

Le fait que nous arrivons à généralement à résoudre ces conflits indique un certain ordre de priorité des attributs pertinents dans la décision perceptive menant à l’interprétation obtenue.

35
Q

Une des problématiques que la vision intermédiaire doit résoudre est l’occlusion. Notamment, la vision intermédiaire arrive à inférer les parties manquantes d’un objet parce qu’il est partiellement caché par un autre. Comment ?

A

Notre système visuel résoud l’occlusion par la complétion amodale, qui infère les contours cachés par occlusion sur la base de certaines heuristiques.

36
Q

Qu’est-ce que la complétion amodale ?

A

La complétion amodale est le processus par lequel le cerveau perçoit une forme ou un objet complet, même si une partie de celui-ci est cachée ou non visible. Cela permet de reconstituer mentalement des objets partiellement obstrués dans le champ visuel.

37
Q

rattachabilité (« relatability »)

A

Un seul point d’inflexion dans le contour à inférer permet de rattacher (sur le plan perceptif) les contours visibles. La nécessité de supposer deux points d’inflexion ne le permet pas.

38
Q

En lien avec l’intersections de contours, que signifie une intersection en T ?

A

Les intersections en T signalent presque toujours un cas d’occlusion.

Ceci constitue une propriété non-accidentelles - i.e. les seuls cas où la règle n’est pas respectée se produisent sous des points de vue accidentels.

39
Q

Quel est l’objectif premier de la vision intermédiaire ?

A

De construire une représentation globale des objets. Ceci explique probablement l’effet de supériorité globale.

40
Q

Si la vision intermédiaire est chargé de construire des représentations globales des objets. Comment se fait-il que nous arrivons tout de même à voir les parties constituantes d’une image ?

A

L’information locale des stimuli demeure toutefois disponible, notamment parce que le traitement initial de la stimulation consiste en une décomposition de l’image en ses parties constituantes.

41
Q

Quelle heuristique est utilisée pour segmenter un objet en ses parties constituantes ?

A

La segmentation d’un objet en ses parties constituantes se fait aux points de concavité maximale des contours.

Autrement dit, pour segmenter un objet en différentes parties, le cerveau utilise les points de concavité maximale comme repères. Cela permet de découper visuellement l’objet en morceaux logiques, facilitant la compréhension de sa structure.

42
Q

Qu’implique la reconnaissance d’objets dans notre perception visuelle ?

A

La reconnaissance d’objets implique une mise en correspondance entre une représentation perceptive et une représentation en mémoire.

43
Q

Il existe une théorie simple qui explique la reconnaissance d’objets. Quel est le problème avec cette approche ?

A

Une théorie simple que l’on pourrait imaginer est celle de l’appariement de gabarit (« template matching »).

Le problème avec une telle approche est que chaque nouvelle instance d’un objet dont la position, la forme exacte, etc., différe du gabarit d’origine serait reconnue comme un objet différent.

44
Q

Le problème avec l’approche du template matching est que chaque nouvelle instance d’un objet dont la position, la forme exacte, etc., différe du gabarit d’origine serait reconnue comme un objet différent. Quelle serait une approche alternative ?

A

Une approche alternative consiste à supposer des représentations plus abstraites faites en termes des parties constituantes des objets et des relations entre ces parties. Sous certaines conditions, ces « descriptions structurales » peuvent expliquer un aspect important de notre fonctionnement visuel, soit la constance de forme.

45
Q

Approche de l’appariement de gabarit (« template matching »)

A

L’approche de l’appariement de gabarit (« template matching ») en reconnaissance d’objets suppose que notre cerveau compare les objets perçus à des modèles mémorisés (gabarits) pour les identifier. Cette méthode est limitée, car elle échoue lorsque les objets varient en position, orientation ou forme.

46
Q

constance de forme

A

capacité à se représenter la forme de l’objet comme constante malgré un changement de point de vue.

47
Q

théorie de reconnaissance-par-composantes

de Biederman

A

Une théorie actuelle qui suppose des descriptions structurales et fait la prédiction d’une invariance au point de vue dans la reconnaissance d’objets.

Pour cette théorie, notre système visuel décompose les objets en traits primitifs volumétriques appelés géons (pour “ions géométriques”). Les objets sont reconnus à partir de leurs composantes, les géons, ainsi que leur arrangement.

48
Q

géons

A

Les géons sont des formes 3D simples pouvant être caractérisées selon les dimensions suivantes :

  • bords
  • courbure de l’axe principale
  • taille à travers l’étendue de l’axe principal
  • symétrie

Ces propriétés sont utilisées parce qu’elles sont invariantes au point de vue (excluant des points de vues dits « accidentels »).

49
Q

Quels sont les dimensions pouvant caractériser les géons ?

4

A
  • bords
  • courbure de l’axe principale
  • taille à travers l’étendue de l’axe principal
  • symétrie
50
Q

Les géons sont caractérisés par les dimensioms suivantes : bords, courbure de l’axe principal, taille à travers l’étendue de l’axe principal et symétrie. Pourquoi est-ce qu’on utilise ces propriétés ?

A

Ces propriétés sont utilisées parce qu’elles sont invariantes au point de vue (excluant des points de vues dits « accidentels »).

51
Q

Quels sont les limitations de la théorie de reconnaissance-par-composantes

2

A

1) Les descriptions structurales obtenues manquent de précision et ne pas permettent pas certaines distinctions importantes (ex : entre un livre et une boîte).

2) Contrairement à ce que la théorie prédit, la performance de reconnaissance d’objets n’est pas parfaitement invariante au point de vue - autrement dit, la constance de forme n’est pas parfaite.

Ainsi la rotation 3D entraîne une diminution des performances dans des tpaches d’appariement ou de reconnaissance.

Ceci est vrai même pour les objets qui peuvent être bien représentés par une description structurale comme celle supposée par Biederman.

52
Q

Approche basée sur les vues

A

L’approche basée sur l’image explique cet effet de rotation par l’hypothèse que notre système visuel représente la forme en tant qu’image 2D (comme la projection rétinienne)- une sorte de retour à l’appariement de gabarit.

53
Q

Dans un contexte d’approche basée sur les vues, notre capacité à reconnaître les objets peu importe leur point de vue est expliquée par quoi ?

2

A

Dans ce contexte, notre capacité à reconnaître les objets peu importe leur point de vue est expliquée par :

  1. Un processus d’alignement (ex : rotation mentale) qui met en correspondance l’objet perçu à la représentation en mémoire
  2. L’accumulation en mémoire visuelle des images des différents points de vue d’un objet auquel on a déjà été exposé.
54
Q

Une possibilité que plusieurs chercheurs envisagent présentement en lien avec la reconnaissance d’objets

A

Notre système visuel disposerait de différents mécanismes de reconnaissance, chacun privilégiant un niveau de catégorisation particulier.

niveau superordonné
niveau de base
niveau subordonné

Dans cette perspective, le niveau de base pourrait être offert par un système de descriptions structurales alors que la reconnaissance à un niveau subordonné reposerait sur un mécanisme tel celui supposé par la théorie des vues.

55
Q

La reconnaissance visuelle d’une manière générale semble également impliquer une variété de mécanismes spécialisés pour différentes classes de stimuli. Lesquels ?

5

A
  • objets
  • lieux
  • parties du corps
  • matériel écrit
  • visages
56
Q

on voit un cardinal, quel sont les 3 niveaux de reconnaissance de cet oiseau, selon la nouvelle supposition de certains chercheurs disant que notre système visuel disposerait de différents mécanismes de reconnaissance, chacun privilégiant un niveau de catégorisation particulier ?

A

superordonné = animal
de base = oiseau
subordonné = cardinal

57
Q

Une possibilité que plusieurs chercheurs envisagent présentement en lien avec la reconnaissance d’objets est que notre système visuel disposerait de différents mécanismes de reconnaissance, chacun privilégiant un niveau de catégorisation particulier. (niveau superordonné, de base, subordonné).

Selon cette perspective, le niveau de base pourrait être offert par quoi ? Et le niveau subordonné reposerait sur quoi ?

A

Dans cette perspective, le niveau de base pourrait être offert par un système de descriptions structurales alors que la reconnaissance à un niveau subordonné reposerait sur un mécanisme tel celui supposé par la théorie des vues.

58
Q

Dans le cas des visages, il semble exister un parallèle avec la distinction « niveau de base » vs « niveau subordonné » que l’on rencontre dans la reconnaissance d’objets. Expliquez

A

les visages en tant que visages : invariant à l’inversion

les visages pour l’identification d’une personne : très sensible à l’inversion

59
Q

La présentation de stimuli très différents à chaque oeil provoque quoi ? Que ce passe-t-il en lien avec l’aire IT ?

A

Provoque de la rivalité binoculaire. On ne peut voir que d’un oeil à la fois, avec alternance entre les yeux.

Le stimulus effectif n’est détecté par l’animal que s’il y a une réponse significative du neurone de l’aire IT qui lui est sélectif. Ceci démontre que l’activité des neurones IT est responsable de notre expérience de la forme visuelle.

60
Q

les neurones de quel aire est responsable de notre expérience de la forme ?

A

les neurones IT

61
Q

Quelle aire est activé au maximum lorsqu’un visage (la cible) est reconnue) ?

A

l’aire FFA

62
Q

À quel point l’aire FFA est-elle activée lorsque l’un visage (la cible) est reconnue ?

A

au maximum

63
Q

À quel point l’aire FFA est-elle activée lorsque l’un visage est perçu ?

A

activation réduite p/r à quand un visage est reconnue

64
Q

À quel point l’aire FFA est-elle activée lorsque l’un visage n’est pas perçu ?

A

activation presque nulle

65
Q

le traitement perceptif des visages (détection, identification) dépend de l’activité de quelle aire ?

A

de l’aire FFA

66
Q

Que suggère une étude récente de Quiroga et al. (2005) ?

A

Suggère la possibilité que l’identité des objets soit représentée selon un code spécifique dans l’hippocampe chez l’humain.

Il est à souligner toutefois que l’information représentée par les neurones en question est indépendante de la forme visuelle - ils représentent donc l’identité sous une forme très abstraite. La popularité de neurones enregistrée est également restreinte et il demeure possible qu’une collection de neurones soient impliqués dans la représentation de l’identité - i.e. code distribué.

67
Q

code spécifique

A

Fait référence à l’idée qu’un neurone ou un petit groupe de neurones est responsable de la reconnaissance d’un objet ou d’une caractéristique spécifique. Par exemple, un seul neurone pourrait être activé pour reconnaître un visage particulier.

68
Q

code distribué

A

Implique que la reconnaissance d’un objet ou d’une caractéristique repose sur l’activation coordonnée d’un large réseau de neurones. Chaque neurone contribue à la représentation de plusieurs objets ou caractéristiques, et c’est la combinaison d’activations qui permet l’identification.

69
Q

quelle est la différence entre la vision intermédiaire et les autres niveaux de vision ?

A

La vision intermédiaire se distingue de la vision précoce, ou de bas niveau, dont le rôle est d’encoder les propriétés locales de la stimulation.

Elle se distingue également de la vision de haut niveau, dont la fonction est d’interpréter les scènes visuelles et de reconnaître les objets.

70
Q

En lien avec les intersections de contours, que signifient les intersections en T vs Y vs en flèche ?

A

Les intersections en T signalent presque toujours un cas d’occlusion alors que ce n’est presque jamais le cas pour les intersections en Y ou en flèche.

Ces différents cas d’intersections constituent des propriétés non-accidentelles - i.e. les seuls cas où la règle n’est pas respectée se produisent sous des points de vue accidentels.

71
Q

occlusion

A

une situation où un objet en cache partiellement un autre dans le champ visuel. Cela donne l’illusion de profondeur : l’objet qui cache l’autre est perçu comme étant devant l’objet caché.

Par exemple, si un poteau est placé devant un mur, le poteau “occulte” partiellement le mur, ce qui signifie qu’il cache une partie de celui-ci. Notre cerveau utilise ces indices d’occlusion pour interpréter la position relative des objets et comprendre l’agencement spatial dans la scène.

72
Q

propriété non-accidentelle

A

Une propriété non-accidentelle est une caractéristique visuelle d’un objet qui est perçue de manière stable, peu importe l’angle ou la position de l’observateur. Autrement dit, c’est une caractéristique qui ne dépend pas d’un point de vue spécifique et qui est donc interprétée comme étant fiable et constante pour reconnaître des formes ou des objets

ex : intersections en T, Y ou flèche