Cours 13 - Perception des objets dans une scène Flashcards

Question 1

Q

Pourquoi est-il difficile de concevoir une machine à percevoir?

Answer

A

Le stimulus sur les récepteurs est ambigu.
o Problème de projection inverse : une image sur la rétine peut être causée par un nombre infini d’objets.
Les objets peuvent être masqués ou flous.
o Les occlusions sont courantes dans l’environnement.
o Certaines parties de l’objet peuvent être caché, mais on le reconnait pareil
Les objets sont différents de différents points de vue.
o Invariance de point de vue : la capacité de reconnaître un objet quel que soit le point de vue.
o C’est une tâche difficile à accomplir pour les ordinateurs

Question 2

Q

Qu’est-ce que l’organisation perceptuelle, le regroupement et la ségrégation?

Answer

A

L’organisation perceptuelle est le processus par lequel les éléments du champ visuel d’une personne sont regroupés et séparés perceptuellement afin de créer une perception. Au cours de ce processus, les
stimulations entrantes sont organisées en unités cohérentes, comme des objets. L’organisation perceptuelle repose sur 2 composantes : le regroupement et la ségrégation.
o Le regroupement est le processus par lequel les éléments d’une scène visuelle sont « assemblés » en unités ou objets cohérents.
o La ségrégation est le processus de séparation d’une zone ou d’un objet par rapport à un autre.

Question 3

Q

Comment se passe l’adaptation à l’intensité?

Answer

A

Pour voir une forme, il faut pouvoir l’isoler, la distinguer du fond. C’est le principe dit « figure-fond » (Figure = objet, fond = arrière-plan. Peut aussi être réversible). Or, ceci requière la perception des contours. Et cela va même jusqu’à en créer si nécessaire (illusion Kanisza)
* Nous savons maintenant que nous percevons les surfaces via leur variation de luminosité (% de lumière réfléchie) et de teinte (longueurs d’ondes réfléchies).
* Ceci est renforcé par un phénomène familier : l’inhibition latérale. (Accentue les différences entre les zones claires et foncées = améliore perception des bords/formes.)
* Mais cela ne suffit pas. En plus, il semble que les micromouvements de nos yeux soient nécessaires pour assurer que l’image rétinienne ne soit jamais fixe… et ceci préserverait les contours. Sans eux, on observerait une habituation.
* C’est ce que le phénomène du « ganzfeld » ou « champ complet » démontre (aussi appelée « adaptation à l’intensité »).

Question 4

Q

Qu’est-ce que le structuralisme?

Answer

A

Structuralisme (Wilhelm Wundt) : distingue entre les sensations – des processus élémentaires qui se produisent en réponse à la stimulation des sens – et les perceptions, des expériences conscientes plus complexes telles que notre conscience des objets.

Question 5

Q

Qu’est-ce que sont les lois du regroupement et les types?

Answer

A

Initialement proposées par les Gestaltistes (Wertheimer et Köhler), les lois, ou principes, de groupement sont des heuristiques perceptuels qui expliquent comment les points perçus par la rétine sont organisés par les processus de traitement visuels supérieurs en formes et objets.
* On retrouve :
o La proximité
o La similarité
o La fermeture
o La symétrie
o Le sort commun (aussi appelée synchronicité)
o La bonne continuité
o La bonne gestalt (aussi appelée principe de Prägnanz)
o L’expérience passée (aussi appelée familiarité)

Question 6

Q

Comment voyons-nous les formes? Quelles sont les sortes d’illusion possibles?

Answer

A

La perception des formes résulte donc d’un travail de construction de la perception, lequel est fortement influencé par des processus comme les principes de Gestalt.
* Ceci est particulièrement évidents lorsqu’on considère les nombreux exemples d’illusions d’optiques.
o Müller-Lyer
o Ligne horizontale vs ligne verticale
o Poggendorf
o Titchener
o Kanisza
o Ouchi

Question 7

Q

De quoi résulte l’illusion de Poggendorf?

Answer

A

Selon Carpenter & Blakemore (1973) l’illusion résulterait d’un “contraste
d’inclinaison” causé par l’inhibition latérale dans les détecteurs d’angles, ce qui causerait une augmentation des angles aigus.
* Mais cela n’est pas une explication parfaite.
* En effet, l’illusion se produit aussi si on ne présent que la partie des angles optus (version dite “amputée” de l’illusion).
* Une ligne cachée derrière un obstacle semble décalée, alors qu’elle est en réalité alignée.

Question 8

Q

Pourquoi se produit l’illusion d’Ouchi?

Answer

A

Possiblement le cercle (en mouvement) serait perçu comme étant à une
profondeur différente. Ceci résulterait d’une “un échec de l’intégration de 2 signaux de mouvement dans un seul vecteur de mouvement qui caractérise le mouvement rigide” selon Hine, Cook et Rogers (1995)
* Un motif de lignes donne l’impression que certaines parties bougent ou flottent quand on regarde l’image

Question 9

Q

Qu’est-ce qui déterminent les groupements perceptuels?

Answer

A

L’information contenue dans l’image

Question 10

Q

Les zones situées plus bas dans le champ de vision sont plus susceptibles d’être perçues comme une __________.

Question 11

Q

Qu’est-ce que contient une scène?

Answer

A

o Des éléments d’arrière-plan.
o Des objets organisés de manière significative les uns avec les autres et avec l’arrière-plan.

Question 12

Q

Quelle est la différence entre objet et scène?

Answer

A

o Une scène est jouée dans.
o Un objet est joué avec.

Question 13

Q

Qu’est-ce que la recherche sur la perception de l’essentiel des scènes à donné?

Answer

A

Potter a montré que les gens peuvent le faire lorsqu’une image n’est présentée que pendant 1/4 de seconde.
▪ Persistance de la vision : la perception d’un stimulus visuel se poursuit pendant environ 250 ms (1/4 de seconde) après l’extinction du stimulus.
o Fei-Fei a utilisé le masquage pour montrer que l’essentiel est perçu en premier, suivi des détails.
▪ Masquage : généralement un motif aléatoire qui recouvre le stimulus d’origine. Si une image est clignotante pendant 100 ms suivie immédiatement d’un stimulus de masquage, l’image n’est visible que pendant 100 ms

Question 14

Q

Qu’est-ce qui fait qu’on perçoit l’essentiel d’une scène rapidement?

Answer

A

Degré de naturalité : Les scènes naturelles, comme l’océan ou la forêt, ont des textures et des formes ondulées, tandis que les scènes artificielles, comme une rue, sont remplies de lignes droites et d’angles.
Degré d’ouverture : Une scène ouverte, comme l’océan, a un horizon visible et peu d’objets, alors qu’une forêt est plus fermée.
Degré de rugosité : Une scène lisse comme l’océan a peu de détails, alors qu’une forêt est plus complexe avec de nombreux petits éléments.
Degré d’expansion : Plus les lignes parallèles semblent converger au loin, comme sur une voie ferrée, plus la sensation de profondeur est grande.
Couleur : Certaines scènes ont des couleurs typiques, comme le bleu pour l’océan ou le vert et le brun pour la forêt.

Question 15

Q

Quels sont les types de régularité dans l’environnement physique et sémantique?

Answer

A

Régularités physiques : des propriétés physiques courantes.
o Effet oblique: les gens perçoivent les horizontales et les verticales plus facilement que les autres orientations.
o Connectivité uniforme : les objets sont définis par des zones de même couleur ou texture.
o Heuristique de la lumière d’en haut : la lumière dans l’environnement naturel et artificielle vient d’en haut de nous.
Régularités sémantiques : significations des scènes en utilisant nos connaissances/expériences
o Schéma d’une scène : représentation mentale de ce qui se retrouve habituellement dans un contexte. On imagine les scènes dans un contexte et non par des objets indépendant.

Question 16

Q

Expliquez la Théorie de l’inférence inconsciente de Helmholtz

Answer

A

o Comment le système perceptif « décide-t-il » que ce motif sur la rétine a été créé par des rectangles superposés ? »
o Principe de vraisemblance : nous percevons l’objet qui est le + susceptible d’avoir causé le modèle de stimuli que nous avons reçu.
o L’inférence inconsciente : nos perceptions sont le résultat d’hypothèses inconscientes, ou d’inférences, que nous faisons sur l’environnement. = prédiction selon nos expériences
o Similaire à la manière de résoudre un problème.

Question 17

Q

Expliquez l’Inférence bayésienne de Thomas Bayes

Answer

A

o Selon Bayes, notre estimation de la probabilité d’un résultat est déterminée par 2 facteurs :
▪ (1) Probabilité a priori : notre estimation initiale de la probabilité d’un résultat
▪ (2) Probabilité du résultat : la mesure dans laquelle les preuves disponibles sont
cohérentes avec le résultat.
o Implique une formule mathématique
o On commence avec une a priori puis on rajoute des preuves pour mettre à jour notre a priori et donner une conclusion.

Question 18

Q

Qu’est-ce que le codage prédictif?

Answer

A

o Décrit comment le cerveau utilise nos expériences passées pour prédire ce que nous percevrons
o Les prédictions de notre cerveau sur le monde sont représentées aux niveaux supérieurs du système visuel – par exemple, vers le haut des voies « quoi » et « où » où les neurones réagissent à des informations plus complexes, comme des objets et des scènes entiers.
o Le cerveau détermine si ce que nous voyons correspond à ce que nous nous attendons à voir.
▪ Si le signal entrant correspond à la prédiction de niveau supérieur.
▪ Cependant, si le signal entrant ne correspond pas à la prédiction, un signal d’erreur de prédiction est généré, qui est renvoyé à des niveaux supérieurs afin que la prédiction existante puisse être modifiée et améliorée.

Question 19

Q

Qu’est-ce que la théorie de la reconnaissance par composants? (RBC)

Answer

A

Une théorie de la reconnaissance des objets, appelée théorie de la reconnaissance par composants (RBC), a été proposée par Irving Biederman dans les années 1980 (Biederman, 1987).

La théorie RBC affirme que les objets sont composés d’éléments géométriques individuels appelés géons, et que nous reconnaissons les objets en fonction de l’agencement de ces géons. Les géons sont des formes tridimensionnelles, comme des pyramides, des cubes et des cylindres.
36 géons différents au total
Soutient l’invariance du point de vue
Mais :
o Ne tient pas compte du regroupement ou de l’organisation comme la Gestalt, et
certains objets ne peuvent tout simplement pas être représentés par des géons
o Ne permet pas de distinguer les objets d’une même catégorie

Question 20

Q

Que disent les dernières recherches sur la Zone fusiforme du visage (FFA) ?

Answer

A

o L’hypothèse de l’expertise : notre compétence à percevoir les visages, et la grande activation neuronale des visages peut s’expliquer par le fait que nous sommes devenus des « experts » dans la perception des visages parce que nous y avons été exposés toute notre vie.
o « Greebles » – des familles d’« êtres » générés par ordinateur qui ont tous la même configuration de base mais diffèrent par la forme de leurs parties.
▪ Après entrainement : Les neurones FFA ont bien réagi aux Greebles mais moins bien aux visages.
▪ Gauthier a suggéré que la FFA pourrait ne pas être une « zone de visage », mais plutôt
représenter tout objet avec lequel la personne est experte (ce qui inclut les visages). (Ex. voiture, oiseaux, jeu d’échecs, etc)