Cours 8 Traitement visuel Flashcards
La stimulation visuelle à laquelle notre rétine est exposée comporte une très grande quantité d’information qu’on ne peut traiter consciemment tout en même temps. La solution adoptée par notre système perceptif est :
la sélection attentionnelle – i.e. à chaque instant on se concentre sur certaines informations et on en ignore d’autres.
La sélectivité de notre système visuel repose en partie sur :
l’organisation rétinienne, qui comporte une zone de haute résolution spatiale, la fovéa.
À travers les mouvements oculaires, on peut exposer notre fovéa à certaines portions de la scène visuelle pour un traitement plus détaillé. Ce type de comportement attentionnel, apparent pour un observateur extérieur, s’appelle :
l’attention manifeste (les mouvement oculaires) («overtattention»). Le fait de regarder certaine partie nous permet de voir un tout à la longue
Ex de poursuite oculaire
La sélectivité du traitement visuel peut également s’exercer à travers un processus interne (relativement autonome des mouvements oculaires):
l’attention cachée («covertattention»). Lorsqu’on regarde quelque chose «du coin de l’œil» par exemple, notre attention est dirigée à un endroit de la scène visuelle qui est distinct de notre fixation oculaire.
Un avantage de l’attention cachée est sa grande rapidité (20 à 30 fixations par seconde) relativement à l’attention manifeste (e.g. 3-4 saccades par seconde). = 3-4 emplacement /secondes
L’attention est nécessaire à la construction de la représentation qu’on se fait de notre environnement. Il semble que l’on ne dispose d’aucune représentation consciente d’un objet à moins d’y porter attention. même quand on regarde la route, on va avoir des coup d’œil avec l’attention caché afin de repéré les danger qui se trouve sur le bord (ex. un chevreuil)
pourquoi tout le monde à des expériences perceptives différente?
Selon William James (1890), nous « décidons » quel est notre univers perceptif à travers la sélection attentionnelle que l’on exerce. On décide de la qualité de notre environnement perceptif c’est pourquoi que tout le monde à des expériences perceptives différente
tâche d’indiçage visuo-spatial (Posner).
Une méthode importante pour étudier l’attention visuelle est la tâche d’indiçage visuo-spatial (Posner).
Indice valide associé à une réduction des temps de réponse (TR) relativement à un indice neutre, alors que l’indice invalide est associé à une augmentation des TR.
Indice périphérique associé à déplacements rapides et automatiques de l’attention. Indice symbolique associé au déploiement plus lent et fait sur une base volontaire, ou intentionnelle.
La direction du regard (droite ou gauche), bien que constituant un indice spatial symbolique, semble donner lieu à des déplacements automatiques et rapides de l’attention. Phénomène adaptatif pour nous permettre de survivre dans l’environnement. Si quelqu’un regarde subitement en l’air, je vais probablement regarder (éviter danger)
L’attention affecte non seulement nos temps de réponse mais également notre sensibilité perceptive.
Tâche : indiquer le réseau qui a le contraste apparent le plus élevé.
Lorsque les réseaux ont objectivement le même niveau de contraste, celui vers lequel l’attention est dirigée a un contraste apparent plus élevé.
Réseau de faible contraste image 4: droite plus marquée que gauche
L’attention peut être dirigée non seulement vers des localisations spatiales, mais également vers des attributs visuels spécifiques ou encore sur une classe d’objets particulière.
Ex: élément rouge: rouge sont verticale, arrangement en forme d’élipse
Bleu: arrangement oblique
Horizontal: arrangement oblique
Tache de recherche visuelle
Une autre tâche ayant beaucoup contribué à l’étude du rôle de l’attention est celle de recherche visuelle. La tâche consiste à indiquer si une cible prédéterminée est présente ou non. La cible peut être présente ou absente. Habituellement, le nombre de stimuli présentés est variable.
L’absence d’effet du nombre de stimuli indique une recherche dite «parallèle», où il semble que tous les items soient examinés simultanément. Cette recherche parallèle indique une disponibilité préattentive (sans intervention de l’attention) de son trait distinctif. Parmi les attributs disponibles préattentivement, on retrouve des propriétés élémentaires telles l’orientation, la couleur, la courbure, etc. Des propriétés plus complexes, comme l’orientation en profondeur, semblent également disponibles sur une base préattentive.
Toutefois, l’attribut distinctif de la cible doit être suffisamment saillant pour donner lieu à une recherche parallèle. Ex: l’image suivante car pas assez de différence entre les orientations = tâche difficile
Tache de recherche visuelle sérielle:
D’autres tâches de recherche visuelle sont plus difficiles et donnent lieu à une recherche dite «sérielle», i.e. impliquant une fixation séquentielle de l’attention. Ce type de prospection indique que la discrimination entre la cible et les distracteurs demande de l’attention. La vitesse de la recherche sérielle peut varier selon les propriétés particulières de la cible et des distracteurs.
La recherche sérielle est la règle quand la cible partage les attributs élémentaires la constituant avec les distracteurs.
Sérielle auto terminante (je cherche jusqu’à temps que je trouve)
Recherche conjonction: 2 caractéristiques à trouver (combinaison de deux informations sur la cible)
Configuration spatiale: les configurations sont différentes
TR est plus bas lorsque la cible est là car en moyenne on doit examiner environ la moitié des items avant de la trouvé VS toute examiner lorsque la cible est absente
théorie de l’intégration des attributs visuels (Treisman)
Ce type d’observation (recherche visuelle sérielle) a donné naissance à la théorie de l’intégration des attributs visuels (Treisman).
Selon cette théorie, l’image visuelle est d’abord encodée selon ses différents attributs, qui sont traités séparément (i.e. décomposition des objets en leurs traits élémentaires, traitement indépendant de forme, couleur, mouvement, etc). Ceci est effectué par un stade de traitement automatique, dit préattentif.
Ces traits primitifs, qui constituent les unités de base de la perception, sont ensuite intégrés au niveau du stade d’attention focalisée pour donner lieu à une représentation complète de l’objet.
Cette représentation peut ensuite être comparée aux connaissances gardées en mémoire pour donner lieu à la reconnaissance de l’objet.
Un appui important pour la théorie de Treisman provient du phénomène de conjonctions illusoires.
conjonctions illusoires
Un ensemble de formes colorées est présenté brièvement avec 2 chiffres de part et d’autre, ces derniers servant à occuper l’attention des participants.
Une conjonction illusoire (perçue dans 18% des essais) correspond au cas où une forme et une couleur appartenant à des objets différents sont perçus comme appartenant au même objet.
Les conjonctions illusoires ne se produisent pas si les participants ont la possibilité de bien porter attention aux différentes formes colorées.
Bien que l’attention soit nécessaire pour l’intégration d’attributs visuels, une cible conjonctive particulièrement saillante peut être détectée très rapidement. Il semble en effet que l’attention puisse être guidée sur une base pré attentive à partir des différences existantes entre la cible et les distracteurs.
Par exemple, ici, la cible partage deux de ses attributs avec chaque distracteur mais s’en distingue par quatre autres attributs.
Cette grande différence entre la cible et les distracteurs facilite grandement la recherche visuelle.
L’attention est requise pour la détection consciente des objets de notre environnement.
vacillement attentionnel
Bien que nous fassions tous les efforts possibles, il y a certains moments pendant lesquels notre attention n’est pas disponible pour la détection d’une cible. Ce phénomène s’appelle le vacillement attentionnel et il peut être mis en évidence avec la présentation séquentielle rapide de stimuli («RSVP»).
Rapid séquentiel visuel présentation
Détecter lettre blanche et après détecter si oui ou non il y a eu le x noir
Jeu vidéo: plus de facilité
cécité intentionnelle
La nécessité de l’attention pour la perception consciente de détails spécifiques d’une scène visuelle est également démontrée par le phénomène de cécité intentionnelle.
Tu regardes au bon endroit mais ton système est surchargé donc tu ne remarque pas les changements
cécité au changement
Le rôle essentiel de l’attention est également démontré par le phénomène de cécité au changement, qui se manifeste soit lorsqu’on alterne des images d’une même scène ou lors de changements de plan dans un film.
La détection est facilitée si la localisation du changement est indiquée préalablement.
Détection de changement: 1/10 si averti de porter attention, entre 20-25% si averti d’un changement d’objet, de posture ou de vêtement.
Si notre attention n’est pas au bon endroit, on ne remarque pas
La cécité au changement, cécité intentionnelle et le vacillement attentionnel démontre… (Tâche d’apprentissage de 2500 objets)
Ces démonstrations démontrent à quel point la conscience que nous avons de l’information disponible dans notre environnement est limitée.
De telles observations semblent difficiles à réconcilier avec nos performances remarquables dans des tâches de mémoire d’images.
Tâche d’apprentissage de 2500 objets, chacun exposé pendant 3 sec.
Ils nous expose et nous demande si oui ou non les objets avaient été exposer.
- Deux images pas rapport (novel) = 92%
- Minuscule différence (exemplar) = 88%
- Différence de forme (state) = 87%
La durée d’exposition des objets pendant l’apprentissage est suffisante pour bien leur porter attention. Par contre, il demeure difficile d’expliquer le taux de succès élevé dans la condition de changement d’état («state») compte tenu de l’ampleur de l’effet de cécité au changement.
Reconnaissance de scène vs objet
Notre excellente capacité à interpréter des scènes visuelles relativement complexes lors d’une présentation séquentielle rapide («RSVP», durée d’images de 100-125 ms) est également difficile à expliquer, même en supposant une capacité de focaliser notre attention sur 20-30 objets par seconde. La disposition spatiale de la scène (i.e. sa structure d’ensemble) est un aspect de l’image qui nous semble disponible rapidement et qui peut contribuer (possiblement sans attention) à la reconnaissance de la scène et des objets qui s’y trouvent.
Par exemple, la reconnaissance d’objets est facilitée s’ils sont présentés dans leur contexte habituel et s’ils y sont placés à l’endroit qu’ils occupent normalement. Facilité lorsque scène visuelle
Ex. Détecter une borne fontaine = bcp difficile si à un endroit pas rapport que si oui = on utilise nos connaissances
Selon Oliva & Torralba (2001), le contenu en orientations et fréquences spatiales d’une scène peut nous informer quant à sa signification. Par exemple, les paysages très dégagés sont associés à une forte présence de contours horizontaux (dimension «openness»). Le caractère accidenté d’un paysage («ruggedness») est signalé par une forte présence de contours obliques qui cachent l’horizon.
Paysage ouvert: contours horizontaux
Foret: oblique verticale
Moins de contours oblique dans les «undulating landscape» vs «Mountain» = bcp plus