cours 5 : Percevoir et reconnaître les scènes Flashcards by Elisabeth Gagnon

À chaque instant de notre vie, on échantillonne notre environnement environ … par seconde par des mouvements oculaires saccadés.

trois à cinq fois

How well did you know this?

Not at all

Perfectly

comment peut-être considéré une saccade ?

un échantillon de notre envi, qui peut être considéré une scène visuelle

How well did you know this?

Not at all

Perfectly

Quelles sont les deux catégories principales de scènes visuelles ?

Scènes naturelles
Scènes artificielles

How well did you know this?

Not at all

Perfectly

Quelles sont certains des éléments qui influencent notre perception des scènes naturelles ?

paysages
étendues d’eau
conditions météorologiques
biomes

How well did you know this?

Not at all

Perfectly

les scènes de paysage évoquent typiquement des … distincts, s’appuyant fortement sur …, la couleur et les textures naturelles.

émotions et souvenirs

l’agencement spatial

How well did you know this?

Not at all

Perfectly

Qu’est-ce qui caractérise les scènes artificielles ?

Environnements urbains
environnements intérieurs
lieux culturels
scènes dynamiques

How well did you know this?

Not at all

Perfectly

Quelle est la principale différence entre la reconnaissance des objets et la reconnaissance des scènes ?

Ça réside dans la manière dont notre cerveau traite et interprète les informations visuelles

rec des objets –> l’identification et la catégorisation d’éléments individuels dans notre champ visuel (carac spécifique des objets : formes, couleur, taille, texture)
rec des scènes –> une compréhension plus large et plus globale de l’environnement visuel
l’interprétation du contexte, la compréhension des relations spatiales entre les objets, capacité à saisir le sens global ou l’essence d’un envi
nécessite une intégration des informations visuelles à un niveau supérieur

How well did you know this?

Not at all

Perfectly

Quels sont les 2 éléments qui joue un rôle dans la reconnaissance des scènes ?

contexte
relations spatiales

How well did you know this?

Not at all

Perfectly

Qu’est-ce que le rôle du CONTEXTE dans la reconnaissance des scènes ?

Fournir des informations supplémentaires pour interpréter les objets dans leur environnement.
Aide à prédire quels objets sont susceptibles d’être présents et comment ils sont disposés, améliorant ainsi notre capacité à comprendre et à interagir avec notre environnement

(ex : voir une tasse sur une table dans une cuisine est attendu, ce qui facilite la reconnaissance de la scène comme une cuisine)

How well did you know this?

Not at all

Perfectly

Qu’est-ce que les relations spatiales ? et pq c’est important ?

c la disposition et organisation des objets dans l’espace.
Ces relations aident à déterminer la structure d’une scène et à comprendre comment naviguer ou interagir avec l’environnement.

(par exemple, la reconnaissance qu’une chaise est sous une table peut indiquer un espace de salle à manger et influencer notre interaction avec cet espace, en tirant la chaise pour s’asseoir)

How well did you know this?

Not at all

Perfectly

Quelle est la première théorie vue en classe sur la reconnaissance des scènes ? de qui ?

La théorie des affordances de James Gibson

La reconnaissance des scènes ne se base pas sur une analyse détaillée des éléments visuels, mais sur la perception des AFFORDANCES, c’est-à-dire les possibilités d’action offertes par l’environnement.

How well did you know this?

Not at all

Perfectly

Quel est la force et la faiblesse de la théorie des affordances ?

+ :
explique bien la rapidité et l’efficacité de la reconnaissance des scènes dans la vie quotidienne.

:
elle ne prend pas en compte la capacité à reconnaître des scènes complexes ou ambiguës

How well did you know this?

Not at all

Perfectly

Quelles sont les 3 théories principales sur la reconnaissance des scènes et qu’est-ce qu’elle on en commun ?

théories autour du traitement de l’information :

1) Images intrinsèques (Barrow et Tenenbaum)

2) Relations d’objets et de composantes (Biedermann)

3) Propriétés de l’enveloppe spatiale (GIST, Olivia et Torralba)

How well did you know this?

Not at all

Perfectly

Qu’est-ce que la théorie des images intrinsèques ?

Une image peut être décomposée en un ensemble d’« images intrinsèques », chacune représentant une PROPRIÉTÉ fondamentale de la scène qu’elle dépeint.

–> théorie structuraliste

How well did you know this?

Not at all

Perfectly

Quelles sont les propriétés fondamentales de la théorie des images intrinsèques?

Réflectance
–> La proportion de lumière réfléchie par les surfaces de la scène
Illumination
–> La quantité et la direction de la lumière tombant sur les surfaces.
Distance
–> La distance des surfaces par rapport à la caméra (profondeur)

How well did you know this?

Not at all

Perfectly

Comment la théorie des composantes (Beiderman) aide-t-elle à reconnaître une scène?

On peut reconnaître une scène rapidement par les relations entre les objets qui la constituent.

How well did you know this?

Not at all

Perfectly

Quelles sont les 5 classes de relations entre les objets selon la théorie des composantes de Biederman?

1) Interposition
2) Support
3) Probabilité
4) Position
5) Taille familière

Qu’est-ce que le Scene-Gist?

Un modèle computationnel de la reconnaissance de scènes du monde réel

–> ne repose pas sur la segmentation et le traitement d’objets individuels

Le modèle Scene-Gist génère un espace multidimensionnel dans lequel les scènes partageant une appartenance à des … (par exemple, rues, autoroutes, côtes) sont projetées à proximité les unes des autres.

catégories sémantiques

La performance du modèle d’enveloppe spatiale montre que des informations spécifiques sur la forme ou l’identité … ne sont pas une exigence pour la catégorisation des scènes et que la modélisation d’une représentation holistique de la scène informe sur sa catégorie sémantique probable.

des objets

Quel modèle n’a pas forcément recours à l’identification des objets qui font partie de la scène ?

Le modèle d’enveloppe spatiale (GIST)

Sur quoi met l’accent le modèle d’enveloppe spatiale ?

La théorie met l’accent sur l’analyse des basses fréquences spatiales pour reconnaître la catégorie d’une scène avant même d’identifier des objets spécifiques

Cela signifie que nous pouvons percevoir si une scène est une rue, une plage ou une montagne juste en analysant sa structure globale, sans avoir besoin d’identifier des éléments précis comme une voiture, un palmier ou un rocher
Le lien avec l’image hybride est que les basses fréquences spatiales contiennent des indices suffisants pour une reconnaissance rapide des scènes, tout comme dans une image hybride où la perception change selon la distance

Compléter avec : basses et hautes

De loin → tu perçois les… fréquences→ la structure générale

De près → tu vois les… fréquences→ les détails précis

Celaillustreparfaitement la façon dont notre système visuel traite les scènes : d’abord globalement (basses fréquences), puis localement (hautes fréquences)

basses

hautes

Qu’est-ce que la grammaire de la scène?

Désigne les règles structurelles et les relations sémantiques au sein d’une scène qui guident notre perception et compréhension

–> Elle nous permet de déchiffrer des scènes complexes en identifiant comment les objets interagissent et se rapportent les uns aux autres dans des contextes spécifiques.

–> et explique notre capacité à interpréter rapidement les scènes, à reconnaître les anomalies et à anticiper la position des objets, même dans des environnements inconnus

La grammaire de scène joue un rôle clé dans ?

l'allocation de l'attention, la mémoire des objets et de leurs emplacements, et le traitement cognitif des informations visuelles

Qu'est-ce qui a été évalué pour étudier la grammaire de la scène ?

les mouvements oculaires - en qlq saccades les participants allouaient leur attention au bon endroit de la scène pour voir la craie - Seulement 14% de la scène est couverte. Donc une économie de 86%! - Notre connaissance de la localisation habituelle des objets dans une scène nous permet de faire des prédictions efficaces et très rapides.

Quelle méthode est à la base de de nombreux paradigmes en ce qui concerne la vitesse de la reconnaissance des scènes ?

Rapid Serial Visual Presentation (RSVP) - Avec seulement 13 ms de présentation, on peut facilement détecter dans une séquence rapide de scènes, la scène du mariage (par contre, il est nécessaire de connaître d’abord la cible)

Qu'est-ce que la Rapid Serial Visual Presentation? et qui l'a créé ?

Une méthode où des scènes sont présentées rapidement pour tester la reconnaissance. - Mary C (Molly) Potter

Quelle sont les 2 grandes découvertes issus des travaux de Simon Thorpe ?

1. le cerveau a besoin de moins de 150 ms pour différencier des scènes de différentes catégories. 2. En moins de 120 ms, une saccade oculaire est faite vers la scène d’une catégorie spécifique. (le t nécessaire pour le traitement de l’information dans les voies visuelles ventrales jusqu’à la prise de décision)

Quelles régions cérébrales sont impliquées dans la reconnaissance des scènes?

1. Lobe occipital --> traite les informations visuelles de base comme les lignes, les couleurs, les textures. Les 1ère étapes du traitement de la scène se déroulent ici (V1). 2. Cortex parahippocampique --> traitement de la disposition de la scène, des relations spatiales et de l'essence d'une scène --> Parahippocampal Place Area (PPA) 3. Cortex inférotemporal --> Impliqué dans la reconnaissance d'objets et contribue à la compréhension de la scène en identifiant les objets dans la scène 4. Cortex rétrosplénien --> Intègre les informations spatiales de différentes zones, facilitant la navigation et la compréhension de la scène 5. Cortex préfrontal médian --> Intègre divers aspects du traitement de la scène (objets, disposition spatiale, contexte) avec les connaissances et les souvenirs antérieurs, ce qui permet la compréhension de la scène.

Dans des études sur la Parahippocampal Place Area (PPA), ils ont découvert que Furniture < Empty Rooms. Qu'est-ce que cela veut dire ?

Les pièces vides et les scènes complètes activent davantage les régions impliquées dans la perception des scènes que des ensembles d’objets disposés sans structure claire (ont présenté diff type de scènes qui variait selon le nb d’objets, la complexité visuelle ou sémantique (des outils vs vide) (on vu que ce qui comptait était l’arrangement spatiale dans les scènes)

En quoi consiste la recherche de Ian sur la reconnaissance des scènes ?

Quelles sont les cellules impliquées dans les mécanismes de géolocalisation ? et qui les a découverte ?

* Cellules de lieu hippocampiques (John O’Keefe) * Cellules de direction de la tête (Jeff Taube) * Cellules de grille (May-Britt Moser)

Que font les cellules de lieu hippocampiques ?

S'activent à des endroits spécifiques d'une scène, contribuant à la navigation spatiale et à la reconnaissance de la scène.

Quel est le rôle des cellules de direction de la tête (CDT) ?

Jouent un rôle crucial dans la navigation spatiale en fournissant au cerveau un signal constant de l'orientation de notre tête dans l'espace, agissant comme une boussole interne.

Où se trouvent les cellules de direction de la tête (3) ?

* Thalamus * Cortex entorhinal * Cortex rétrosplénial

Où se trouvent les cellules de grille ? et c'est quoi ?

dans le cortex entorhinal - elles forment une représentation en grille de l'espace, contribuant à la navigation dans la scène et aux cartes mentales - l’espace était divisé en grille et que diff lieu sur cette grille vont être représenté par les cellules de grille - chaque lieux peut être vu comme un point d’une hexagone, si on regarde la géométrie de ses lieux

Quel rôle jour le cortex entorhinal, l'hippocampe et subiculum dans les cellules de grille

1. Cortex entorhinal (grid cell) --> comparé à un GPS, nous donne notre localisation dans l’espace 2. Hippocampe --> en interagissant avec hippo, notre carte se construit et inclut notre mémoire, reconnaissance de la scène

Donc le système de navigation est complété avec les cellules de lieu qui encode des lieus spécifiques, les cellules de la direction de la tête qui agissent comme une boussole interne et les cellules de grille qui agissent comme un GPS interne qui nous aide à nous ...

déplacer et orienter.

Qui sont les lauréats du prix Nobel de la médecine en 2014 pour la découverte des cellules de lieu et des cellules de grille ?

* John O’Keefe * Edvard Moser * May-Britt Moser

Quel est le rôle des cellules de bordures dans la navigation spatiale ?

Coder la présence de limites environnementales, agissant comme des gardiens des bords au sein de notre carte mentale.

Dans quelles régions se trouvent les cellules de bordures ?

Dans la région hippocampique, surtout: * Subiculum * Présubiculum * Cortex entorhinal