Cours 8 Flashcards

1
Q

Vrai ou faux? À chaque instant de notre vie, on échantillonne notre environnement environ 5 à 7 fois par seconde par des mouvements oculaires saccadés

A

Faux! On échantillonne environ 3 à 5 fois!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une scène?

A

Une riche collection d’objets, de surfaces, d’agents, de structures, de textures et de couleurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les deux catégories de scènes visuelles?

A

Scènes naturelles & scènes artificielles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les différentes sortes de scènes naturelles? (4)

A

1) Paysage (forêts, déserts) : évoquent des émotions et souvenirs distincts en s’appuyant fortement sur l’agencement spatial, la couleur et les textures naturelles

2) Étendues d’eau (océans, lacs) : mouvement d’eau, reflets ajoutent des aspects dynamiques

3) Conditions météorologiques (ensoleillé, pluie) : ces phénomènes ont un impact significatif sur notre perception des scènes, affectant la visibilité, la,lumière et l’esthétique

4) Biomes (Savanes, récifs coralliens) : Reconnaître ces biomes implique des infos sur la végétation, la vie animale et les caractéristiques du terrain

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les différentes sortes de scènes artificielles? (4)

A

1) Environnements urbains (rue, bâtiments) : nécessitent le traitement de relations spatiales complexes, d’indices de navigation et d’interactions sociales

2) Environnements intérieurs (Maisons, bureaux) : la reconnaissance implique de comprendre les activités humaines et la fonction de différents espaces en fonction du mobilier et de la déco

3) Lieux culturels (monuments historiques, musées) : déclenchent des connaissances et émotions spécifiques associées à une importance culturelle

4) Scènes dynamiques (marchés bondés, événements sportifs) : nécessite des changements rapides d’attention et l’intégration des infos de mouvement dans la compréhension de la scène

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment expliquer la différence entre la reconnaissance d’objets et la reconnaissance des scènes?

A
  • Impliquent deux processus cognitifs distincts
  • La principale différence réside dans la manière dont notre cerveau traite et interprète les infos visuelles

1) Reconnaissance d’objets
-identification & catégorisation d’éléments individuels dans notre champ visuel (objets, personnes, animaux)
- Se concentre sur les caractéristiques spécifiques (forme, taille, couleur, texture)

2) Reconnaissance de scènes
- Englobe une compréhension plus large et globale de l’environnement
- Ne sert pas seulement à identifier des éléments individuels, inclut aussi l’interprétation du contexte, compréhension des relations spatiales entre les objets et la capacité à saisir le sens global d’un environnement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est le rôle du contexte et celui des relations spatiales?

A

1) Contexte
- Joue un rôle crucial dans la reconnaissance des scènes, car il fournit des infos supplémentaires qui aident à interpréter les objets dans leur environnement (ex de voir une tasse sur une table de cuisine : attendu)
- Aide a prédire quels objets sont susceptibles d’être présents et comment ils sont disposés, améliorant notre capacité à comprendre et à interagir avec notre environnement

2) Relations spatiales
- Font référence à la disposition et l’organisation des objets dans l’espace
- Aident à déterminer la structure d’une scène et à comprendre comment naviguer ou interagir avec l’environnement (ex comprendre que la chaise est sous la table et qu’il faut la tirer pour s’asseoir)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que la théorie des affordances?

A

Théorie par James J. Gibson

  • Elle met l’accent sur l’info «affordée» par l’environnement pour l’action (l’environnement permet de nous guider)
    -La reconnaissance des scènes ne se base pas sur une analyse détaillée des éléments visuels, mais plus sur la perception des affordances (possibilités d’action offertes par l’environnement)

+ : Explique bien la rapidité et l’efficacité de la reconnaissance des scènes dans la vie quotidienne

  • : Prend pas en compte la capacité à reconnaître des scènes complexes ou ambiguës.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les théories de la reconnaissance des scènes entourant le traitement de l’information? (3)

A
  • Images intrinsèques (Harrow et Tenenbaum, 1978)
  • Relations d’objets ou de composantes (Biedermann, 1982)
  • Propriété de l’enveloppe spatiale ( Oliva et Torralba, 2001)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est ce que la théorie des images intrinsèques?

A
  • L’image peut être décomposée en un ensemble d’images intrinsèques, chacune représentant une propriété fondamentale de la scène qu’elle dépeint
  • Ces propriétés sont : réflectance (proportion lumière réfléchie par surfaces de la scène), illumination (quantité et direction lumière tombant sur surfaces), distance (entre surfaces par rapport à la caméra)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la théorie des composantes?

A
  • On peut reconnaître une scène rapidement de par les relations entre les objets qui la constituent
  • 5 classes de relation : Interposition (objets interrompent leur arrière-plan), support (objets ont tendance à reposer sur surfaces), probabilité (objets ont tendance à se trouver dans certaines scènes mais pas d’autres), position (il est trouvé dans certaines positions mais pas d’autres), taille familière
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que la théorie des propriétés de l’enveloppe spatiale?

A
  • On utilise l’image hybride et l’espace de Fourrier -> On décompose en fréquence les images
  • On utilise l’exemple d’une image hybride du corridor (basses fréquences) et d’une ville (hautes fréquences)
  • Juste en changeant la taille, ça change la perception des fréquences spatiales (gros : on voit la ville, petit : on voit les corridors)

Scene-gist
- C’est un modèle computationnel de la reconnaissance de scènes du monde réel qui ne repose pas sur la segmentation et le traitement d’objets ou de régions individuelles
- Identifie un ensemble de dimensions perceptibles qui représentent la structure spatiale dominante d’une scène
- Ces dimensions peuvent être estimées de manière fiable en utilisant des infos spectrales et grossièrement localisées
- Le modèle génère un espace multidimensionnel dans lequel les scènes partageant une appartenance à des catégories sémantiques (rues, autoroutes) sont projetées à proximité les unes des autres
- La performance du modèle d’enveloppe spatiale montre que des infos spécifiques sur la forme ou l’identité des objets ne sont pas une exigence pour la catégorisation des scènes et que la modélisation d’une représentation holistique de la scène informé sur sa catégorie sémantique probable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la grammaire de la scène?

A
  • Elle désigne les règles structurelles et les relations sémantiques au sein d’une scène qui guident notre perception et compréhension
  • Nous permet de déchiffrer des scènes complexes en identifiant comment les objets interagissent et se rapportent les uns aux autres dans des contextes spécifiques
  • Aide à expliquer notre capacité à interpréter rapidement les scènes, à reconnaître les anomalies et à anticiper la position des objets, même dans des environnements inconnus
  • Joue un rôle clé dans l’allocation de l’attention, la mémoire des objets et de leurs emplacements, et le traitement cognitif des informations visuelles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Expliquez l’expérience de la craie

A
  • On demande de retrouver une craie dans une salle de classe majoritairement blanche et avec deux tableaux
  • Facile à trouver!
  • Seulement 14% de la scène est couverte, donc économie de 86%
  • Notre connaissance de la localisation habituelle des objets dans une scène nous permet de faire des prédictions efficaces et très rapides
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Expliquez les travaux de Molly Potter sur la vitesse de la reconnaissance des scènes à l’aide du Rapid Serial Visual Presentation

A

On présente une suite de plusieurs images très rapidement. On demande d’identifier la photo de mariage.

  • Avec seulement 13ms de présentation, on peut facilement détecter dans une séquence rapide de scènes
  • Dans cet exemple, il est nécessaire de connaître d’abord la cible
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux? Le cerveau a besoin de moins de 150 ms pour différencier des scènes de différentes catégories

A

Vrai!

  • Selon les travaux de Simon Thorpe, en moins de 120 ms, une saccade oculaire est faite vers la scène d’une catégorie spécifique (expérience, on montre deux images, demande d’identifier celle qui est l’oiseau)
17
Q

Quelles sont les régions cérébrales impliquées dans la reconnaissance des scènes? (4)

A

1) Lobe occipital: Traite les infos visuelles de base comme les lignes, les couleurs et les textures. Les premières étapes du traitement de la scène se déroulent ici

2) Cortex parahippocampique : joue un rôle crucial dans le traitement de la disposition de la scène, des relations spatiales et de l’essence d’une scène

3) Cortex inférotemporal : Impliqué dans la reconnaissance d’objets et contribue à la compréhension de la scène en identifiant les objets dans la scène

4) Cortex rértrosplénien : Intègre les infos spatiales de différentes zones, facilitant la navigation et la compréhension de la scène

18
Q

De quelle façon le message passe-t-il dans le cerveau lorsqu’on perçoit une scène?

A

1) Il y a d’abord la «scène caption», lorsqu’on voit ce qui se passe (ex: 3 femmes qui jouent au Frisbee). À ce moment, il y a de l’activité dans le cerveau (7T fMRI)

2) Cette activité du cerveau permet une activation qui mène à une réponse du voxel. Pendant ce temps, il y a aussi le Large language model (LLM) qui s’active.

3) Cela mène à l’encodage d’un modèle, qui par la suite, permet de faire une analyse de similarité représentationelle (RAA)

4) Cela permet d’en décoder la définition ou la représentation de la scène perçue (ex: On voit un chat qui sort sa tête d’une fenêtre, le décodeur permet de comprendre que chat cherche à regarder en dehors)

19
Q

Quelles sont les trois types de cellules et les chercheurs reliés derrière les mécanismes de géolocalisation?

A

1) Cellules de lieu hippocampiques (John O’Keefe)
2) Cellules de direction de la tête (Jeff Taubes)
3) Cellules de grille (Edvard Moser et May-Britt Moser)

20
Q

Quel est le rôle des cellules de lieu hippocampiques?

A

Elles s’activent à des endroits spécifiques d’une scène, contribuant à la navigation spatiale et à la reconnaissance de la scène

21
Q

Qu’est-ce que sont les cellules de direction de la tête (CDT) et quel est leur rôle?

A
  • Les CDT sont un groupe spécialisé de neurones trouvés dans des zones du cerveau telles que le thalamus, le cortex entorhinal et le cortex rétrosplénial
  • Elles jouent un rôle crucial dans la navigation spatiale en fournissant au cerveau un signal constant de l’orientation de notre tête dans l’espace, agissant comme une boussole interne
22
Q

Quel est le rôle des cellules de grille?

A

-Elles se retrouvent dans le cortex entorhinal
-Elles forment une représentation en grille de l’espace, contribuant à la navigation dans la scène et aux cartes mentales

23
Q

Qui sont les récipiendaires du prix Nobel de la médecine en 2014 et pourquoi?

A

John O’Keege, Edvard et May-Britt Moser pour leur découverte des cellules de lieu et des cellules de grilles

24
Q

Qu’est-ce que sont les cellules frontalières et quel est leur rôle?

A

-Elles sont un groupe de neurones trouvés dans la formation hippocampique, spécifiquement dans des régions comme le subiculum, le présubiculum et le cortex entorhinal
- Elles jouent un rôle distinct dans la navigation spatiale en codant la présence de limites environnementales,m’agissant essentiellement comme des gardiens des bords au sein de notre carte mentale