exam final - percevoir et reconnaître les scènes Flashcards
Qu’est-ce qu’une saccade occulaire ?
Des mouvements occolaires très rapides qui échantillonnent notre environ environ 3 à 5 fois par seconde
Qu’est-ce qu’une scène naturelle ?
Paysages
(perception influencée par nos souvenirs et émotions, textures visuelles, météo, grande variabilité selon notre géolocalisation)
Qu’est-ce qu’une scène artificielle ?
Environnements urbains
(perception influencée par la présence de personnes, relations spatiales complexes qui nous permettent de les naviguer)
Qu’est-ce qui diffère la reconnaissance d’objets de la reconnaissance des scènes ?
Impliquent des processus cognitifs différents et notre cerveau traite l’information visuelle de manière différente
Pour la reconnaissance d’objets (vs scènes)
Qu’est-ce que notre cerveau fait pour une vs l’autre
On va identifier les objets/éléments individuels dans la scène, séparer leurs catégories, selon leurs caractéristiques
Pour la reconnaissance des scènes (vs objets)
Qu’est-ce que notre cerveau fait ?
On a besoin d’une compréhension plus large de ce qu’on voit, pas simplement d’identifier les objets, mais une interprétation des relations spatiales de la scène
Pourquoi le contexte est-il important dans la reconnaissance des scènes ?
Car il fournit des informations supplémentaires qui aident à interpréter les objets dans leur environnement
Peux-tu me donner un exemple où le contexte aide à interpréter la scène ?
Voir une tasse sur une table de cuisine est attendu, ce qui facilite la reconnaissance de la scène comme cuisine
En quoi le contexte des objets aident à identifier les scènes ?
Le contexte aide à prédire quels objets sont susceptibles d’être présents et comment ils sont disposés, améliorant ainsi notre capacité à comprendre notre environnement
Qu’est-ce que les relations spatiales ?
Font référence à la disposition et à l’organisation des objets dans l’espace
En quoi la disposition des objets dans l’espace est essentielle à l’interprétation d’une scène ?
Ces relations aident à déterminer la structure d’une scène et comprendre comment naviguer ou interagir avec l’environnement
Qu’est-ce que la théorie des affordances
(Gibson - reconnaissance des scènes)
perception des possibilités que la scène nous offre en terme d’action (information affordée par l’environnement pour l’action)
Quels sont les forces et faiblesses de la théorie des affordances ?
(Gibson - reconnaissance des scènes)
Force : explique bien la rapidité et l’efficacité avec laquelle on reconnait les scènes dans la vie quotidienne
Faiblesse : failles dans la complexité des scènes
Qu’est-ce que la théorie des Images intrinsèques ?
(Harrow et Tenenbaum - reconnaissance des scènes)
Théorie structuraliste.
Une scène peut être décomposée en séries de composantes ou d’images intrinsèques, chacune représentant une propriété fondamentale de la scène
Quelles sont les 3 propriétés intrinsèques de l’image ?
(Harrow et Tenenbaum - reconnaissance des scènes)
- Réflectance : la proportion de lumière réfléchie par les surfaces de la scène (albédo)
- Illumination : la quantité et la direction de la lumière tombant sur les surfaces (la qualité de la lumière elle-même/source lumineuse)
- Distance : la distance des surfaces par rapport à la caméra/oeil (profondeur)
Qu’est-ce que la théories des Relations d’objet ou de composantes ?
(Biedermann - reconnaissance des scènes)
Comme dans la reconnaissance des objets par géons, on peut reconnaître les scènes par les éléments qui la composent et les relations entre les objets
Quelles sont les 5 classes de relations entre les objets ?
(Biedermann - reconnaissance des scènes)
- Interposition (les objets qui interrompent leur arrière-plan)
- Support (les objets ont tendance à reposer sur des surfaces)
- Probabilité (les objets ont tendance à se trouver dans certaines scènes mais pas d’autres)
- Position (les objets ont tendance à se trouver dans certaines positions et pas d’autres)
- Taille familière (les objets ont un ensemble limité de relations de taille avec d’autres objets)
Qu’est-ce que le modèle de scène-Gist ?
(Oliva & Torralba - reconnaissance des scènes)
Un modèle computationnel qui ne repose pas sur la segmentation des éléments de la scène mais plutôt à un ensemble de dimensions perceptuelles qui représentent la structure spatiale dominante d’une scène
Comment fonctionnent les images hybrides de propriétés de l’enveloppe spatiale ?
(Oliva & Torralba - reconnaissance des scènes)
Images composées des hautes fréquences spatiales d’une image et des basses fréquences spatiale d’une autre. Notre distance à l’image change notre perception de l’image.
Plus proche : on voit plus les hautes fréquences spatiales
Plus loin : on voit plus les basses fréquences spatiales
Quelles sont les dimensions perceptuelles qui représentent la structure spatiales dominante d’une scène ?
(Oliva & Torralba - reconnaissance des scènes)
Naturalité, ouverture, rugosité, expansion, rudesse, etc.
Comment sont déterminées les dimensions ?
(Oliva & Torralba - reconnaissance des scènes)
En utilisant des informations spectrales et grossièrement localisées comme la proximité aux catégories sémantiques (rues, autoroutes, côtes…)
Qu’est-ce la théorie de Grammaire de la scène ?
(Võ - reconnaissance des scènes)
Règles sémantiques sur la structure des scènes et la localisation habituelle des objets dans la scène nous permet de rapidement déchiffrer une scène de la reconnaître
Comment est-ce que le Eye-Tracking fonctionne ?
(Võ - reconnaissance des scènes)
Voit la distribution/proportion de mouvement occulaire sur une scène
(cette technologie reconnait à quel point nos prédictions sur la grammaire de la scènes sont efficaces et rapides)
Qu’est-ce que la théorie de Rapid Serial Visual Presentation/RSVP
(Potter - reconnaissance des scènes)
Avec seulement 13 milisecondes de présentation, on peut facilement détecter une séquence rapide de scènes avec très peu d’information (en connaissant d’abord la cible cherchée)