cour 8: percevoir et reconnaître des scènes Flashcards
À chaque instant de notre vie, on échantillonne notre environnement environ _______à _______ fois par seconde par des mouvements oculaires saccadés.
À chaque instant de notre vie, on échantillonne notre environnement environ trois à cinq fois par seconde par des mouvements oculaires saccadés.
Quelle est la structure sur laquelle les images s’arrête pour créer une fixation?
la fovéa
Quelles sont les 2 types de scènes visuelles?
scène naturelle vs artificielle
Nommes les 4 types de scènes naturelles et ce qu’elles impliquent dans la perception.
● Paysages : Montagnes, forêts, plages, déserts, prairies. Ces scènes évoquent typiquement des émotions et souvenirs distincts, s’appuyant fortement sur l’agencement spatial, la couleur et les textures naturelles.
● Étendues d’eau : Océans, lacs, rivières, chutes d’eau. Le mouvement de l’eau ajoute des
aspects dynamiques à la perception des scènes, ainsi que des reflets et des paysages sonores uniques.
● Conditions météorologiques : Journées ensoleillées, pluie, neige, brouillard. Les
phénomènes atmosphériques ont un impact significatif sur notre perception des scènes,
affectant la visibilité, les conditions de lumière et l’esthétique générale.
● Biomes : Savanes, forêts tropicales, récifs coralliens. Reconnaître des biomes spécifiques implique d’intégrer des informations sur la végétation, la vie animale et les caractéristiques
du terrain
Nommes les 4 types de scènes artificielle et ce qu’elles impliquent dans la perception.
● Environnements urbains : Rues, bâtiments, places, parcs. Ces scènes nécessitent le traitement de relations spatiales complexes, d’indices de navigation et d’interactions sociales.
● Environnements intérieurs : Maisons, bureaux, cafés, bibliothèques. La reconnaissance implique de comprendre les activités humaines et la fonction des différents espaces en fonction du mobilier, de la décoration et de l’agencement.
● Lieux culturels : Bâtiments religieux, monuments historiques, musées. Ces scènes déclenchent souvent des connaissances et émotions spécifiques associées à une importance culturelle.
● Scènes dynamiques : Carrefours, marchés bondés, événements sportifs. Le traitement de ces scènes nécessite des changements rapides d’attention et l’intégration des informations
de mouvement dans la compréhension de la scène.
Quelle est la différence entre la reconnaissance des scènes et des objets ?
● Impliquent deux processus cognitifs distincts
● La principale différence réside dans la manière dont notre cerveau traite et interprète les informations visuelles.
Reconnaissance d’objets
●l’identification et la catégorisation d’éléments individuels dans notre champ visuel, tels que des objets, des personnes ou des animaux.
● se concentre sur les caractéristiques spécifiques de ces éléments: la forme, la taille, la couleur, la texture pour les distinguer
Reconnaissance de scènes
● englobe une compréhension plus large et plus globale de l’environnement visuel.
● inclut l’interprétation du contexte, la compréhension des relations spatiales entre les objets, et la capacité à saisir le sens global ou l’essence d’un environnement.
● Les scènes sont souvent complexes et contiennent de multiples objets qui interagissent dans un espace partagé, ce qui nécessite une intégration des informations visuelles à un niveau supérieur.
Explique le rôle du contexte dans la reconnaissance de scènes
● fournit des informations supplémentaires qui aident à interpréter les objets dans leur environnement.
● prédire quels objets sont susceptibles d’être présents et comment ils sont disposés, améliorant ainsi notre capacité à comprendre et à interagir avec notre environnement.
Explique le rôle des relations spatiales dans la reconnaissance de scènes
Font référence à la disposition et à l’organisation des objets dans l’espace.
● Comprendre la disposition des objets est essentiel pour interpréter une scène.
● Ces relations aident à déterminer la structure d’une scène et à comprendre comment naviguer ou interagir avec l’environnement.
Explique la théorie des affordances de James J. Gibson et sa force
emphase sur comment la scène visuelle peut guider nos actions et nos comportements sans faire une analyse complete des éléments non plus.
La reconnaissance des scènes se base sur la perception des affordances, c.a.d les possibilités d’action offertes par l’environnement.
● explique bien la rapidité et
l’efficacité de la reconnaissance des scènes dans la vie quotidienne.
Explique le problème avec la théorie des affordances de James J. Gibson (ce qu’elle ne permet pas d’expliquer)
elle ne prend pas en compte la
capacité à reconnaître des scènes complexes ou
ambiguës.
Nomme les 3 théories autour du traitement de l’information et leur auteur
● Images intrinsèques (Harrow et Tenenbaum, 1978)
● Relations d’objets ou de composantes (Biedermann, 1982)
● Propriétés de l’enveloppe spatiale (GIST; Oliva & Torralba, 2001)
Explique la théorie des images intrinsèque de Harry Barrow et les 3 propriétés sous-jacentes.
Une image peut être décomposée en un
ensemble d’« images intrinsèques », chacune représentant une propriété
fondamentale de la scène qu’elle dépeint.
● Ces propriétés incluent :
○ Réflectance : La proportion de lumière réfléchie par les surfaces de la scène (albédo).
○ Illumination : La quantité et la direction de la lumière tombant sur les surfaces.
○ Distance : La distance des surfaces par rapport à la caméra (profondeur)
Explique la théorie des composantes de Biederman
On peut reconnaître une scène
rapidement de par les relations entre les objets qui la constituent
5 classes de relations: l’interposition, le support, la probabilité, la position et la taille familière
Définit les 5 classes de relations entre les objets dans la théorie des composantes de Biederman
● l’Interposition (les objets interrompent leur arrière-plan).
● le Support (les objets ont tendance à reposer sur des
surfaces).
● la Probabilité (les objets ont tendance à se trouver dans
certaines scènes mais pas dans d’autres).
● la Position (étant donné qu’un objet est probable dans une scène, il est souvent trouvé dans certaines positions et pas dans d’autres).
● la Taille familière (les objets ont un ensemble limité de
relations de taille avec d’autres objets).
Explique le modèle de Scene Gist (enveloppe spatiale) de Aude Olivia
Un modèle computationnel de la reconnaissance de
scènes du monde réel qui ne repose pas sur la segmentation et le traitement d’objets ou de régions
individuels.
● dimensions perceptuelles
(naturalité, ouverture, rugosité, expansion, rudesse) qui représentent la structure spatiale dominante d’une scène en utilisant des informations spectrales et grossièrement localisées.
● espace multidimensionnel dans lequel les scènes partageant une appartenance à des catégories sémantiques (par exemple, rues, autoroutes, côtes) sont projetées à proximité les unes des autres.
Montre que des informations spécifiques sur la forme ou l’identité des objets ne sont pas une exigence pour la catégorisation des scènes et que la modélisation d’une représentation holistique de la scène informe sur sa catégorie sémantique probable.
Explique le principe d’image hybride
développement d’images hybrides: transforme une image dans l’espace de fourier (décomposition de fréquences spatiales de l’image et va filtrer pour révéler une bande de fréquence x) Les images hybrides combinent une représentation fréquentielle de 2 images. En changeant la taille de l’image sur la rétine, change le nombre de photorécepteurs qui répondent et change l’information (autre bande de fréquence spatiale percue) et nouvelle image apparaît.