Cours 4: reconnaissance de la forme et perception Flashcards
qu’Est-ce que la reconnaissance?
On reconnaît un objet, même si on change : l’orientation, la taille, la couleur, s’il est obstrué ou flou. Guidé seulement par les données entrantes (apparence de l’objet). On doit avoir accès au caractéristiques pertinentes pour pouvoir reconnaître la lettre.
Qu’est-ce que le traitement ascendant ou basé sur les données?
traitement basé sur les stimuli entrants (données) et leurs caractéristiques physiques, déclenché par stimulus atteignant le sys visuel, soit suit une voie sérielle vers la mémoire. On fait un traitement diff pour chq entrée. On va faire des erreurs dans des conditions dégradées.
Qu’est-ce que l’appariement au gabarit?
chq fois qu’on voit un objet, on fait une représentation mentale, on mémorise toutes ces représentations là pour pouvoir faire des comparaisons globales jusqu’à ce que le sys trouve un appariement.
Quelles sont les étapes de l’appariement au gabarit?
1) activation des récepteurs rétiniens 2) activation des détecteurs de l’objet spécifique. Donc, on crée dans notre cerveau un représentation/détecteur qui dit lorsque cet ensemble de C là sur la rétine sont activés de façon simultanée et avec un tel pattern, il s’agit d’un tel objet qui est représenté.
Quels sont les problèmes de la théorie de l’appariement?
1) parcimonie : un gabarit par objet distinct 2) aucun soutien neurologique 3) flexibilité (doit stimuler exactement les bons récepteurs) doit avoir une infinité de gabarit pour un même objet. Les gabarits prennent-ils en compte la variabilité ? taille/emplacement exact, orientation/forme. Il doit y avoir une façon plus simple de représenter des connaissances au niveau visuel dans le cerveau.
Pour essayer de sauver la théorie, qu’Est-ce qui proposé?
on recule le problème en proposant un sys d’Ajustement d’orientation et un sys d’ajustement de taille mais qu’est-ce que ces sys?
Qu’Est-ce le pandémonium?
modèle de reconnaissance basé sur les données (traitement ascendant), basé sur l’analyse de caractéristiques (objets reconnus après l’analyse de leurs composantes), modèle de traitement de l’info
Quel est l’idée générale du modèle de traitement de l’info dans le pandémonium?
étapes de traitement–> chq étape prend un temps det–> transformations à chq étape –> opérations sérielles et est composé de 4 types d’unités de reconnaissance (‘démons’). On divise l’objet qu’on est en train de percevoir en caractéristiques selon le principe de C simples et C complexes et là on va essayer de voir dans notre sys cognitif (MTL) s’il existe une représentation qui inclut l’ensemble des caractéristiques qui active notre sys. Donc se base sur l’analyse des caractéristiques, soit des parties/composantes d’objet.
Comment s’appelle les démon à chq étape?
1) démon image 2) démon des caractéristiques 3) démon cognitif 4) démon de la décision
Que fait le démon image?
enregistre l’image initiale du signal ext. Les récepteurs rétiniens + mémoire sensorielle.
Que fait le démon des caractéristiques?
cherche une caractéristique particulière dans le patron d’entrée (ligne spécifique, angle spécifique …) et fait un décompte. C simple + détecteurs de caractéristiques. Avec un nb limité des caractéristiques, on peut définir et distinguer toutes les lettres de l’alphabet.
Que fait le démon cognitif?
portent attention aux rép des démons des caractéristiques et recherchent un patron particulier (représentation) dans notre MCT / sys cognitif
Que fait le démon de la décision?
écoute le pandémonium crée par les démons. Rép est dét par le démon qui crie le plus fort (dans la MCT).
Quels sont les arguments soutenant le pandémonium?
Puissance = plus parcimonieux (seulement besoin de quelques caractéristiques donc bcp plus simple pour la reconnaissance d’objet). Avec ensemble fini de détecteurs de caractéristiques, reconnaissance possible d’un nb potentiellement infini d’objet.
Flexibilité= peut reconnaître objet même si changement d’orientation, de taille ou autres distorsions
Support neurologique= basé sur les résultats d’Hubel et Wiesel, soit les C simples et complexe ainsi que des détecteurs de caractéristiques.
Prédiction des erreurs= tâche d’identification de lettres avec une approche basée sur les caractéristiques prédit erreurs de confusion. On confond les lettres/chiffres quand ils partagent les mêmes caractéristiques.
Qu’est-ce que la théorie de reconnaissance par composante ?
traitement ascendant, basé sur caractéristiques, on reconnait des objets par séparation en 36 géons. Connexions aux vertex (coins, endroit où il y a 3 segments qui se rejoignent si on les enlève= devenir mêlé).
Qu’est-ce qu’un géons
assemblés de diverses façons et forment un nb pratiquement infini d’objet.
Qu’est-ce que le modèle de la théorie de reconnaissance par composante?
analyse des caractéristiques de surface–>dét des composantes présentes–> appariement de composantes aux représentations d’objets–> reconnaissance d’objet
Quelle est la prédiction de la théorie tant qu’aux géons sont importants pour l’identification?
reconnaissance en fct du nb de géons. Principe de récupération componentielle (si assez de géons, reconnaissance se fait).
Quels sont les résultats quand qu’à l’exp sur les géons?
plus de géons présentés–> moins d’erreurs, preuve pour représentation mentale de géons. Donc importance du traitement et de la division en géons. On ne fait pas une évaluation globale de la similarité entre le vrai monde et dans la MTL.
Quelle est la prédiction de la théorie tant qu’aux vertex sont importants pour l’identification?
les vertex =clé, car caractéristiques diagnostiques importantes de l’image. Retrait de parties a un plus grand effet sur le taux d’erreur quand les vertex sont manquants.
Quels sont les résultats quand qu’à l’exp sur les vertex?
vertex absent (non-récupérable) augmentation taux d’erreur, pas reconnu 80% du temps même après 5 sec. Récupérable pas d’erreur après 5 sec d’exposition. Preuve pour important de vertex.
Quelle est la conclusion des 2 exp sur les géons et les vertex?
importance pour les géons ET les vertex
Quels sont les pts qui soutiennent la théorie de la reconnaissance par composantes?
Puissance = parcimonie (seulement 36 géons) simple comme sys, avec un ensemble fini de géons dans le sys cognitif peut reconnaître un nb potentiellement infini d’objet 3D
Flexibilité (à condition qu’il y aille un nb suffisant de géons) = reconnaissance d’objet malgré le changement de taille, d’orientation, occlusion et dégradation du signal variées et serait invariant aux diff perspectives (géons(2d)) ne changent pas de forme lorsqu’un objet observé d’un autre pt de vue
Support neuro pour géons et relations= déficits diff pour parties et objets complets.
Quels sont les pts qui limitent la théorie de la reconnaissance par composantes?
Théorie incomplète = Pas de mécanismes permettant de réduire les complexités de scènes réelles jusqu’aux géons et Comment extrait-on les géons d’une image?
Objets irréguliers ne sont pas traités en parties= Ex: Buisson ou chandail froissé (au niveau des textures) pas tous les objets qui sont reconnaissable par les géons
Invariance= Pas toujours vrai chez humains et Diff de reconnaissance selon la vue de l’objet
Objets sans vertex reconnaissables par l’humain=Ex: pomme/poire/nuages reconnus et distingués
Couleur = Serait important pour la reconnaissance, si on change la couleur de l’objet= ça nous enlève un indice
Permet de distinguer catégories mais pas les membres= Ex distinguer 2 téléphones
On peut percevoir le même signal/image, mais notre interprétation peut changer