cours 6 Flashcards
La capacité à reconnaître et à catégoriser les objets est fondamentale pour la survie et l’interaction avec notre environnement.
Elle nous permet de naviguer dans notre monde, de reconnaître les dangers, de trouver de la nourriture, et contribue grandement aux interactions sociales.
Dans le contexte technologique, en reproduisant ces capacités, nous pouvons créer des systèmes qui améliorent notre sécurité, notre santé, et notre bien-être, en prenant en charge des tâches allant de la conduite autonome à la détection précoce de maladies dans des images médicales.
vrai
Les défis dans la création de systèmes de reconnaissance d’objets efficaces reflètent les complexités du traitement visuel dans le cerveau:
-la variabilité des objets
- leur contexte
- les conditions d’éclairage
Ceci exige des systèmes capables d’abstraction et de généralisation à partir d’exemples limités, similaire à la capacité humaine d’apprendre et de reconnaître des objets nouveaux ou peu familiers
vrai
Le problème de la reconnaissance d’objet
Les images n’étaient qu’un tas de pixels sur un écran, mais dans chaque cas, vous perceviez un éléphant.
Comment avez-vous reconnu les quatre images représentant un éléphant ?
Comment votre système visuel passe-t-il des points lumineux, comme les pixels, à des entités entières dans le monde, comme les éléphants ?
Théories de la reconnaissance des objets
Qu’est ce que la Théorie des templates? (gabari)
La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même “forme” dans le cerveau
Théories de la reconnaissance des objets
Qu’est ce que la Théorie des prototypes? (Rosch)
Prototype: un membre “typique” ou “moyen” d’une catégorie, possédant les caractéristiques les plus représentatives de cette catégorie.
donc, Les individus classent + rapidement et plus facilement des objets comme appartenant à une catégorie s’ils sont proches du prototype de cette catégorie.
ex: dans la catégorie des oiseaux, un robin est souvent considéré comme un exemple plus typique (ou prototypique) que, disons, un pingouin
vrai ou faux,
théorie des gabaris = une collection de formes
théorie prototype = une moyenne de catégories, on prend tt les éléments d’une catego et on fait une moyenne pr ensuite comparer objet a cette moyenne la
vrai
Théories de la reconnaissance des objets
Qu’est ce que la Théorie des exemplaires? (Nosofsky)
Les individus classent des objets et des événements en se basant sur la comparaison avec des exemples spécifiques (ou exemplaires) qu’ils ont rencontrés dans le passé, plutôt que par rapport à un prototype moyen ou idéal de chaque catégorie.
donc, l’élément le plus similaire a cet objet, well on l’attribue a cette catégorie la
Théories de la reconnaissance des objets
Qu’est ce que la Théorie de la reconnaissance généralisé? (Ashby)
- une extension multidimensionnelle de la SDT (Multidimensionnel = ex un bhay en 3d, axe en x, y et z, et sur chaque axe on a une caract specifique ex l’orientation, et sur une autre dimension une autres caract etc. on px avoir un paquet de dimension comme sa qui encode d’autre qualité plus complexe de l’image comme ex les expression faciales ou autre)
- Considère la reconnaissance d’objets comme un processus de décision probabiliste
- on a plusieurs exemplaire dans notre esprit then on calcule une certaine probabilité pr prendre une décision sur la catégorie d’un objet
indépendance perceptuel: ex covarie pas avk le genre et l’expression, pas de corrélation, donc indépendance perceptuelle entre les 2 dimensions
si oui, YA une corrélation entre les 2, pas de indépendance perceptuel
Separabilité perceptuelle = 2 ou plusieurs item, on px tu séparer perpétuellement les stimulus, si c non c que y’a pas de relation linéaire entre le genre et les expression faciale (dans l’ex on px séparer le stimulus bleu du stimulus rouge sur la dimension du genre mais pas de l’expression = a gauche
(s’intéresse à la relation entre 2 stimuli. Donc vx savoir si la combinaison unique de l’expression faciale du bonheur sur un visage masculin et féminin influence la perception du bonheur. Si non, si les 2 distributions de réponses de perception de l’émotion se chevauchent, on a la séparabilité perceptuelle pour ces deux stimuli. Ici on regarde le changement sur l’axe des X en gardant les valeurs sur l’axe des Y fixes. On veut savoir si un changement de perception de genre influence la perception du bonheur)
Separabilité decisionnelle = 2 type de division de l’espace perceptuel, si distribution tombe dans une des région, on aura une réponse, et dans l’autre, une autre réponse
ex: Si atterit dans:
zone de gauche = heureux
Zone de droite = triste
A gauche : Division linéaire entre heureux et triste et comme c parallèle a l’axe du genre, sa implique pas d’interaction entre genre et expression, donc oui s.d.
Lui en diagonal (a droite) : échec de s.d pcq au fur et à mesure qu’une des dimensions augmente, l’autre aussi, donc pas de s.d
(ici plutôt au niveau du participant ou de la participante. On vx décrire la tendance ou la façon qu’une personne sépare la perception du genre et de l’émotion positive ou négative. C’est le critère en théorie de détection du signal. On vx donc savoir si le participant a un biais pour un genre, ex en ayant plus tendance à dire que les visages féminins sont heureux que ceux des hommes)
VOIR PIC
qu’est ce que la Théorie de la reconnaissance par composants?
- Le modèle de reconnaissance d’objets de Biederman: soutient que les objets sont reconnus par les identités et les relations de leurs composants.
- Géons : Les « ions géométriques » à partir desquels les objets sont construits
Qu’est ce qu’un Réseau neuronal profond (DNN)?
- Réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets
- De nombreuses instances d’un objet sont montrées au réseau, avec du feedback
- au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé.
- A force de répéter entrainement, le modèle arrive a reconnaitre nouvelle image (couche après couche)
En utilisant un réseau neuronal profond (DNN) pour modéliser les propriétés visuelles du stimulus, les auteurs montrent que les propriétés de niveau intermédiaire et de haut niveau des images peuvent prédire la conscience visuelle, et peuvent fournir une explication mécanistique du phénomène du clignement attentionnel.
vrai
La théorie de la cellule grand-mère
Qu’est ce qu’une cellule grand-mère?
- On px tu avoir un neurone qui px reconnaitre notre grand mère?
- Yarrive quoi si un neurone meurt? Tu reconnais pu le concept?? Prob pas
- certaine étude suggère que oui : Découvre cellule qui repondais tjr a jennifer anniston tjrr peu importe position mais pas a brad pitt
- then Sont tomber par chance sur neurone qui répondent a certaine propriété spécifique mais pas neurone grand-mère
vrai ou faux, pr distinguer 2 objets et savoir si animé ou inanimé, on fait plus d’erreur quand l’objet est proche de la frontière décisionnelle!! c plus long avant d’attribué la bonne catégorie
vrai
vrai ou faux, Les champs récepteurs des cellules extrastriées sont plus sophistiqués que ceux du cortex strié. Ils répondent à des propriétés visuelles importantes pour la perception des objets. Par exemple, « boundary ownership ». Pour une frontière donnée, quel côté fait partie de l’objet et quel côté fait partie de l’arrière-plan ? De toute évidence, notre cerveau fait quelque chose d’assez sophistiqué au-delà de V1.
vrai
cela-dit, qu’est ce que la vision de niveau intermédiaire?
- une étape vaguement définie du traitement visuel qui intervient après que les caractéristiques de base ont été extraites de l’image (vision de bas niveau) et avant la reconnaissance d’objet et la compréhension de la scène (vision de haut niveau)
- Implique la perception des bords et des surfaces
- Détermine quelles régions d’une image doivent être regroupées en objets (kess qui appartient ensemble)
- Comment trouvez-vous les bords des objets?
Les cellules du cortex visuel primaire ont de petits champs récepteurs.
(Ces récepteur permettent pas de savoir quels bords vont ensemble et lesquels ne vont pas ensemble)
vrai ou faux, Les détecteurs de bord informatisés ne sont pas aussi performants que les humains. Parfois, les ordinateurs ne trouvent pas les bords que les humains voient facilement.
vrai
Qu’est ce qu’un Contour illusoire?
Un contour qui est perçu même si rien ne change d’un côté du contour à l’autre.
VOIR PIC PACMAN
dans pic, on vois clairement en avant plan un triangle blanc, c notre cerveau qui fait contour illusoire
On percoit cercle plan pck notre syst visuelle rempli les trous , complète les trous vide entre les différentes lignes pr arriver a une hypothese qu’on est en presence d’un cercle