cours 6 - percevoir et reconnaitre les objets Flashcards
la neuroscience cognitive et computationnelle veut répondre à quelles questions concernant la reconnaissance des objets (3)
● D’un point de vue psychophysique, quelles sont les propriétées de l’image qui caractérisent les objets?
● Comment est-ce que le cerveau traite l’information visuelle pour reconnaître et catégoriser les objets?
● Comment est-ce que ces principes peuvent inspirer et informer les technologies modernes de reconnaissance d’objets.
quelle est l’importance de la reconnaissance des objets (3)
- La capacité à reconnaître et à catégoriser les objets est fondamentale pour la survie et l’interaction avec notre environnement.
- Elle nous permet de naviguer dans notre monde, de reconnaître les dangers, de trouver de la nourriture, et contribue grandement aux interactions sociales.
- Dans le contexte technologique, en reproduisant ces capacités, nous pouvons créer des systèmes qui améliorent notre sécurité, notre santé, et notre bien- être, en prenant en charge des tâches allant de la conduite autonome à la détection précoce de maladies dans des images médicales.
quels sont les défis dans la création de systèmes de reconnaissance d’objets efficaces qui reflètent les complexités du traitement visuel dans le cerveau: (3) et ces défis exigent quoi (2)
○ la variabilité des objets
○ leur contexte
○ les conditions d’éclairage
exige des systèmes capables d’abstraction et de généralisation à partir d’exemples limités, similaire à la capacité humaine d’apprendre et de reconnaître des objets nouveaux ou peu familiers.
quel est le problème de la reconnaissance des objets
on est tolérant aux différents exemplaires du mm objets, on les étiquette tous comme représentant un éléphant mm si différence
explique les éléments locaux et globaux avec l’éléphant
comparaison avec personnes aveugles qui toucheraient chaque partie de l’éléphant avec notre systeme visuel. on ne voit qu’une partie de l’image pour chaque champ récepteur -» comment on assemble les infos pour voir l’éléphants. comment à partir d’éléments locaux (les parties de l’éléphants) pour percevoir un élément global (l’éléphant)
Théories de la reconnaissance des objets
est ce que il y a une théorie plus dominante que les autres
NON
Théories de la reconnaissance des objets
quest ce que la théorie des templates (gabarits)
La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même “forme” dans le cerveau.
La forme de l’objet, ici pas invariance et pas tolérance à diff formes, il faudrait bcp de gabarits pour les diff pt de vue et version
Théories de la reconnaissance des objets
quest ce que la théorie des prototypes (qui?) et quoi
par eleanor Rosch en 1970
Prototype: un membre “typique” ou “moyen” d’une catégorie, possédant les caractéristiques les plus représentatives de cette catégorie
- Les individus classent plus rapidement et plus facilement des objets comme appartenant à une catégorie s’ils sont proches du prototype de cette catégorie.
- Par exemple, dans la catégorie des oiseaux, un robin est souvent considéré comme un exemple plus typique (ou prototypique) que, disons, un pingouin.
grande influence dans sciences cognitives : auditive, visuelle et linguistique
Théories de la reconnaissance des objets
quest ce que la théorie des exemplaires (qui?)
par robert Nosofsky (1980)
Les individus classent des objets et des événements en se basant sur la comparaison avec des exemples spécifiques (ou exemplaires) qu’ils ont rencontrés dans le passé, plutôt que par rapport à un prototype moyen ou idéal de chaque catégorie.
Théories de la reconnaissance des objets
quest ce que la General Recognition Theory (qui?)
par greg Ashby (1986)
● Se veut une extension multidimensionnelle de la SDT. (signal detection theory, miss, hit, etc)
● Considère la reconnaissance d’objets comme un processus de décision probabiliste.
avec des axes qui représentent des caract différentes
General Recognition Theory
donne un exemple de cette théorie
- on représente différent stimulus
- axe d’expression faciale et axe de genre, on voit la probabilité à répondre en fonction de ces axes
General Recognition Theory
quest ce que l’indépendance perceptuelle
lorsque la distribution ne covarie pas en fonction des axes (donc pas de corrélation entre les deux)
vs : dépendance perceptuelle : corrélation entre les 2 variables (axes)
ex : participant répond triste plus souvent si le stimulus est un homme
L’indépendance perceptuelle indique s’il existe une corrélation entre deux catégories perceptuelles. S’il n’existe aucune corrélation entre les deux catégories (la perception de l’émotion ne dépend pas de la perception du genre), les deux catégories sont perceptuellement indépendantes. Si on remarque une tendance, par exemple à dire que les visages perçus comme féminins ont l’air plus heureux, les catégories sont corrélées ensemble et on a un échec de l’indépendance perceptuelle.
General Recognition Theory
quets ce que la séparabilité perceptuelle
signifie de pouvoir séparer le stimulus représenté en bleu par lui en orange sur la dimension du genre (et non expression) - » the perception of happiness is not affected by a change in gender.
vs on peut pas séparer les deux stimulus -» The male face is perceived as more “happy” than the female face.
La séparabilité perceptuelle s’intéresse à comparer deux stimuli (ou plus) ensemble. Des participants ont vu ces visages et ont dû identifier le genre et l’émotion. Ces réponses, pour chaque visage, se distribuent normalement. Si les distributions pour différents stimuli se chevauchent, on a de la séparabilité perceptuelle. Donc, dans notre exemple, quand les courbes normales sur l’axe heureux/triste se chevauchent, cela veut dire que la perception de la joie sur un visage n’est pas influencée par la perception du genre, le visage d’homme et le visage de femme ont été perçus avec le même niveau de joie. Si, au contraire, ces distributions ne se chevauchent pas, cela nous indique que le visage masculin a été perçu comme plus heureux. Encore une fois ici, on compare deux visages.
General Recognition Theory
quest ce que la separabilité décisionnelle
division linéaire donc implique pas d’interaction entre l’expression faciale et le genre
vs ; échec de separation decisionnelle donc interaction, participant serait biaisée de reondre + happy si femme
La séparabilité décisionnelle, c’est le critère de la TDS, c’est donc une façon de distinguer si un participant a un biais perceptuel. Donc, quand la droite est verticale et à 90 degrés de l’axe des X, la séparabilité décisionnelle, où le participant n’a PAS de biais, la sensibilité à l’émotion n’est pas affectée par le genre. Si la droite a un angle différent de 90 degrés, alors on a un échec de la séparabilité décisionnelle. Le participant a tendance à dire que les visages féminins sont plus heureux que ceux masculins.
Théories de la reconnaissance des objets
quest ce que la Théorie de reconnaissance par composants
● Le modèle de reconnaissance d’objets de Biederman: soutient que les objets sont reconnus par les identités et les relations de leurs composants.
● Géons : Les « ions géométriques » à partir desquels les objets sont construits.
Modèles computationnels de reconnaissance des objets
explique le Réseau neuronal profond (DNN)
● Réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets.
● De nombreuses instances d’un objet sont montrées au réseau, avec du feedback
● Au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé. (en faisant des hypothèses et inspiré par les connaissances du cerveau humain) (permet tolérance et généralisation et donc peut étiquetter)
explique comment fonctionne le Réseau neuronal profond (DNN)
à chaque couche, fait une moyenne de l’info locale de la région, de + en + on représente des propriétés abstraites et ainsi minimise les erreur.
chaque connections a des poids différents, plus le reseau est entrainé, plus les poids sont bine ajusté, et les erreurs seront moindres
si erreurs, optimisation, on va ajuster les poids des différents neurones (connections)
Réseau neuronal profond (DNN)
quelles sont les resultats de recherche en lien avec le Réseau neuronal profond (DNN) (3)
- contrairement aux modèles bio-inspirés précédents, les derniers DNN rivalisent avec les performances de représentation du cortex IT (chez le singe) sur une tâche de reconnaissance visuelle d’objets.
- Les représentations d’un modèle DNN de reconnaissance d’objet “expliquent” les représentations mesurées dans IT avec l’IRMf.
- En utilisant un DNN pour modéliser les propriétés visuelles du stimulus, les auteurs montrent que les propriétés de niveau intermédiaire et de haut niveau des images peuvent prédire la conscience visuelle, et peuvent fournir une explication mécanistique du phénomène du clignement attentionnel.
Théories de la reconnaissance des objets
quest ce que La théorie des cellules grand-mère
● Un seul neurone pourrait-il être responsable de la reconnaissance de votre grand-mère ?
● Initialement une anecdote lancée par Jerry Lettvin au MIT en 1969.
● Contribue au débat “localisé” vs. “distribué” que nous aborderons plus tard.
Une cellule pour Jennifer Anniston?
Plusieurs études furent publiées dans les années 2000, suggérant certaines évidences pour les cellules Grand-Mère.
par chance, ils ont remarqué que un neurone répondait seulement à des photos de jennifer anniston (étude de Quiroga)
est ce que cest possible qu’on ait des neurones grand-mère
NON, pcq on a pas assez de neurones pour tous les trucs qu’on a déjà vu
la majorité des neurones dans le cerveau se trouve où
80% des neurones de notre cerveau se trouve dans le cervelet
Une approche intégrant les théories
explique cette approche (la technique d’abord)
avec un classifieur, ils vont montrer des objets (certains animés d’autres non)
le classifieur a une frontière décisionnelle qui divise les objet animé de ceux ne l’étant pas (peu animé à bcp, et peu inanimé à bcp)