cours 6 - percevoir et reconnaitre les objets Flashcards

1
Q

la neuroscience cognitive et computationnelle veut répondre à quelles questions concernant la reconnaissance des objets (3)

A

● D’un point de vue psychophysique, quelles sont les propriétées de l’image qui caractérisent les objets?
● Comment est-ce que le cerveau traite l’information visuelle pour reconnaître et catégoriser les objets?
● Comment est-ce que ces principes peuvent inspirer et informer les technologies modernes de reconnaissance d’objets.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quelle est l’importance de la reconnaissance des objets (3)

A
  1. La capacité à reconnaître et à catégoriser les objets est fondamentale pour la survie et l’interaction avec notre environnement.
  2. Elle nous permet de naviguer dans notre monde, de reconnaître les dangers, de trouver de la nourriture, et contribue grandement aux interactions sociales.
  3. Dans le contexte technologique, en reproduisant ces capacités, nous pouvons créer des systèmes qui améliorent notre sécurité, notre santé, et notre bien- être, en prenant en charge des tâches allant de la conduite autonome à la détection précoce de maladies dans des images médicales.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

quels sont les défis dans la création de systèmes de reconnaissance d’objets efficaces qui reflètent les complexités du traitement visuel dans le cerveau: (3) et ces défis exigent quoi (2)

A

○ la variabilité des objets
○ leur contexte
○ les conditions d’éclairage

exige des systèmes capables d’abstraction et de généralisation à partir d’exemples limités, similaire à la capacité humaine d’apprendre et de reconnaître des objets nouveaux ou peu familiers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

quel est le problème de la reconnaissance des objets

A

on est tolérant aux différents exemplaires du mm objets, on les étiquette tous comme représentant un éléphant mm si différence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

explique les éléments locaux et globaux avec l’éléphant

A

comparaison avec personnes aveugles qui toucheraient chaque partie de l’éléphant avec notre systeme visuel. on ne voit qu’une partie de l’image pour chaque champ récepteur -» comment on assemble les infos pour voir l’éléphants. comment à partir d’éléments locaux (les parties de l’éléphants) pour percevoir un élément global (l’éléphant)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Théories de la reconnaissance des objets

est ce que il y a une théorie plus dominante que les autres

A

NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Théories de la reconnaissance des objets

quest ce que la théorie des templates (gabarits)

A

La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même “forme” dans le cerveau.

La forme de l’objet, ici pas invariance et pas tolérance à diff formes, il faudrait bcp de gabarits pour les diff pt de vue et version

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Théories de la reconnaissance des objets

quest ce que la théorie des prototypes (qui?) et quoi

A

par eleanor Rosch en 1970

Prototype: un membre “typique” ou “moyen” d’une catégorie, possédant les caractéristiques les plus représentatives de cette catégorie
- Les individus classent plus rapidement et plus facilement des objets comme appartenant à une catégorie s’ils sont proches du prototype de cette catégorie.
- Par exemple, dans la catégorie des oiseaux, un robin est souvent considéré comme un exemple plus typique (ou prototypique) que, disons, un pingouin.

grande influence dans sciences cognitives : auditive, visuelle et linguistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Théories de la reconnaissance des objets

quest ce que la théorie des exemplaires (qui?)

A

par robert Nosofsky (1980)

Les individus classent des objets et des événements en se basant sur la comparaison avec des exemples spécifiques (ou exemplaires) qu’ils ont rencontrés dans le passé, plutôt que par rapport à un prototype moyen ou idéal de chaque catégorie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Théories de la reconnaissance des objets

quest ce que la General Recognition Theory (qui?)

A

par greg Ashby (1986)

● Se veut une extension multidimensionnelle de la SDT. (signal detection theory, miss, hit, etc)
● Considère la reconnaissance d’objets comme un processus de décision probabiliste.

avec des axes qui représentent des caract différentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

General Recognition Theory

donne un exemple de cette théorie

A
  1. on représente différent stimulus
  2. axe d’expression faciale et axe de genre, on voit la probabilité à répondre en fonction de ces axes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

General Recognition Theory

quest ce que l’indépendance perceptuelle

A

lorsque la distribution ne covarie pas en fonction des axes (donc pas de corrélation entre les deux)

vs : dépendance perceptuelle : corrélation entre les 2 variables (axes)
ex : participant répond triste plus souvent si le stimulus est un homme

L’indépendance perceptuelle indique s’il existe une corrélation entre deux catégories perceptuelles. S’il n’existe aucune corrélation entre les deux catégories (la perception de l’émotion ne dépend pas de la perception du genre), les deux catégories sont perceptuellement indépendantes. Si on remarque une tendance, par exemple à dire que les visages perçus comme féminins ont l’air plus heureux, les catégories sont corrélées ensemble et on a un échec de l’indépendance perceptuelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

General Recognition Theory

quets ce que la séparabilité perceptuelle

A

signifie de pouvoir séparer le stimulus représenté en bleu par lui en orange sur la dimension du genre (et non expression) - » the perception of happiness is not affected by a change in gender.

vs on peut pas séparer les deux stimulus -» The male face is perceived as more “happy” than the female face.

La séparabilité perceptuelle s’intéresse à comparer deux stimuli (ou plus) ensemble. Des participants ont vu ces visages et ont dû identifier le genre et l’émotion. Ces réponses, pour chaque visage, se distribuent normalement. Si les distributions pour différents stimuli se chevauchent, on a de la séparabilité perceptuelle. Donc, dans notre exemple, quand les courbes normales sur l’axe heureux/triste se chevauchent, cela veut dire que la perception de la joie sur un visage n’est pas influencée par la perception du genre, le visage d’homme et le visage de femme ont été perçus avec le même niveau de joie. Si, au contraire, ces distributions ne se chevauchent pas, cela nous indique que le visage masculin a été perçu comme plus heureux. Encore une fois ici, on compare deux visages.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

General Recognition Theory

quest ce que la separabilité décisionnelle

A

division linéaire donc implique pas d’interaction entre l’expression faciale et le genre

vs ; échec de separation decisionnelle donc interaction, participant serait biaisée de reondre + happy si femme

La séparabilité décisionnelle, c’est le critère de la TDS, c’est donc une façon de distinguer si un participant a un biais perceptuel. Donc, quand la droite est verticale et à 90 degrés de l’axe des X, la séparabilité décisionnelle, où le participant n’a PAS de biais, la sensibilité à l’émotion n’est pas affectée par le genre. Si la droite a un angle différent de 90 degrés, alors on a un échec de la séparabilité décisionnelle. Le participant a tendance à dire que les visages féminins sont plus heureux que ceux masculins.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Théories de la reconnaissance des objets

quest ce que la Théorie de reconnaissance par composants

A

● Le modèle de reconnaissance d’objets de Biederman: soutient que les objets sont reconnus par les identités et les relations de leurs composants.
● Géons : Les « ions géométriques » à partir desquels les objets sont construits.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Modèles computationnels de reconnaissance des objets

explique le Réseau neuronal profond (DNN)

A

● Réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets.
● De nombreuses instances d’un objet sont montrées au réseau, avec du feedback
● Au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé. (en faisant des hypothèses et inspiré par les connaissances du cerveau humain) (permet tolérance et généralisation et donc peut étiquetter)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

explique comment fonctionne le Réseau neuronal profond (DNN)

A

à chaque couche, fait une moyenne de l’info locale de la région, de + en + on représente des propriétés abstraites et ainsi minimise les erreur.
chaque connections a des poids différents, plus le reseau est entrainé, plus les poids sont bine ajusté, et les erreurs seront moindres
si erreurs, optimisation, on va ajuster les poids des différents neurones (connections)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Réseau neuronal profond (DNN)

quelles sont les resultats de recherche en lien avec le Réseau neuronal profond (DNN) (3)

A
  1. contrairement aux modèles bio-inspirés précédents, les derniers DNN rivalisent avec les performances de représentation du cortex IT (chez le singe) sur une tâche de reconnaissance visuelle d’objets.
  2. Les représentations d’un modèle DNN de reconnaissance d’objet “expliquent” les représentations mesurées dans IT avec l’IRMf.
  3. En utilisant un DNN pour modéliser les propriétés visuelles du stimulus, les auteurs montrent que les propriétés de niveau intermédiaire et de haut niveau des images peuvent prédire la conscience visuelle, et peuvent fournir une explication mécanistique du phénomène du clignement attentionnel.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Théories de la reconnaissance des objets

quest ce que La théorie des cellules grand-mère

A

● Un seul neurone pourrait-il être responsable de la reconnaissance de votre grand-mère ?
● Initialement une anecdote lancée par Jerry Lettvin au MIT en 1969.
● Contribue au débat “localisé” vs. “distribué” que nous aborderons plus tard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Une cellule pour Jennifer Anniston?

Plusieurs études furent publiées dans les années 2000, suggérant certaines évidences pour les cellules Grand-Mère.

A

par chance, ils ont remarqué que un neurone répondait seulement à des photos de jennifer anniston (étude de Quiroga)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

est ce que cest possible qu’on ait des neurones grand-mère

A

NON, pcq on a pas assez de neurones pour tous les trucs qu’on a déjà vu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

la majorité des neurones dans le cerveau se trouve où

A

80% des neurones de notre cerveau se trouve dans le cervelet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Une approche intégrant les théories

explique cette approche (la technique d’abord)

A

avec un classifieur, ils vont montrer des objets (certains animés d’autres non)

le classifieur a une frontière décisionnelle qui divise les objet animé de ceux ne l’étant pas (peu animé à bcp, et peu inanimé à bcp)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Une approche intégrant les théories

explique ce qu’il étudie et leur résultats

A

étudie le temps de réaction en fonction de la distance de la frontièrw décisionnelle

résultat : + loin + temps reaction rapide, + proche + ambigu, donc temps reaction + lent

25
Q

● Intégration de l’information pour construire les objets

comment on reconnait les objets (2)

A

*Cellules ganglionnaires rétiniennes et LGN = Tâches
*Cortex visuel primaire = Barres

26
Q

Comment les tâches et les barres deviennent-elles des objets et des surfaces ?

A

au dela de V1, cest ++ sophistiqué

ex : « boundary ownership ». Pour une frontière donnée, quel côté fait partie de l’objet et quel côté fait partie de l’arrière-plan ?

27
Q

Bordures et champs récepteurs

explique ce quest pas capable v1 de faire, mais v2 oui

A

v1 : pas capable de différencier de quel côté d la bordure se trouve la figure

v2 : capable de différencier le bord du carré noir appartient au carré noir

28
Q

La vision de niveau intermédiaire (mid-level)

cest quoi et ca implique quoi? (2)

A

une étape vaguement définie du traitement visuel qui intervient après que les caractéristiques de base ont été extraites de l’image (vision de bas niveau) et avant la reconnaissance d’objet et la compréhension de la scène (vision de haut niveau).

● Implique la perception des bords et des surfaces
● Détermine quelles régions d’une image doivent être regroupées en objets

29
Q

La vision de niveau intermédiaire (mid-level)

comment on trouve les bords

A

Les cellules du cortex visuel primaire ont de petits champs récepteurs.

mais … on pourrait pas reconnaitre quel bord va ensemble vs non à cause des petits champ récepteur, mais par contre on est quand mm capable … mmm pourquoi

mm les ordis ne sont pas capables..

30
Q

Les contours illusoires

cest quoi

A

Un contour qui est perçu même si rien ne change d’un côté du contour à l’autre.

tres facile pour humain, pas pour ordi

31
Q

comment le cerveau fait pour les Les contours illusoires

A

le systeme visuel complete les vides et fait hypothèse qu’on est en présene d’une figure

32
Q

quelle théorie explique potentiellement les contours illusoires et explique

A

la théorie de la gestalt

“Le tout est plus grand que la somme de ses parties.”
● Opposé à d’autres écoles de pensée, comme le structuralisme (théorie des géons), qui mettent l’accent sur les éléments de base de la perception.

33
Q

La théorie de la Gestalt

quelles sont les Règles de regroupement Gestalt :

A

● un ensemble de règles qui décrivent quand les éléments d’une image apparaîtront comme s’ils étaient regroupés.

34
Q

La théorie de la Gestalt

quest ce que la règle de la Bonne continuation :

A

● Une règle de regroupement de la Gestalt indiquant que deux éléments auront tendance à se regrouper s’ils se trouvent sur le même contour.

mais n’explique pas tout, si on a contexte

35
Q

La vision de niveau intermédiaire

quest ce que la Segmentation et regroupement des textures:

A

● Segmentation de texture : découpage d’une image en régions de propriétés de texture communes.
● Le regroupement des textures dépend des statistiques des textures dans une région par rapport à une autre.

36
Q

quest ce que la similarité et la proximité dans les Règles de regroupement de la Gestalt

A

● Similarité : les éléments similaires ont tendance à se regrouper.
● Proximité : les objets proches les uns des autres ont tendance à se regrouper.

mais fonctionne pas tout le temps, des fois ++ difficiles de regrouper ensemble si il y a une forte opposition entre similarité et proximité

37
Q

vision de niveau intermédiaire, Segmentation et regroupement des texture

quest ce que le parallélisme et la symétrie

A

*Parallélisme : les contours parallèles appartiennent probablement au même groupe.
*Symétrie : les régions symétriques sont plus susceptibles d’être considérées comme un groupe.

38
Q

vision de niveau intermédiaire

Segmentation et regroupement des textures

quets ce que la région commune et la connectivité

A

● Région commune : les éléments sont regroupés s’ils semblent appartenir à la même région plus grande.
● Connectivité : les éléments auront tendance à se regrouper s’ils sont connectés.

39
Q

La vision de niveau intermédiaire

quets ce que le camouflage

A

● Les animaux exploitent les principes de groupement de la Gestalt pour se regrouper dans leur environnement.
● Parfois, le camouflage est utilisé pour confondre l’observateur.

40
Q

Les comités de la Gestalt

cest quoi cette métaphore

A

● Une métaphore du fonctionnement de la perception
○ Les comités doivent intégrer les avis contradictoires et parvenir à un consensus.
○ De nombreux principes différents et parfois concurrents sont impliqués dans la perception.
● La perception résulte du consensus qui se dégage.

ex :

41
Q

Les comités de la Gestalt

quelles sont les règles du comités de la gestalt (1)

A

respectez la physique et évitez les accidents!
Figure ambiguë : un stimulus visuel qui donne lieu à deux ou plusieurs interprétations de son identité ou de sa structure.
● Les comités perceptifs ont tendance à obéir aux lois de la physique.

42
Q

Les comités de la Gestalt

quelles sont les regles du comité

A

respectez la physique et évitez les accidents! (suite)
Point de vue accidentel : une position de visualisation qui produit une certaine régularité dans l’image visuelle qui n’est pas présente dans le monde.
● Les comités de perception supposent que les points de vue ne sont pas accidentels.

43
Q

quets ce que la discrimination figure-fond et les principes de discrimination figure-fond de la Gestalt: (5)

A

Déterminer quelle partie de l’environnement est la figure de sorte que celle-ci ressort du fond

principes :
● Entourage : les zones qui peuvent être considérées comme entourées par d’autres ont tendance à être considérées comme des figures
● Taille : La plus petite région est susceptible d’être la figure.
● Symétrie: Une région symétrique a tendance à être considérée comme une figure.
● Parallélisme : les régions aux contours parallèles ont tendance à être considérées comme des figures.
● Mouvement relatif : si une région se déplace devant une autre, la région la plus proche est représentée.

44
Q

quelles sont les caract non accidentelles (3)

A

Caractéristique non accidentelle : caractéristique d’un objet qui ne dépend pas de la position de visualisation exacte (ou accidentelle) de l’observateur.
● Jonctions en T : indiquent l’occlusion. Le haut du T est devant et la tige du T est derrière.
● Jonctions en Y : indiquent les coins faisant face à l’observateur.
● Jonctions fléchées : indiquent les coins opposés à l’observateur.

45
Q

quest ce que l’effet de supériorité globale

A

Effet de supériorité globale : les propriétés globales de l’objet (entier) priment sur les propriétés locales (des parties) de l’objet.

46
Q

Résumé de la vision de niveau intermédiaire

Cinq principes de la vision intermédiaire :

A
  1. Rassemblez ce qui devrait être réuni
  2. Divisez en deux ce qui devrait être divisé en deux
  3. Utilisez ce que vous savez
  4. Évitez les accidents
  5. Rechercher le consensus et éviter l’ambiguïté
47
Q

Bases neuronales de la reconnaissance des objets

L’imagerie fonctionnelle peut nous aider à identifier les régions du cerveau qui répondent le mieux à certains stimuli.
quelle est la Méthode de soustraction (classique):

A

comparaison de l’activité cérébrale mesurée dans deux conditions. La différence entre les images peut montrer les régions cérébrales spécifiquement activées par ce processus mental.

48
Q

Bases neuronales de la reconnaissance d’objetsBases neuronales de la rec

L’imagerie fonctionnelle peut nous aider à identifier les régions du cerveau qui répondent le mieux à certains stimuli.
quelle est la Méthode de décodage :

A

Prenez des scans IRMf d’un participant regardant de nombreuses images de différentes catégories connues. Entraînez un modèle informatique pour reconnaître l’activité cérébrale de chaque catégorie. Testez ensuite le modèle informatique pour voir s’il peut identifier une image non entraînée en fonction de ce qu’il a appris.

49
Q

Bases neuronales de la reconnaissance d’objets

quest ce que la théorie des voies ventrales et dorsales.

A

● Après le cortex extrastrié, le traitement des informations sur les objets est divisé en une voie « quoi » et une voie « où ».
○ La voie “Où” (en anglais “Where”) concerne les emplacements et les formes des objets, mais pas leurs noms ou leurs fonctions.
○ La voie “Quoi” (en anglais “What”) concerne les noms (identité) et les fonctions des objets, quel que soit leur emplacement.

50
Q

montre un schéma du syst. visuel du singe

A

épaisseur des lignes = nbr de fibres nerveuses

connexions neuronales qui vont dans les deux sens

donc tres complexe

51
Q

explique comment se fait le traitement dans cortex

A

En passant de V1 à IT dans la voie “quoi”, les neurones répondent à des stimuli de plus en plus complexes.
Au niveau de V4, les cellules s’intéressent aux stimuli tels que les fans, les spirales et les moulinets.
- Il est difficile de savoir exactement ce que les neurones V4 aiment, mais c’est quelque chose de plus compliqué que des taches ou des barres lumineuses.

on sait que v4 répond a spirales et truc du genre ++ fortement (jaune + forte, bleu - forte)

52
Q

nomme les parties du cerveau qui répond spécifiquement à des objets particuliers

A
53
Q

explique le débat entre local ou distribué

A

● Le débat entre les théories localistes et distribuées concerne la manière dont le cerveau traite les informations visuelles.
● Nancy Kanwisher et d’autres ont identifié des régions cérébrales spécifiques, comme la FFA (Fusiform Face Area), spécialisées dans la reconnaissance de visages, soutenant une perspective localiste.
● James Haxby et ses collègues proposent un modèle distribué, où l’information est traitée par des réseaux de régions cérébrales interconnectées, comme hIT (human Inferior Temporal cortex), impliquées dans la reconnaissance d’objets de manière plus générale.
● Un débat similaire remet en question la séparation spécifique des voies dorsales et ventrales (what and where).

54
Q

quelles sont les propriétés du cortex inférotemporal (hIT) (3)

A

● Très grands - certains couvrent la moitié du champ visuel
● Ne répondent pas bien aux taches ou aux lignes
● Répondent bien aux stimuli tels que les mains, les visages ou les objets

55
Q

quest ce que le cortex inférotemporal (IT) et que ce passe -t-il si lésion

A

partie du cortex cérébral dans la partie inférieure du lobe temporal, importante pour la reconnaissance des objets.
● Une partie de la voie « quoi »

lésion crée agnosie : Incapacité à reconnaître les objets malgré la capacité de les voir.

56
Q

quel est le temps pour la reconnaissance des objets

A

● Des études indiquent que la reconnaissance d’objets se produit en aussi peu que 150 ms.
● C’est un laps de temps si court qu’il ne peut pas y avoir beaucoup de rétroaction des zones cérébrales ultérieures.
● Processus “feed-forward” (ascendant) : un processus qui effectue un calcul (par exemple, la reconnaissance d’objets) une étape neuronale après l’autre, sans avoir besoin de rétroaction d’une étape ultérieure à une étape antérieure.

57
Q

Retour au pseudo-paradoxe de la perception

Si le monde est tel que nous le percevons, le cerveau est tel que nous le percevons; mais …

A

Or 50% de la lumière visible ambiante traverse le médium oculaire * 20% traverse les cellules de la rétine * moins de 1% de l’information dans les récepteurs rétiniens sort des cellules ganglionnaires * 40% de l’information qui arrive dans le LGN le quitte pour V1 = moins de 0,04% de l’information dans la lumière visible parvient au cortex extrastrié;

  • Donc le monde n’est pas tel que nous le percevons.
58
Q

quelle est la Solution au pseudo-paradoxe de la perception + ex

A

Le monde est dans une large mesure à l’intérieur de notre cerveau (traitement de l’information : Helmholtz, Gregory, Marr, Rock, Hochberg, Palmer; Gestalt : Wertheimer, Koffka, Kohler)

ce sont les consensus de nos comités qui forme le monde

ex :
● Deux segments partageant un coin sur l’image rétinienne partagent vraisemblablement un coin dans le monde (élimine la possibilité rouge).
● Les objets ont tendance à être symétriques (élimine la possibilité verte).

le monde est tel que nous le percevons, mais le monde est différent pour tous