cours 6 Flashcards by Christine Alkhouri

La capacité à reconnaître et à catégoriser les objets est fondamentale pour la survie et l’interaction avec notre environnement.

Elle nous permet de naviguer dans notre monde, de reconnaître les dangers, de trouver de la nourriture, et contribue grandement aux interactions sociales.

Dans le contexte technologique, en reproduisant ces capacités, nous pouvons créer des systèmes qui améliorent notre sécurité, notre santé, et notre bien-être, en prenant en charge des tâches allant de la conduite autonome à la détection précoce de maladies dans des images médicales.

vrai

How well did you know this?

Not at all

Perfectly

Les défis dans la création de systèmes de reconnaissance d’objets efficaces reflètent les complexités du traitement visuel dans le cerveau:
-la variabilité des objets
- leur contexte
- les conditions d’éclairage

Ceci exige des systèmes capables d’abstraction et de généralisation à partir d’exemples limités, similaire à la capacité humaine d’apprendre et de reconnaître des objets nouveaux ou peu familiers

vrai

How well did you know this?

Not at all

Perfectly

Le problème de la reconnaissance d’objet

Les images n’étaient qu’un tas de pixels sur un écran, mais dans chaque cas, vous perceviez un éléphant.

Comment avez-vous reconnu les quatre images représentant un éléphant ?

Comment votre système visuel passe-t-il des points lumineux, comme les pixels, à des entités entières dans le monde, comme les éléphants ?

How well did you know this?

Not at all

Perfectly

Théories de la reconnaissance des objets

Qu’est ce que la Théorie des templates? (gabari)

La proposition selon laquelle le système visuel reconnaît les objets en faisant correspondre la représentation neuronale de l’image avec une représentation interne de la même “forme” dans le cerveau

How well did you know this?

Not at all

Perfectly

Théories de la reconnaissance des objets

Qu’est ce que la Théorie des prototypes? (Rosch)

Prototype: un membre “typique” ou “moyen” d’une catégorie, possédant les caractéristiques les plus représentatives de cette catégorie.

donc, Les individus classent + rapidement et plus facilement des objets comme appartenant à une catégorie s’ils sont proches du prototype de cette catégorie.

ex: dans la catégorie des oiseaux, un robin est souvent considéré comme un exemple plus typique (ou prototypique) que, disons, un pingouin

How well did you know this?

Not at all

Perfectly

vrai ou faux,
théorie des gabaris = une collection de formes
théorie prototype = une moyenne de catégories, on prend tt les éléments d’une catego et on fait une moyenne pr ensuite comparer objet a cette moyenne la

vrai

How well did you know this?

Not at all

Perfectly

Théories de la reconnaissance des objets

Qu’est ce que la Théorie des exemplaires? (Nosofsky)

Les individus classent des objets et des événements en se basant sur la comparaison avec des exemples spécifiques (ou exemplaires) qu’ils ont rencontrés dans le passé, plutôt que par rapport à un prototype moyen ou idéal de chaque catégorie.

donc, l’élément le plus similaire a cet objet, well on l’attribue a cette catégorie la

How well did you know this?

Not at all

Perfectly

Théories de la reconnaissance des objets

Qu’est ce que la Théorie de la reconnaissance généralisé? (Ashby)

une extension multidimensionnelle de la SDT (Multidimensionnel = ex un bhay en 3d, axe en x, y et z, et sur chaque axe on a une caract specifique ex l’orientation, et sur une autre dimension une autres caract etc. on px avoir un paquet de dimension comme sa qui encode d’autre qualité plus complexe de l’image comme ex les expression faciales ou autre)
Considère la reconnaissance d’objets comme un processus de décision probabiliste
on a plusieurs exemplaire dans notre esprit then on calcule une certaine probabilité pr prendre une décision sur la catégorie d’un objet

indépendance perceptuel: ex covarie pas avk le genre et l’expression, pas de corrélation, donc indépendance perceptuelle entre les 2 dimensions

si oui, YA une corrélation entre les 2, pas de indépendance perceptuel

Separabilité perceptuelle = 2 ou plusieurs item, on px tu séparer perpétuellement les stimulus, si c non c que y’a pas de relation linéaire entre le genre et les expression faciale (dans l’ex on px séparer le stimulus bleu du stimulus rouge sur la dimension du genre mais pas de l’expression = a gauche
(s’intéresse à la relation entre 2 stimuli. Donc vx savoir si la combinaison unique de l’expression faciale du bonheur sur un visage masculin et féminin influence la perception du bonheur. Si non, si les 2 distributions de réponses de perception de l’émotion se chevauchent, on a la séparabilité perceptuelle pour ces deux stimuli. Ici on regarde le changement sur l’axe des X en gardant les valeurs sur l’axe des Y fixes. On veut savoir si un changement de perception de genre influence la perception du bonheur)

Separabilité decisionnelle = 2 type de division de l’espace perceptuel, si distribution tombe dans une des région, on aura une réponse, et dans l’autre, une autre réponse
ex: Si atterit dans:
zone de gauche = heureux
Zone de droite = triste
A gauche : Division linéaire entre heureux et triste et comme c parallèle a l’axe du genre, sa implique pas d’interaction entre genre et expression, donc oui s.d.
Lui en diagonal (a droite) : échec de s.d pcq au fur et à mesure qu’une des dimensions augmente, l’autre aussi, donc pas de s.d
(ici plutôt au niveau du participant ou de la participante. On vx décrire la tendance ou la façon qu’une personne sépare la perception du genre et de l’émotion positive ou négative. C’est le critère en théorie de détection du signal. On vx donc savoir si le participant a un biais pour un genre, ex en ayant plus tendance à dire que les visages féminins sont heureux que ceux des hommes)

VOIR PIC

How well did you know this?

Not at all

Perfectly

qu’est ce que la Théorie de la reconnaissance par composants?

Le modèle de reconnaissance d’objets de Biederman: soutient que les objets sont reconnus par les identités et les relations de leurs composants.
Géons : Les « ions géométriques » à partir desquels les objets sont construits

How well did you know this?

Not at all

Perfectly

Qu’est ce qu’un Réseau neuronal profond (DNN)?

Réseaux de neurones à plusieurs niveaux pouvant être entraînés à reconnaître des objets
De nombreuses instances d’un objet sont montrées au réseau, avec du feedback
au fil du temps, le réseau peut reconnaître de nouvelles instances de l’objet sur lesquelles il n’a jamais été entrainé.
A force de répéter entrainement, le modèle arrive a reconnaitre nouvelle image (couche après couche)

How well did you know this?

Not at all

Perfectly

En utilisant un réseau neuronal profond (DNN) pour modéliser les propriétés visuelles du stimulus, les auteurs montrent que les propriétés de niveau intermédiaire et de haut niveau des images peuvent prédire la conscience visuelle, et peuvent fournir une explication mécanistique du phénomène du clignement attentionnel.

vrai

How well did you know this?

Not at all

Perfectly

La théorie de la cellule grand-mère

Qu’est ce qu’une cellule grand-mère?

On px tu avoir un neurone qui px reconnaitre notre grand mère?
Yarrive quoi si un neurone meurt? Tu reconnais pu le concept?? Prob pas
certaine étude suggère que oui : Découvre cellule qui repondais tjr a jennifer anniston tjrr peu importe position mais pas a brad pitt
then Sont tomber par chance sur neurone qui répondent a certaine propriété spécifique mais pas neurone grand-mère

How well did you know this?

Not at all

Perfectly

vrai ou faux, pr distinguer 2 objets et savoir si animé ou inanimé, on fait plus d’erreur quand l’objet est proche de la frontière décisionnelle!! c plus long avant d’attribué la bonne catégorie

vrai

How well did you know this?

Not at all

Perfectly

vrai ou faux, Les champs récepteurs des cellules extrastriées sont plus sophistiqués que ceux du cortex strié. Ils répondent à des propriétés visuelles importantes pour la perception des objets. Par exemple, « boundary ownership ». Pour une frontière donnée, quel côté fait partie de l’objet et quel côté fait partie de l’arrière-plan ? De toute évidence, notre cerveau fait quelque chose d’assez sophistiqué au-delà de V1.

vrai

How well did you know this?

Not at all

Perfectly

cela-dit, qu’est ce que la vision de niveau intermédiaire?

une étape vaguement définie du traitement visuel qui intervient après que les caractéristiques de base ont été extraites de l’image (vision de bas niveau) et avant la reconnaissance d’objet et la compréhension de la scène (vision de haut niveau)
Implique la perception des bords et des surfaces
Détermine quelles régions d’une image doivent être regroupées en objets (kess qui appartient ensemble)
Comment trouvez-vous les bords des objets?
Les cellules du cortex visuel primaire ont de petits champs récepteurs.

(Ces récepteur permettent pas de savoir quels bords vont ensemble et lesquels ne vont pas ensemble)

How well did you know this?

Not at all

Perfectly

vrai ou faux, Les détecteurs de bord informatisés ne sont pas aussi performants que les humains. Parfois, les ordinateurs ne trouvent pas les bords que les humains voient facilement.

vrai

How well did you know this?

Not at all

Perfectly

Qu’est ce qu’un Contour illusoire?

Un contour qui est perçu même si rien ne change d’un côté du contour à l’autre.
VOIR PIC PACMAN
dans pic, on vois clairement en avant plan un triangle blanc, c notre cerveau qui fait contour illusoire
On percoit cercle plan pck notre syst visuelle rempli les trous , complète les trous vide entre les différentes lignes pr arriver a une hypothese qu’on est en presence d’un cercle

How well did you know this?

Not at all

Perfectly

Qu’est ce que la La théorie de la Gestalt? (“forme” ou “tout”)

Study These Flashcards

“Le tout est plus grand que la somme de ses parties”
- Opposé au structuralisme, met l’accent sur les éléments de base de la perception

Quels sont les règles de regroupement Gestalt?

Study These Flashcards

un ensemble de règles qui décrivent quand les éléments d’une image apparaîtront comme s’ils étaient regroupés.

Règles de regroupement Gestalt

Qu’est ce que la loi de la bonne continuation?

Study These Flashcards

deux éléments auront tendance à se regrouper s’ils se trouvent sur le mm contour
VOIR 2 PIC (Ligne et oiseau)
On crois que 1 est mieux connecter a 4 maisss bec oiseau dans le fond

la vision du niveau intermédiaire

Qu’est ce que la segmentation et le regroupement des textures?

Study These Flashcards

Segmentation de texture: découpage d’une image en régions de propriétés de texture communes.

Le regroupement des textures dépend des statistiques des textures dans une région par rapport à une autre

voirpic pr un exemple de segmentation clair de 2 textures différentes

Règles de regroupement de la Gestalt

Qu’est ce que la loi de / règle de similarité?

Study These Flashcards

les éléments similaires ont tendance à se regrouper.
voir pic

Règles de regroupement de la Gestalt

Qu’est ce que la loi de / règle de proximité?

Study These Flashcards

les objets proches les uns des autres ont tendance à se regrouper
voir pic

Segmentation et regroupement des textures

Qu’est ce que le parallélisme et la symétrie?

Study These Flashcards

Parallélisme: les contours parallèles appartiennent probablement au même groupe.
Symétrie: les régions symétriques sont plus susceptibles d’être considérées comme un groupe.

Segmentation et regroupement des textures Qu'est ce qu'une **région commune et la connectivité?**

**Région commune:** les éléments sont regroupés s'ils semblent appartenir à la mm région plus grande **Connectivité:** les éléments auront tendance à se regrouper s'ils sont connectés VOIR PIC PR NUANCE: - Ligne 1 se regroupe par pair de 2 selon la regle de proximité - Ligne 2, well regroupement par region commune, et c plus fort que groupement par proximité so lemporte - Ligne 3 va se regrouper pr les mm pair que ligne 2 par la règle de connectivité, qui est plus fort que le groupement par proximité once again

Qu'est ce que le **camouflage?**

- Les animaux exploitent les principes de groupement de la Gestalt pour se regrouper dans leur environnement - Parfois, le camouflage est utilisé pour confondre l'observateur

Les comités de la Gestalt Que veut dire **l'ambiguïté et « comités » perceptifs?**

→ Une métaphore du fonctionnement de la perception - Les comités doivent intégrer les avis contradictoires et parvenir à un consensus. (since les règle Gestalt Tt regroupe pas l’ensemble des bhay perceptif que l’humain possède) - De nombreux principes différents et parfois concurrents sont impliqués dans la perception → La perception résulte du consensus qui se dégage.

Règles du comité : respectez la physique et évitez les accidents! Qu'est ce qu'une **figure ambiguë?**

- un stimulus visuel qui donne lieu à deux ou plusieurs interprétations de son identité ou de sa structure - Les comités perceptifs ont tendance à obéir aux lois de la physique voir 2 pic!! cube sans ligne, ou sois on vois cube qui sort ou qui rentre dans feuille, lapin ou duck si jtourne image

Règles du comité : respectez la physique et évitez les accidents! Qu'est ce qu'un **Point de vue accidentel?**

- une position de visualisation qui produit une certaine régularité dans l'image visuelle qui n'est pas acc présente dans le monde réel - Les comités de perception supposent que les points de vue ne sont pas accidentels voir pic! ex tour de pise OR dire que y'a pas de POV accidentel vx dire on pense vrm que gens tienne la tour de pise

Quels sont les 5 **principes de discrimination figure-fond de la Gestalt?** (savoir discriminer la figure du fond)

**1) Entourage:** les zones qui peuvent être considérées comme entourées par d'autres ont tendance à être considérées comme des figures **2) Taille:** La plus petite région est susceptible d'être la figure **3) Symétrie:** Une région symétrique a tendance à être considérée comme une figure **4) Parallélisme:** les régions aux contours parallèles ont tendance à être considérées comme des figures **5) Mouvement relatif:** si une région se déplace devant une autre, la région la **plus proche** est représentée

Qu'est ce qu'une **Caractéristique non accidentelle?**

caractéristique d'un objet qui ne dépend pas de la position de visualisation exacte (ou accidentelle) de l'observateur

Quelles sont les 3 types de **jonctions?** (voir pic)

**Jonctions en T:** indiquent l'occlusion. Le haut du T est devant et la tige du T est derrière **Jonctions en Y:** indiquent les coins faisant face à l'observateur **Jonctions fléchées:** indiquent les coins opposés à l'observateur voir pic!! Jonction y = indique les coins qui font face a observateur Jonction T = indique occlusion des 2 objets Fonction fleché = indique profondeur des coins opposés à l'observateur

Parties et ensembles : Qu'est ce que **l'effet de supériorité globale?**

les propriétés globales de l'objet (entier) priment sur les propriétés locales (des parties) de l'objet. - voir pic exemple du gros HCL - Ya des caract non accidentel qu’on apprend mm si c non conscient, qui vont diviser les parties - Majo du temps c’est non accidentels

Résumé de la vision de niveau intermédiaire Quels sont les 5 principes de la vision intermédiaire?

1. Rassemblez ce qui devrait être réuni 2. Divisez en deux ce qui devrait être divisé en deux 3. Utilisez ce que vous savez 4. Évitez les accidents 5. Rechercher le consensus et éviter l'ambiguïté (since oposition entre certaines regle gestalt, sometimes certain gagne et tt, c pr sa que notre syst perceptif change)

Reconnaissance de l’objet: l'imagerie fonctionnelle peut nous aider à identifier les régions du cerveau qui répondent le mieux à certains stimuli. Qu'est ce que la **Méthode de soustraction (classique)?**

comparaison de l'activité cérébrale mesurée dans 2 conditions. La différence entre les images peut montrer les régions cérébrales spécifiquement activées par ce processus mental

Reconnaissance de l’objet: l'imagerie fonctionnelle peut nous aider à identifier les régions du cerveau qui répondent le mieux à certains stimuli. Qu'est ce que la **Méthode de décodage?**

- Prenez des scans IRMf d'un participant regardant de nombreuses images de différentes catégories connues. Entraînez un modèle informatique pour reconnaître l'activité cérébrale de chaque catégorie. Testez ensuite le modèle informatique pour voir s'il peut identifier une image non entraînée en fonction de ce qu'il a appris (certaines régions du cerveau permet de distinguer différent objet) (Certaine region auront bonne perfo pr repérer certaines catégo d’objet which means on separe en effet les différente catego d’objet)

La théorie des voies ventrales et dorsales Après le cortex extrastrié, le traitement des infos sur les objets est divisé en une voie « quoi » et une voie « où ». Explique ces 2 voies

**La voie "Où" (“Where”):** concerne les emplacements et les formes des objets, mais pas leurs noms ou leurs fonctions. **La voie "Quoi" (“What”):** concerne les noms (identité) et les fonctions des objets, quel que soit leur emplacement Dorsale = OU se situe objet Ventral = identité objet QUOI voir pic

En passant **de V1 à IT dans la voie “quoi”**, les neurones répondent à des stimuli de plus en plus complexes. Au niveau de **V4**, les cellules s'intéressent aux stimuli tels que les fans, les spirales et les moulinets. Il est difficile de savoir exactement ce que les neurones V4 aiment, mais c'est quelque chose de plus compliqué que des taches ou des barres lumineuses. (cortex infero-temporal) voir pic bhay rouge et noir : Cellules de V4 px répondre a A) donc truc pointu mais pas B)

vrai

Le cortex inférotemporal (IT) Quelles sont les caractéristiques **champ récepteur des neurones de hIT?**

- **Très grands**: certains couvrent la moitié du champ visuel - Ne répondent pas bien aux taches ou aux lignes - Répondent bien aux stimuli tels que les mains, les visages ou les objets (Répondent pas très bien au détails fins)

Qu'est ce que le le **cortex inférotemporal (IT)?**

-partie du cortex cérébral dans la partie inférieure du lobe temporal, importante pour la reconnaissance des objets -Une partie de la voie « quoi » - On est capable de prédire des réponses comportementales a partir du cortex IT

Lorsque le cortex IT est lésé, cela conduit à des agnosies. Qu'est ce que **l'agnosie?**

Incapacité à reconnaître les objets malgré la capacité de les voir objet = agnosie visage = prosopagnosie couleur = achromatopsie

la reconnaissance d'objets se produit en aussi peu que 150 ms. C'est un laps de temps si court qu'il ne peut pas y avoir bcp de rétroaction des zones cérébrales ultérieures. Qu'est ce que le **Processus “feed-forward”?**

un processus qui effectue un calcul (ex la reconnaissance d'objets) une étape neuronale après l'autre, sans avoir besoin de rétroaction d'une étape ultérieure à une étape antérieure (donc Sa vx pas dire que après 150ms y se passe plus rien, bhay still activé)

Solution au pseudo-paradoxe de la perception Le monde est dans une large mesure à l’intérieur de notre cerveau !

vrai

cours 6 Flashcards

(43 cards)