Cours 3 : Mémoire sensorielle et traitement ascendant Flashcards

1
Q

[Fonctionnement de l’œil]

L’œil est une structure ____ en mouvement ____ . Quand l’œil passe d’un point à l’autre dans le champ visuel disponible (____ – 50 à 100ms), il est interrompu par des ____ (pauses) d’environ 200ms.

Pendant la saccade, l’œil accède à l’information externe seulement pendant la ____ , c’est ce qui fait en sorte qu’une scène visuelle ____ est en fait un ensemble d’images ____ , ce qui donne l’impression de ____ et de ____.

A

[Fonctionnement de l’œil]

L’œil est une structure dynamique en mouvement constant . Quand l’œil passe d’un point à l’autre dans le champ visuel disponible (saccades – 50 à 100ms), il est interrompu par des fixations (pauses) d’environ 200ms.

Pendant la saccade, l’œil accède à l’information externe seulement pendant la fixation , c’est ce qui fait en sorte qu’une scène visuelle distincte est en fait un ensemble d’images statiques , ce qui donne l’impression de dynamisme et de continuité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi le phénomène de persistance visuelle ?

Dans quel type de mémoire il est possible d’observer ce phénomène ?

A

C’est la persistance apparente d’un stimulus qui continue après sa durée physique. En gros, le système visuel maintien l’image même quand elle n’est pas là, c’est ce qui donne l’illusion de continuité

Phénomène observé dans la mémoire sensorielle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les caractéristiques de la mémoire sensorielle ?

A

C’est une mémoire très courte qui enregistre l’information visuelle ou auditive de manière temporaire par le phénomène de persistance visuelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Études de Sperling (1960) : Étude sur la mémoire sensorielle visuelle

Cette étude a été fait dans le but d’évaluer les caractéristiques de la mémoire sensorielle visuelle (prémisse : les participants voient plus ce qu’ils rapportent). On présente un ensemble de lettres/chiffres avec un tachistoscope à des participants qui sont hautement entraînés. Le nombre de lettres ou chiffres dans la grille varie.

Il y a 4 phases à cette étude :
1. Rapport complet
2. Rapport partiel SANS délai
3. Rapport partiel AVEC délai
4. Rapport partiel catégoriel

RAPPORT COMPLET
Initialement, Sperling pensait que ce qui est rapporté à la fin d’un rapport complet par le participant était la capacité de la mémoire sensorielle.

[Méthode]
Fixer la croix => Grille (4X3) apparaît pendant 50 ms => Rapporter le plus de lettres possibles au bon emplacement

Pour qu’une réponse soit correct, il faut que l’identité (lettre) ET la position soit la bonne.

  • Quel est le résultat du rapport complet ?
  • Qu’est-ce qu’on peut en conclure ?
  • Avec ce qui a été obtenu avec le rapport complet, pourquoi ils ont décidé de faire le rapport partiel à la prochaine phase de l’étude ?
A

Résultat
Il est possible d’observer une limitation dans la tâche : dès qu’on présente plus de 4 lettres, le participant en rapporte toujours environ 4.

Conclusion
Cependant, des participants rapportent avoir vu les items, mais que leur perception s’est estompé rapidement pendant qu’ils les rapportaient. Donc le nombre de lettres rapportées au rapport complet (qui est constante pour chaque participant) ne représenteraient pas la mémoire sensorielle, mais plutôt la capacité de la mémoire à court terme.

Pour tester cette hypothèse, on utilise la métaphore de l’examen : Il est possible d’estimer ce qui a été retenu en mémoire sensorielle en échantillonnant la connaissance en parties à condition que je sache d’avance sur quoi je vais être testé. C’est sur cette métaphore que se base le rapport partiel sans délai (les participants ne savent pas à l’avance la ligne qui sera demandée).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Études de Sperling (1960) : Étude sur la mémoire sensorielle visuelle

Cette étude a été fait dans le but d’évaluer les caractéristiques de la mémoire sensorielle visuelle (prémisse : les participants voient plus ce qu’ils rapportent). On présente un ensemble de lettres/chiffres avec un tachistoscope à des participants qui sont hautement entraînés. Le nombre de lettres ou chiffres dans la grille varie.

Il y a 4 phases à cette étude :
1. Rapport complet
2. Rapport partiel SANS délai
3. Rapport partiel AVEC délai
4. Rapport partiel catégoriel

RAPPORT PARTIEL SANS DÉLAI
Dans cette phase de l’expérience, on se demande si les participants peuvent enregistrer plus d’informations qu’ils peuvent en rapporter dans le rapport complet. Une tonalité est présentée immédiatement après la présentation de la grille d’items. .

[Méthode]
Fixer la croix => Grille apparaît pendant 50 ms => Indice auditif (grave, moyen ou aigu) => Rapporter le plus de lettres possibles de la ligne demandée au bon emplacement

   Tonalité grave : on rapporte la ligne du bas
   Tonalité moyenne : on rapporte la ligne du milieu
   Tonalité aigue : on rapporte la ligne du haut

1) Comment le contenu de la mémoire sensorielle visuelle est mesuré ?
2) Pourquoi une tonalité a été prensentée après la grille ?
3) Quel est le résultat du rapport complet ?
4) Qu’est-ce qu’on peut en conclure ?
5) Pourquoi ils ont fait un rapport partiel avec délai dans la prochaine phase de l’étude ?

A

1) Contenu de la mémoire sensorielle visuelle = Nombre d’items rapportés => Nombre d’alternatives

Exemple: Si le participant rapporte 2 lettres de la bonne ligne (il y en a 3), le contenu de la mémoire sensorielle sera de 6 (2 * 3).

2) Pour que l’attention du participant ne soit plus dirigée sur toutes les lettres (qui n’étaient plus présentes), pour qu’il puisse échantillonner ce qu’il a vu (donc plus représentatif de la mémoire sensorielle.

3) Résultats : Ce qui est en bleu est l’estimation du contenu de la mémoire sensorielle. On voit qu’elle se rapproche de la ligne de perfection.

4) Conclusion : Considérant l’erreur expérimentale et les variations inter-sujets, les résultats montrent que toute l’information présentée brièvement est initialement enregistrée en mémoire sensorielle. Donc, la mémoire sensorielle visuelle a une capacité élevée pour l’emmagasinage d’information.

5) Pour trouver la durée de la mémoire sensorielle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Études de Sperling (1960) : Étude sur la mémoire sensorielle visuelle

Cette étude a été fait dans le but d’évaluer les caractéristiques de la mémoire sensorielle visuelle (prémisse : les participants voient plus ce qu’ils rapportent). On présente un ensemble de lettres/chiffres avec un tachistoscope à des participants qui sont hautement entraînés. Le nombre de lettres ou chiffres dans la grille varie.

Il y a 4 phases à cette étude :
1. Rapport complet
2. Rapport partiel SANS délai
3. Rapport partiel AVEC délai
4. Rapport partiel catégoriel

RAPPORT PARTIEL AVEC DÉLAI
Maintenant on sait que la capacité de la mémoire sensorielle visuelle est élevée, mais on ne connaît toujours pas sa durée. Pour la trouver :

[Méthode]
Fixer la croix => Grille apparaît pendant 50 ms => DÉLAI => Indice auditif => Rapporter le plus de lettres possibles de la ligne demandée au bon emplacement

  • Comment va-t-on estimer la durée de la mémoire sensorielle visuelle ?
  • Quel est le résultat de cette phase de l’étude ?
A
  • On regarde le délai après lequel la performance devient égale à la capacité de la mémoire à court-terme (4), car à partir de ce moment, on considère que la capacité de la mémoire iconique est épuisé, c’est ce qui permet de déterminer sa durée.

Résultats :
* Plus on attend avant de donner le signal, plus la performance est réduite.
* Durée de la mémoire sensorielle : moins d’une seconde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Études de Sperling (1960) : Étude sur la mémoire sensorielle visuelle

Cette étude a été fait dans le but d’évaluer les caractéristiques de la mémoire sensorielle visuelle (prémisse : les participants voient plus ce qu’ils rapportent). On présente un ensemble de lettres/chiffres avec un tachistoscope à des participants qui sont hautement entraînés. Le nombre de lettres ou chiffres dans la grille varie.

Il y a 4 phases à cette étude :
1. Rapport complet
2. Rapport partiel SANS délai
3. Rapport partiel AVEC délai
4. Rapport partiel catégoriel

RAPPORT PARTIEL CATÉGORIEL
Maintenant, nous voulons savoir si les représentations mentales sont interprétées en mémoire sensorielle visuelle. Pour ce faire, on présente une grille composée de lettres et de chiffres et, selon la tonalité, le participant doit rapporter le plus d’items de la bonne catégorie (« alternatives » = catégorie).

  • Comment on fait pour savoir si les représentations mentales sont interprétées en mémoire sensorielle visuelle avec cette tâche ?

[Méthode]
Fixer la croix => Grille apparaît pendant 50 ms => Indice auditif => Rapporter le plus d’items possible de la catégorie demandée au bon emplacement
- Tonalité haute : Chiffres
- Tonalité basse : Lettres

  • Quel est le résultat de cette phase ?
A
  • Si le nombre d’items rapporté est égal qu’au rapport complet, ça veut dire que les représentations ne sont pas interprétées en mémoire sensorielle visuelle, car sinon il y aurait eu une amélioration de la performance par rapport au rapport complet (comme dans la tâche de rapport partiel avec/sans délai). Par conséquent, si ce n’est pas interprété en mémoire sensorielle visuelle, alors les catégories sont interprétées plus loin.

Résultats
* Rapport partiel catégoriel = Rapport complet
* On conclut donc que les représentations mentales dans la mémoire sensorielle ne sont pas interprétées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Études de Sperling (1960) : Étude sur la mémoire sensorielle visuelle

Cette étude a été fait dans le but d’évaluer les caractéristiques de la mémoire sensorielle visuelle (prémisse : les participants voient plus ce qu’ils rapportent). On présente un ensemble de lettres/chiffres avec un tachistoscope à des participants qui sont hautement entraînés. Le nombre de lettres ou chiffres dans la grille varie.

Il y a 4 phases à cette étude :

  1. Rapport complet
    Initialement, Sperling pensait que ce qui est rapporté à la fin d’un rapport complet par le participant était la capacité de la mémoire sensorielle.
  2. Rapport partiel SANS délai
    Dans cette phase de l’expérience, on se demande si les participants peuvent enregistrer plus d’informations qu’ils peuvent en rapporter dans le rapport complet.
  3. Rapport partiel AVEC délai
    Maintenant on connaît la capacité de la mémoire sensorielle visuelle, mais on ne connaît toujours pas sa durée.
  4. Rapport partiel catégoriel
    Maintenant, nous voulons savoir si les représentations mentales sont interprétées en mémoire sensorielle visuelle.

Qu’est-ce qu’on peut conclure sur la mémoire sensorielle visuelle ?

A

La mémoire sensorielle visuelle est un phénomène empirique robuste :
- Elle a une capacité presque parfaite
- Elle est de courte durée (<1s)
- Les représentations ne sont pas interprétées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie d’appariement au gabarit
* Quelle est la prémisse de cette hypothèse ?
* Quelles sont les problèmes de cette hypothèse ?

A

[Fonctionnement]
Pour chaque forme/objet possible, il devrait y avoir une représentation équivalente qui est le gabarit (ce à quoi on compare l’entrée) dans notre système cognitif. Pour reconnaître un stimulus donné, il faut apparier le stimulus avec un gabarit interne en mémoire et celui est le plus semblable va déterminer l’identité de la forme.

[Problèmes]
1. Parcimonie : Il y a un gabarit par lettre/objet distinct
2. Aucun soutien neurologique
3. Flexibilité : On a besoin d’une correspondance parfaite pour reconnaître l’objet (taille, emplacement, orientation, forme), donc on a besoin d’un nombre énorme de gabarits.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie d’appariement au gabarit
* Il y a eu une tentative pour sauver cette théorie. Quelle est cette tentative et pourquoi elle n’aide pas à régler le problème ?

A

En plus des gabarits, on aurait aussi des modules qui vont faire des ajustements à l’entrée. Cette tentative de sauver la théorie n’aide pas à régler ce problème, car on a juste reculé la compréhension dans le système, car on ne sait pas comment ce module d’ajustement fonctionne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Le pandémonium
C’est un modèle de reconnaissance basé sur les données (traitement ascendant) ET basé seulement sur l’analyse de caractéristiques (objets reconnus après l’analyse de leurs composantes). C’est un modèle de traitement de l’information, donc :
- Étapes de traitement
- Chaque étape prend un temps déterminé
- Transformations à chaque étape
- Opération sérielle

Comment l’hypothèse du pandémonium fonctionne ? (entrée = lettre «R»)

A

Il y a 4 types d’unités de reconnaissance (détecteurs de caractéristiques) :

  1. Démons d’image : Enregistrent l’image initiale du signal externe
    => Récepteurs rétiniens, ensuite mémoire sensorielle enregistre le signal
    => Les démons d’image reçoivent l’entrée visuelle « R »
  2. Démons des caractéristiques : Cherchent une caractéristique particulière dans le patron d’entrée (lignes spécifique, angle spécifique)
    => Détecteurs de caractéristiques
    => Les démons des caractéristiques crient si leur caractéristique est arrivée
  3. Démons cognitifs : Portent attention aux réponses des démons des caractéristiques et recherchent un ensemble de caractéristiques particulier
    => Mémoire à court terme (récupération des représentations dans la mémoire à long terme)
    => Les démons cognitifs crient proportionnellement au signal reçu des démons de caractéristiques (plus il y a de démons de caractéristiques qui activent les démons cognitifs, plus ils crient fort)
  4. Démon de la décision : Écoute le pandémonium créé par les démons. Réponse déterminée par le démon criant le plus fort
    => Mémoire à court terme
    => Il choisit le « R », car ce démon cognitif crie le plus fort
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Le pandémonium
C’est un modèle de reconnaissance basé sur les données (traitement ascendant) ET basé seulement sur l’analyse de caractéristiques (objets reconnus après l’analyse de leurs composantes). C’est un modèle de traitement de l’information, donc :
- Étapes de traitement
- Chaque étape prend un temps déterminé
- Transformations à chaque étape
- Opération sérielle

Quelles sont les arguments soutenant le pandémonium ?(4)

A

1. Puissance
* Plus parcimonieux (juste 7 composantes distinctes à traiter + et dans syst. de représentation)
* Avec un ensemble fini de détecteurs de caractéristiques, reconnaissance possible d’un nombre potentiellement infini d’objets (tels que lettres et mots)

2. Flexibilité
* Peut reconnaître les lettres même s’ils changent d’orientation, de taille, ou autres distorsions

3. Soutien neurologique
* Basé sur les détecteurs de caractéristiques (résultats d’Hubel et Wiesel)

4. Prédiction des erreurs
* Tâches d’identification de lettres où identifient erreurs fréquentes/non fréquentes (Kinney, Marsetta & Showman (1966))
=> Présentation lettres très rapidement, participant devaient les identifier
=> Erreurs fréquentes =erreurs de confusion
=> Le pandémonium est capable de prédire ce genre d’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie de reconnaissance par composantes
C’est un modèle de reconnaissance basé sur les caractéristiques (traitement ascendant), donc permet de reconnaître des objets avec un ensemble de blocs de construction représentationnels 2D (de caractéristique 3D) => avec 36 géons, on peut créer tous les objets du monde. Les géons sont assemblés de diverses façons et forment un nombre pratiquement infini d’objets

  1. Quelles sont les 2 caractéristiques des géons ?
  2. Comment fait-on pour séparer les parties d’objet ?
A

Caractéristiques des géons
1. Discriminabilité : chaque géon peut être distingué des autres sur presque toutes ses perspectives
2. Résistance au bruit visuel : on peut toujours percevoir les géons dans des conditions de « bruit »

Pour séparer les parties d’objets, recherche de 3 segments qui se rencontrent en angle droit (connexions aux vertex).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie de reconnaissance par composantes
C’est un modèle de reconnaissance basé sur les caractéristiques (traitement ascendant), donc permet de reconnaître des objets avec un ensemble de blocs de construction représentationnels 2D (de caractéristique 3D) => avec 36 géons, on peut créer tous les objets du monde. Les géons sont assemblés de diverses façons et forment un nombre pratiquement infini d’objets

Pour tester sa théorie, Biederman a conduit une expérience où il a présenté des objets complets/incomplets (100ms).

Quel est le résultat de cette expérience ?

A

Résultat : Plus de géons présentés, moins d’erreurs (preuve pour représentation mentale des géons) => principe de récupération componentielle

MAIS : Les vertex sont la clé ! Ils sont des caractéristiques importantes de l’image.
* Retrait d’une portion de l’image a un plus grand effet sur le taux d’erreur quand il y a plus de vertex manquants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie de reconnaissance par composantes
C’est un modèle de reconnaissance basé sur les caractéristiques (traitement ascendant), donc permet de reconnaître des objets avec un ensemble de blocs de construction représentationnels 2D (de caractéristique 3D) => avec 36 géons, on peut créer tous les objets du monde. Les géons sont assemblés de diverses façons et forment un nombre pratiquement infini d’objets

Dans une première étude, il a été déterminé que plus il y a de géons qui sont présentés, moins il y a d’erreur d’identification d’objet, mais que les vertex sont importants, car un retrait d’une portion de l’image a un plus grand effet sur le taux d’erreur quand il y a plus de vertex manquants.

Maintenant on veut vérifier si c’est vrai que les vertex sont clé. Dans une deuxième expérience, on a présenté des images obstruées. Il y avait deux types d’images : récupérable vs non-récupérable.

Récupérable = vertex visible
(Les deux images ont le même % d’obstruction, mais les parties montrées ne sont pas les mêmes)

Quelle est le résultat de cette expérience ?

A

Résultats
- Vertex absent (non-récupérable) : ↑ taux d’erreur (non reconnu 80% du temps même après 5s)
- Récupérable = aucune erreur après 5s d’exposition

Démontre que les vertex, qui sont des indices de profondeur = clé pour reconnaître un objet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment reconnaît-on les objets malgré toute la variabilité dans notre environnement ? Il est possible de constater que malgré la variabilité (orientation, taille, couleur, obstruction, floue, etc.), on est toujours capable de reconnaître la lettre F. Comment le système cognitif détermine les propriétés pertinentes du patron parmi toutes les propriétés impertinentes ?

Pour répondre à ces questions, nous utilisons le traitement ascendant pour formuler certaines théories.

Voici l’évolutions des hypothèses pour répondre à cette question :
1. Hypothèse originale : Théorie d’appariement au gabarit
2. Hypothèse 2 : Le pandémonium (Selfridge, 1959)
3. Hypothèse 3 : Théorie de reconnaissance par composantes (Biederman, 1987)

Théorie de reconnaissance par composantes
C’est un modèle de reconnaissance basé sur les caractéristiques (traitement ascendant), donc permet de reconnaître des objets avec un ensemble de blocs de construction représentationnels 2D (de caractéristique 3D) => avec 36 géons, on peut créer tous les objets du monde. Les géons sont assemblés de diverses façons et forment un nombre pratiquement infini d’objets.

  • Quels sont les arguments soutenant la théorie des géons ?
  • Quelles sont les 5 limites de cette théorie ?
A

[Arguments soutenant la théorie des géons]
1) Puissance
=> Plus parcimonieux (seulement 36 géons)
=> Avec un ensemble fini de géons dans le système cognitif, reconnaissance possible d’un nombre potentiellement infini d’objets 3D

2) Flexibilité
=> Peut reconnaître les lettres même s’ils changent d’orientation, de taille, occlusion et dégradation du signal variés
=> Invariant aux différentes perspectives (géons 3D ne changement pas de forme lorsqu’un objet est observé d’un autre point de vue)

3) Soutien neurologique

[Limites de la théorie des géons]
1) Théorie incomplète
* Pas de mécanismes permettant de réduire les complexités de scènes réelles jusqu’aux géons
* Comment on extrait les géons en image ?

2) Objets irréguliers ne sont pas traités en partie
* Ex : buisson ou chandail froissé

3) Objets sans vertex reconnaissables par l’humain
* Pomme, nuages reconnus et distingués

4) Couleur
* Images en couleur plus facile à reconnaître que images en noir et blanc

5) Permet de distinguer des catégories mais pas des membres
* Ne permet pas d’expliquer comment on peut distinguer deux objets de la même catégorie

17
Q

C’est quoi la différence entre le traitement ascendant et descendant ?

A

Traitement ascendant (Bottom-up) :
Processus qui débute avec la stimulation des récepteurs

Traitement descendant (Top-down) :
Processus qui implique les connaissances et les attentes de la personne qui perçoit

18
Q

Théorie de la Gestalt

Rappel :
L’approche du structuralisme implique que des unités élémentaires (sensations) s’assemblent pour créer notre perception d’une image.

L’approche du gestaltisme considère tout le pattern créé par l’objet, qui peut potentiellement être perçu par la représentation de plusieurs objets différents. Cependant, le fait qu’on peut voir automatiquement l’image c’est parce qu’il y a des règles qui organisent notre perception : Les lois de l’organisation perceptuelle (aka Lois de la Gestalt)

Pourquoi il est plus approprié d’appeler les lois de la Gestalt des heuristiques ?

A

Parce que ces lois ne résultent pas toujours à une perception de notre environnement qui est exact. Il est donc plus approprié de les appeler heuristiques, car ils procurent la meilleur prédiction de la solution d’un problème (vs algorithme : une procédure qui garantit de résoudre le problème).

Permet d’expliquer pourquoi notre système perceptuel est rapide et qu’il fait des erreurs parfois.

18
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de la simplicité : Tous les patterns de stimulus est vu d’une manière qui fait en sorte que la structure résultante est la plus simple possible.

19
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de similarité : Des choses apparaissent similaires quand ils sont regroupés ensemble

20
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de bonne continuation : Lorsque des éléments sont alignés ou suivent une direction cohérente, notre cerveau a tendance à les percevoir comme formant un groupe ou un ensemble continu, même s’il y a des interruptions ou des éléments manquants.

21
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de proximité : Les choses qui sont près l’une des autres apparaissent comme formant un groupe.

22
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de but commun : Les choses qui bougent dans la même direction apparaissent groupés ensemble.

23
Q

Correspond à quelle loi de la Gestalt ?

A

Loi de familiarité : Les choses ont plus de chance d’être groupées ensemble si les groupes apparaissent familiers ou s’ils portent une signification importante. C’est pour ça qu’on peut voir le chien.

24
Q

Voici quelques facteurs qui font en sorte qu’un ordinateur a de la difficulté à percevoir les objets.

i. Le stimulus sur le récepteur est ambigu
Il y a de l’ambiguïté quand une image particulière peut être causée par une infinité d’objets différents. Généralement les humains perçoivent le bon objet et non les autres objets potentiels qui pourraient occasionner la même image sur la rétine.

ii. Les objets doivent être distingués entre eux + ce qui les entoure
Il est parfois difficile de déterminer où un objet fini/un autre commence. On est capable de déterminer intuitivement quand un mot fini et un autre commence. La reconnaissance de voix des ordinateurs peut être excellent avec un petit nombre de mot et que la personne parle clairement avec des pauses entre ses mots et pas de bruit de fond (beaucoup de contraintes).

iii. Les objets peuvent être cachés ou floues
Quand il y a de l’occlusion d’un objet sur un autre (ce qui est très commun dans l’environnement), on est capable facilement de comprendre que l’objet couvert continues derrière l’objet qui le cache. Les ordinateurs ont une mauvaise performance.

iv. Les raisons pour un changement d’éclairage/noirceur peut être pas clair

Bref, tous ces problèmes simples à résoudre pour nous n’est pas simple pour un ordinateur (même les plus puissant). Pourquoi ?

A

Parce que les humains ont une intelligence perceptuelle, c’est-à-dire qu’on perçoit en utilisant 1. L’information qui stimule nos récepteurs ET 2. L’information qui provient de nos connaissances/ce qui est attendu.