19. Contrôle cognitif partie 2 Flashcards
Qu’est-ce que le foraging ?
comment chercher de la nourriture
Que dit le théorème de la valeur marginale (Charnov) ?
Animaux exploitent leur environement jusqu’à ce que le taux de
récompense qu’ils recoivent passe en dessous du taux moyen connu pour tous les environements visités jusqu’a maintenant
L’animal a une certaine attente par rapport à un taux moyen de réussite de trouver de la nourriture, et quand ce taux moyen est atteint, il se décide à changer de territoire.
Vrai pour les humains, les singes et les vers de terre…
Quelles sont les bases neuronales de ‘foraging’? Quelle est la
valeur prise en compte pour la décision de partir vers un choix de
valeur inconnue?
Une expérience qui montre qu’il existe un seuil de départ dans le
ACC (Anterior Cingulate Cortex – Cortex Anterieur Cingulé)
Expérience :
On a appris au singe que si il fait une saccade vers le point bleu, il reçoit une récompense (jus de fruit).
Le singe arrive à l’expérience en ayant soif -> motivation
Il a le choix d’aller vers un environnement où il sait qu’il aura de la nourriture, et sur l’autre choix, il y va pas de la nourriture.
Le jus diminue d’une quantité à chaque essai. Donc au bout d’un moment il vaut mieux partir, et se permettre un temps oÙ il y a rien du tout pour retrouver des essais où il y a une quantité plus forte.
Stay/Rester condition – le délai est plus court entre chaque récompense, mais la
valeur de la récompense diminue au cours du temps (comme quand on ceuille
les fruits d’un arbre…) -> saccade vers le carre bleu
Leave/Partir condition – aucune récompense sur cet essai puis apres un délai
variable, possibilité de plus grandes récompense (un nouvel arbre plein de
fruits) -> saccade vers le rectangle gris
Résultats ?
L’animal a choisi le carré bleu plusieurs de suite et d’un coup il a choisi le carré gris.
On regarde à quel temps l’animal est parti.
On prend les temps de départ de l’animal, temps entre le choix de 2 carrés gris, et on sépare en 4 quartiles.
Les cellules déchargent à la même intensité.
Avant ces neurones ne déchargeait pas autant.
On a l’impression que de le AAC les neurones s’intéressent à changer de stratégies et ça semble être conditionné par rapport à un seuil.
À la base ces neurones ont une activité de 1 et quand ça double l’animal prend la décision de choisir le carré gris et de partir
Chez le singe et l’humain, quoi s’active pour initier l’exploration dans une foraging tasks ?
ACC
Et si la tâche demande de décider entre 2 valeurs calculables ?
activation du VMPFC/OFC si la tâche demande de décider entre 2 valeurs calculables (example des snacks) -> VMPCF/OFC représente les valeurs
Qu’est-ce que le dilemne du choix ?
Pour la même valeur, pas le même ressenti en fonction des autres choix possibles
Expérience :
Design experimental
Avant la session de IRMf – juger de la valeur de chaque objet.
Pendant IRMf
- Deux ‘bons’ choix (high value)
- Deux ‘mauvais’ choix (low value)
- Un ‘bon’ et un ‘mauvais’ choix
Pour chaque essai, choisir puis juger désirabilité/état émotionel positif et
état d’anxiété pendant le choix
Après IRMf tire au sort un des choix – relevance du choix IRMf
Résultats ?
Plus de désir qd y’a 2 bons choix que 2 choix un peu bateau.
Mais les gens sont plus anxieux quand y’a 2 bons choix.
Dans le OFC il y a un codage de la valeur des objets.
Lorsqu’il y a de l’anxiété dans le choix, on voit une activation du ACC qui semble être de plus en plus actif au fur et à mesure que l’anxiété grandit.
Pour quels récompenses il y a bcp plus de structures anciennes sous-corticales qui codent ?
Récompenses primaires (nourriture, sexe, soif)
Quels sont les 2 centres sous-corticaux pour la dopamine ?
– Substantia Nigra (SN)
– Ventral Tegmental Area (VTA) dans le mésencephale
Neurones dans ces nuclei sont DOPAMINERGIQUES – leur terminaisons
nerveuses produisent et relachent de la dopamine dans l’espace synaptique
Expérience de Olds et Milner (1954), implant dans l’hypothalamus, résultats ?
pour certains animaux dans le “centre du plaisir”, hypothalamus lateral relié au systeme dopaminergique (VTA)
Certains animaux préféraient se stimuler plutôt que de survivre (aller manger, avoir des relations sociales ou s’occuper de leurs petits)
MAIS
• La relache de la dopamine en soi ne procure pas de sensation de
plaisir
• Pour la même valeur de récompense, neurones dopaminergiques
déchargent moins si cette recompense est attendue plutot que
inattendue
-> Donc va pas trop bien avec la notion de plaisir.
Expérience :
Singes entrainés à associer une lumière (CS) avec l’obtention de jus de fruit (US)
– entraine une réponse conditionée (CR) à la lumière
Enregistrement dans le Ventral Tegmental Area (VTA)
Résultats ?
- Pas de lumière
DA activity max pour recompense (US
Si pas de prédictions, donc on présente juste du jus de fruit, l’animal de s’attend pas à un jus de fruite, il y a un relâchement de dopamine. - Lumière (CS)
DA activity max juste apres CS
Pas de réponse visible a US -> prédiction correcte
Si on apprend le lien entre la lumière et le jus de fruit, toute la décharge dopaminergique se fait après la lumière mais aucune décharge quand ils reçoivent le jus.
- Lumière (CS) DA activity max juste apres CS Si pas de US, inhibition des Neurones DA -> mismatch entre prédiction et réalité Les neurones déchargent au niveau de la prédiction. Si la prédiction n'est pas maintenue, il y a un codage soit positif soit négatif de la valence du décalage.
Qu’est-ce que la Reward Prediction Error ou RPE ?
RPE = Récompense Obtenue - Récompense Attendue
– RPE positive -> va augmenter la décharge au CS dans les prochains essais
– RPE negative -> va diminuer la décharge au CS dans les prochains essais
Pour utiliser un signal de PE “prediction error” – neurones DA doivent faire quoi ?
neurones DA doivent
recevoir information sur la récompense attendue et moduler la récompense
obtenue par rapport à celle attendue
ROLE DU SYSTEME GABAergique dans cette modulation
Expérience :
Odeurs associées à une récompense:
Récompense pour Odeur A – 10% du temps
Récompense pour Odeur B – 90% du temps
Résultats ?
Même récompense obtenue (jus) mais différentes valeurs pour A et B Odeur B est plus prévisible donc plus petite RPE au moment de la récompense obtenue (jus) Note - au moment de la perception - plus grande décharge sous Odeur B pour signaler la plus grande valeur attendue que sous Odeur A (sous control GABAergic aussi)
Quand c’est très probable, il y a une décharge tôt au moment de l’odeur.
Pour l’odeur A, il y a plus de décharge lors de la récompense car ce n’était pas prévu.