cours 19: Contrôle Cognitif II Flashcards
En fonction de quoi est prise une décision?
La décision est prise en fonction du choix qui maximize la valeur de la récompense reçue.
La valeur d’une récompense
- Niveau de recompense (payoff):
- Primary (sex, nourriture, eau)
- Secondary (argent, statut, autonomy?)
- Probabilite de la recompense (Example des billets de lotterie: prefere 1% de chance de gagner CHF1’000 ou 10% de chance de gagner CHF 100?)
- Les couts investis pour obtenir la recompense (effort, investissement en temps ou autres resources)
- Contexte (etat physique, emotionel, mental de la personne qui prend la decision)
- Preference/gout
Comment le cerveau represente la valeur de nos decisions?
- Decision prise en fonction du choix qui maximize la valeur de la recompense recue
- Experience chez des singes eveilles – enregistrement multi- electrodes:
Expliquer la tâche pour trouver comment le cerveau représente la valeur de nos décisions
Expérience chez des singes éveillés - enregistrement multi-électrode
Tache: Choisir entre 2 images voisines au sein d’un rang, apprendre au fur et a mesure la valeur de chacune
Conditions: Les 2 images voisines different le long d’une des 3 dimensions:
- Reward probability – quelle est la probabilte d’obtenir un reward?
- Payoff - combien de ml de jus?
- Cost – nb de fois qu’il faut presser sur le levier de reponse
Quand une des dimensions varie, les autres restent fixes
Quels sont les résultats de l’expérience sur les valeurs de nos décisions avec les singes éveillés?
Resultats:
ACC (anterior cingular cortex - vert), LPFC (lateral prefrontal cortex - rouge), OFC (orbito frontal cortex - bleu)
Cellules qui repondent selectivement à une dimension, ainsi que des cellules qui repondent a plusieurs dimensions dans les trois regions
Pas de specialisation – chaque aire code pour les différents dimensions de la valeur
ACC – neurones codent pour plusieurs dimensions -> valeur en general
LPFC et OFC plus specialises pour une dimension a la fois;
LPFC - quand code pour effort tend a etre aussi associee a une autre dimension
le signal de valeur code par ces neurones precede la preparation motrice, comme si elle guidait le choix dans la decision…
Comment le cerveau represente la valeur de nos decisions?
Expérience chez des humains en IRMf
- OFC semble coder pour le payoff (plus ou moins d’argent)
- striatum plutot pour l’effort
- Lateral PFC semble coder pour la probabilite d’une recompense
- medial PFC plutot sensible au delai entre choix et obtention de la recompense (delayed-discounting)
Delayed-discounting:
la tâche du Marshmallow
quels éléments doit-on tenir en compte?
Manipulation de la confiance du participant dans l’experimentateur: Experimentateur demande a l’enfant de dessiner/faire un projet mais lui donne du mauvais materiel; Lui dit qu’il revient dans 5 min avec du bon materiel
Conditioon 1. Revient avec du meilleur materiel Condition 2. Ne revient pas
Plus tard le meme experimentateur administre la tache du marshmallow a l’enfant
Ceux qui n’ont pas recu le meilleur materiel ont plus de chance de se laisser tenter par le marshmallow
Role de l’environement de l’enfant…
Que se passe-t-il si le gain tout de suite est haut mais il y a un cout plus tard?
• Choix chez des gens au regime entre donut ou un yaourt… Taches:
- Evaluer la preference du sujet pour chacun des snacks consideres
- Dans IRMf, sujets choisissent a chaque essai entre ‘healthy’ ou ‘non-healthy’ snack; a la fin, un snack parmi leur choix est tire au hasard et leur est donne.
Que se passe-t-il si le gain tout de suite est haut mais il y a un cout plus tard?
Résultats du IRMf, expérience des snacks
- Activation dans le ventral medial PFC pour les differents snacks
- Activite change en fonction de la preference exprimee par le sujet pour chaque snack avant la sceance d’imagerie cerebrale
- Dans le dorsal lateral PFC, activite change en fonction du degree de control exerce pendant la tache
- SC trial = self-control trial - essai ou le Ss choisit un ‘healthy’ snack alors qu’un snack ‘unhealthy’ que le sujet prefere est offert
- Self-control group – individus avec un meilleur ‘self-control’ que ‘no self-control’ group base sur leur reponse a un questionnaire
Résumé comment le cerveau représente la valeur de nos décision
- Decision prise en fonction du choix qui maximize la valeur de la recompense recue
- Valeur de la decision – OFC/VMPFC (surtout pour nourriture mais aussi argent – pas juste ‘reinforceur’ primaire).
- Lateral PFC – applique un certain control etant donne la valeur de chaque choix
- Note: neurophysiologie suggere pas de specialisation, mais fMRI suggere une certaine forme de specialisation – clairement meme si specialisation, plusieurs dimensions sont representees dans toutes ces aires.
Comment choisir quand la valeur n’est pas connue?
- ‘Foraging’ – comment chercher de la nourriture?
- Est-ce que je continue a exploiter cet endroit de foret ou est ce que je bouge vers des terres inconnues, mais peut-etre plus riches? -> La balance entre exploitation et exploration
- Decision entre une option de valeur connue et une option de valeur inconnue… contrainte par le theoreme de la valeur marginale (Charnov):
Animaux exploitent leur environement jusqu’a ce que le taux de recompense qu’ils recoivent passe en dessous du taux moyen connu pour tous les environements visites jusqu’a maintenant
Vrai pour les humains, les singes et les vers de terre…
Quelles sont les bases neuronales de ‘foraging’? Quelle est la valeur prise en compte pour la decision de partir vers un choix de valeur inconnue?
Une experience qui montre qu’il existe un seuil de depart dans le ACC (Anterior Cingulate Cortex – Cortex Anterieur Cingule)
Singe manifeste si il prefere rester (exploiter) ou partir (explorer) par la direction de la saccade qu’il execute
Stay/Rester condition – le delai est plus court entre chaque recompense, mais la valeur de la recompense diminue au cours du temps (comme quand on ceuille les fruits d’un arbre…) -> saccade vers le carre bleu
Leave/Partir condition – aucune recompense sur cet essai puis apres un delai variable, possibilite de plus grandes recompense (un nouvel arbre plein de fruits) -> saccade vers le rectangle gris
Expérience singes stay or leave
Conditions expérimentales
Handling time delay (0.4sec vs 0.8sec) Reward payoff (reduction de 0.02ml vs 0.04ml par essai)
-> plus de chances de partir quand delai (handling time delay = 0.8sec) est plus long et reward diminue plus vite (reduction of 0.04ml/essai)
Expérience singes stay or leave
Résultats
Neurones dans ACC dont le taux de decharge (nbre de potentiels d’action) signale le depart du « patch » ou comportement d’exploration
Comment choisir quand la valeur n’est pas connue?
Résumé animaux et hommes
chez le singe et chez l’humain (fMRI): activation dans ACC pour exploration dans une foraging task
mais activation du VMPFC si la tache demande de decider entre 2 valeurs calculables (example des snacks) -> VMPCF represente les valeurs