cours 11: prise de décision Flashcards
La prise de décision
- La prise de décision est une des fonctions principales du cerveau.
- Le vie n’est qu’une succession de prises de décision.
Définition Décision
“L’adoption d’une proposition ou d’un plan d’action sur la base d’information et de recompenses associees a ces choix”
Les étapes essentielles:
- Information/observations/mesures
- sélection du choix
- récompenses
Quelles sont les étapes d’une prise de décision?
- Intégration et évaluation d’une variété de facteurs
- Inhibition de compétiteurs
- Evaluation du bénéfice/cout de chaque décision
- Balance entre habitudes et avoir un but précis
- Evaluation du contexte

Quelles sont les 2 théories de la prise de décision?
o Théorie optimale: approche optimale du point de vue d’un agent rationnel
o Théorie descriptive: decisions prises par un agent humain
La valeur d’une récompense:
définition
➫ Niveau de recompense primaire (sex, nourriture) et secondaire (argent)
➫ Probabilites d’une recompense (1M CHF a 1% ou 10’000CHF a 100%)
➫ Cout investi pour obtenir la recompense
➫ Contexte (satiete, etat emotionel)
➫ Preference, gout
La valeur d’une récompense dans la théorie optimale
Le but d’une decision rationelle est de maximiser le taux de recompense (recompense par unite de temps)
Comment le cerveau représente la valeur de nos décision?
- Décision prise en fonction du choix qui maximize la valeur de la récompense reçue
- Valeur de la décision - OFC (orbitofrontal cortex)/VMPFC (ventromedial prefrontal cortex) (surtout pour nourriture mais aussi argent - pas juste ‘réinforceur’ primaire).
- Lateral PFC - applique un certain control étant donné la valeur de chaque choix
- Note: neurophysiologie suggère pas de spécialisation, mais fMRI suggère une certaine forme de spécialisation, même si plusieurs dimensions sont représentées dans toutes ces aires.
Ou sont encodees les valeurs?
o Région préfrontales vmPFC, OFC, lPFC
➫ Valeur/cout, récompense/punition
➫ Motivation, probabilités, etc…
➫ Hiérarchie des buts
o Circuit Dopaminergique (VTA=ventral tegmental area)
➫ Désir
➫ Erreur de prédiction
Qu’est-ce qui est l’erreur de prédiction?
Des neurones de dopanime répondent à une erreur de prédiction.
1) Récompense inattendue: les neurones DA montrent une explosion d’activité
2) Conditioned Stimulus (CS = cloche) est lié avec récompense, maintenant le neurone DA déclenche après le CS, qui est devenu l’événement inattendu
3) Si après un CS (DA activité), il n’y a pas de récompense, autour du temps où la récompense est attendue, il y a maintenant une erreur de prédiction négative.
Quelles sont les 2 types de décisions?
- Les decisions perceptuelles
Comment transforme‐t‐on l’information perceptuelle en une action dans le but d’obtenir une recompense? - Les decisions subjectives (Value‐based decision making)
Les memes mecanismes sont-ils responsables des decision subjectives?
Pourquoi peut-on dire que la perception est une forme de décision?
Car elle est subjective et dépend du contexte :

Quelles sont les mécanismes de la perception?
o L’information dont nous disposons sur l’état du monde est incertaine, ambigue.
o Le cerveau peut représenter plusieurs hypothèses mais la perception correspond a une décision de ne percevoir qu’une seule d’entre elles.
Expliquez la tâche de la direction
Singe regarde croix de fixation.
Des points bougent dans un cercle de façon aléatoire.
A un moment donné un certain nombre entre eux bougent de manière cohérente dans une direction.
Singe doit faire saccade soit à droite soit à gauche pour donner sa décision.
Ceci devient plus simple, le plus grand le pourcentage de points cohérents.

Courbe psychométrique de pourcentage correct

Courbe chronométrique du temps de réaction

Expliquez l’expérience de la sensibilité au contraste

Théorie de détection de signal
- Modelise la prise de décision en présence d’incertitude
- Mesure deux variables cle
➫ Discriminabilité, qualité de l’information sensorielle (d’)
➫ Criterion (C) - critère/seuil
Courbes de la théorie de détection de signal

Quelle est la formalisation mathématique de la décision?
Le rapport de vraisemblance

Encore:
Variable de décision
o Donnees: information/observation (e = evidence en anglais)
o Hypotheses: reponses (h1 = droit), (h2 = gauche)
o Vraisemblance: p(e | h1) , p(e | h2)
o Variable de decision: rapport de vraisemblance (LR = likelyhood ratio en anglais…)

Comment est alors la règle de décision (basé sur la formalisation mathématique?

Intégration temporelle d’information
o Accumulation d’information
o Integration temporelle de log de rapport de vraisemblance
Accumulation temporelle d’information
mathématiquement

Race model vs Drift Diffusion Model (DDM)
Race:
- semble être la solution la plus rationnelle
- déterminée par les valeurs
- => stratégie plus réaliste
Diffusion models:
- prédit les données expérimentales
- déterminée par la différence de valeurs
- => stratégie optimale

Quel est le processus de décision dans le cerveau?
- Middle temporal area (MT) fournit infos au Lateral intra-pariétal cortex (LIP)
- LIP accumule info jusqu’à seuil est atteint.
- LIP donne ordre au supérior colliculus (SC) de faire action (Saccade)

MT neurons
o Sensibles a la direction
➫Reponse stable lors de la presentation du stimulus visuel
➫Reponse variable autour de la moyenne
o Taux de decharge proportionel a la coherence/difficulte et donc a la performance.

Fixed Viewing

Exemple activité LIP neurons

Type de décision = valeur (préférence)
Les préférences sont subjectives et dépendent du contexte.
Paradoxe:
Il faut plus de temps pour decider entre deux excellentes options qu’entre une bonne et une mauvaise option

Probabilistic decision: conclusion
o LIP neurons activity show accumulation of evidence in favor of the rewarded option
➫ Increase of activity if Target inside receptive field
➫ Decrease of activity if Target outside receptive field
o Not an RT task so do not reach a threshold to trigger a response; response reflects the accumulated evidence / probability of reward
General conclusion
o Value‐based decision making studies reveal how preferences and reward or value guide our choices: why we choose one alternative rather than another one.
o Perceptual decision making studies provide a generic mechanism for how decisions are made (from perception to action).
o Importantly, both approaches apply to both types of decisions!
o The DDM relies (i) the representation of evidence in sensory (or reward) areas, and (ii) its accumulation in decision related and motor brain structures (e.g. LIP) leading to action