Cours 8: Prise de décision Flashcards
Homo economicus
- fondement économie néoclassique
- homme rationnel: analyser/anticiper évén pour prendre décisions pour maximiser satisfaction en utilisant le mieux ressources
- modèle de l’humain pour comprendre prise de décisions
Blaise Pascal: fondements de théorie des probabilités dans correspondance avec Pierre de Fermat
critiques:
- Herbert Simon:humain a rationalité limitée (modèles information, fondateur sciences cognitives et IA)
- Amos Tversky + Daniel Kahnman: explorent limites rationalité dans prise de décisions
neuroéconomie: étude empirique de prise de décision en mettant l’emphase sur le cerveau à l’aide de diverses techniques de neuroimagerie.
Valeur espérée-> théorie de l’utilité espérée
=somme du produit de la probabilité de chaque événement par la valeur associée à cet événement
Prendre une décision: choisir option avec la + haute valeur espérée
Si valeur espérée > offre, on refuse
Si valeur espérée < offre, on accepte
trop simple pour décrire comp humain
-> Paradoxe de St-Petersboug: gens sont prêts à miser petit montant alors que toujours défavorable à la banque
Solution: utilité (Daniel Bernouilli)
- valeur psychologique évén
- fonction du logarithme de valeur: utilité petite augmentation inversement proportionnelle à richesse actuelle
- utilité espérée=somme des utilités pondérées par probabilités
- Indépendante du contexte et des limites cognitives.
Théorie des perspectives
Daniel Kahneman et Amos Tversky
Perspective: situation dans laquelle valeurs économiques et probabilités des événements sont connues, sans incertitude.
1-Dépendance à la référence
- choix en fonction des gains et pertes par rapport état présent SANS tenir compte richesse (histoire locale, pas globale)
- compression effets marginaux
- pente + raide pertes>gains
- > éviter pertes>faire gains
- neurones DA déclenchent avec une fréquence de PA proportionnelle à cette loi
2-Probabilités «pondérées»
-surestimation probabilités faibles et sous-estimation probabilités élevées
Calcul décision: combinaison probabilités pondérées et utilité dépendante à référence (multipliés et somme)
Comportements résultants:
1- aversion pour le risque quand gain hautement probable
Ex: pousse à prendre taux hypothécaires fixes
2- aversion pour le risque quand perte peu probables
Ex: pousse à acheter des assurances contre le vol
Inverse:
3- attirance pour le risque quand gain peu probable
Ex: pousse à acheter billets de loterie
4- attirance pour le risque quand perte hautement probable
Ex: pousse à garder actions boursières perdantes, ou bitcoins, espérant que valeur augmente.
Systèmes dopaminergiques
2 groupes de neurones DA ayant caractéristiques systèmes modulateurs diffus
1-origine de substance noire dans mésencéphale->projettent sur striatum ->forment système dopaminergique nigrostrié
DA striatum pour mouv volontaires (dégénérescence subst noire=MP)
2-origine dans partie ventrale tegmentum mésencéphalique=aire tegmentale ventrale
axones VTA ->cortex frontal et parties cortex limbique
->forment système dopaminergique mésocorticolimbique
système de récompense: VTA connecté noyaux accumbens (dans striatum ventral des ganglions de base), amygdale, hippocampe et régions corticales comme lobe frontal médian
Système dopaminergique mésocorticolimbique dans circuit de la récompense
1-drogues d’abus créent dépendance en modifiant circuit
Héroïne et nicotine: agissent sur VTA où neurones DA ont récepteurs nicotidiques et aux opiacés -> stimulent libération DA
Cocaïne: agit sur noyau accumbens (cible de VTA)-> prolonge libération DA en bloquant recapture
DONC drogues créent addiction en stimulant noyau accumbens
2-Parkinsoniens ont dégénérescence syst dopanimergique nigrostrié
-Traitement: agoniste DA
-5-7% traités dév problèmes jeu. ou dép sexuelle/magasinage
CAR médicaments ciblent pas syst et syst dopaminergique mésocorticolimbique pour apprentissage lié à récompense
(lien neuroleptiques conventionnels)
3- Stimulation de ce circuit sert de renforcement puissant
Exp: Olds et Milner
électrodes dans faisceau médian du télencéphale contenant neurones DA projetant vers noyaux accumbens
résultats:
-comp +stimulation=comp répétitivement en oubliant tout jusqu’à parfois mort
DONC faisceau médian du télencéphale proche de notion utilité et de dépendance à référence (histoire locale)
DA pas neurotransmetteur du plaisir
Exp: Berridge et Robinson
Injection neurotoxine spécifique aux neurones dopaminergiques (6-hydroxydopamine ou 6-OHDA) dans noyaux accumbens de rats->lésions au système dopaminergique mésocorticolimbique
résultats:
- aphagique (mangent pas)
- réponse hédonique normale au sucrose et quitine (amer)
➔ DA: désir, motivation à obtenir renforcement ou éviter punition. Pas plaisir.
Études neuroimagerie: noyau accumbens activé par stimuli avec pertinence motivationnelle
Perte de motivation->diminution activité système DA
ex: dévaluation de récompense
->neurones sensibles opiacés et endocannabinoïdes pour plaisir
Phénomène de dévaluation de la récompense
Murayama et al. (2001) entrainent sujets à arrêter chronomètre à moment précis.=Motivation intrinsèque.
groupes:
-contrôle: pas payés (motivation intrinsèque)
-récompense: payés selon perfo 1e séance, mais pas 2e
(association apprise entre comp et récompense-> motivation extrinsèque)
résultats:
-contrôle: activation hémodynamique du striatum ventral associée à succès
-récompense: Activation striatum ventral dans 1e séance (comme contrôle), mais rien dans 2e
-> perte motivation intrinsèque car perte de motivation extrinsèque
=phénomène de dévaluation de récompense
situations presque gagnantes dans jeux de hasard
Clark et al
ex: machine à sous
Striatum ventral:
- Activation combinaisons gagnantes > perdantes.
- Activation combinaisons presque gagnantes > clairement perdantes.
+ marqué chez:
- individus qui ont problèmes de jeu.
- personnes agées: cortex préfrontal ventromédian micro-lésé.
- Parkinsoniens: agonistes de DA qui affectent système de récompense
- 14 et 22 ans: fonctions exécutives immatures
Erreur de prédiction de la récompense
Encodée par VTA
Exp: Wolfram Schultz
singes apprennent appuyer levier quand voyant lumineux pour jus
- sans indice->jus=augmentation fréquence PA dans VTA
- apprentissage associer indice-rép-récompense -> neurones rép - en - à récompense et + en + à indice (prédicteur de récompense)
- si pas récompense après indice: fréquence PA sous niveau de base
Erreur de prédiction de récompense (temps t)= récompense actuelle (temps t)
+ récompense prédite dans un futur rapproché (au temps t+1)
- récompense prédite (au temps t).
-> prédit fréquence déclenchement neurone:
Si positive: répond + qu’à l’état de repos
Si négative: déclenche - qu’à l’état de repos
(similaire idée Kahnement et Twersky que utilité dépendant histoire locale, point de référence départ)
Autres études:
-fréquence de déclenchement de neurones proportionnelle à probabilité de récompense et utilité de récompense
Exp: Gehring et Willoughby, EEG
-comp ERP varie selon gain ou perte inattendu dès 200 ms
-origine d’un dipôle dans cortex cingulaire antérieur
ou
-VTA
Exp: Vickery et al, IRMf, MVPA
«matching pennies»
toutes régions du cerveau discriminent entre gagner et perdre
Exp: Matsumoto et Hikosaka:
1-Indices prédictifs de renforcement (disque=100%, croix=50%)
➔ neurone VTA +/- actif en fonction de niveau de probabilité de récompense
2-Indices prédictifs de punition (cercle=100%, triangle=50%)
➔ neurone de VTA +/- actif en fonction de niveau de probabilité de punition
DONC répond même façon à indice prédictif de punition ou renforcement->répond vrm à erreur de prédiction de l’utilité
Neurones DA: encoder l’erreur de prédiction de l’utilité, peu importe sa valence (positive-récompense ou négative-punition)
Prise de décision en situation d’incertitude
Risque si plusieurs conséquences avec des probabilités connues ou estimables
Risque estimé par variance normalisée par tailles gains et pertes
Exp: Mohr et al 4 régions dans évaluation risque: -cortex préfrontal dorsolatéral -cortex préfrontal dorsomédian -cortex pariétal postérieur -insula antérieure: aversion au risque
Ambiguité: la probabilité des différents événements possibles ne peut pas être estimée.
Exp: hsu et al:
activation cortex latéral orbitofrontal: ambiguité>risque.
Temporal discounting: tendance à ignorer récompense future
Récompense à venir a - utilité que récompense immédiate
->perte hyperbolique en fonction du temps
100$ mtn>1104 1 sem
mais si 2 lointains: 100$ 46 jours<110$ 53 jours
2 systèmes décisionnels en compétition
système 1:
- récompense immédiate, smaller sooner
- Automatique, rapide, inconscient
- Heuristique, «chaud»
- Émotions, stéréotypes
Activité dépendante du délai:
- striatum ventral (VStr)
- cortex préfrontal médian (mPFC)
- cortex cingulaire postérieur (PCC).
système 2:
- récompense future, larger later
- Controlé, conscient, lent
- Algorithmique, «froid»
- Logique, systématique
Activité indépendante du délai:
- cortex préfrontal dorsolatéral
- cortex pariétal postérieur
- autres régions associées aux fonctions exécutives
évidences 1 système ou compromis
Heuristiques
Opérationsmentales automatiques, intuitives et rapides.
Raccourciscognitifs, stratégie décisionnelle imparfaite très souvent suffisante pour bonne décision
->mènent parfois àbiais et erreurs dans prise de décision
1-Heuristiquede représentativité: «estimer probabilité d’appartenance d’un objet à classe d’objets à partir deressemblanceavec cas prototypique».
ex: avocat ou ingénieur
2-Heuristiquede disponibilité: «juger fréquence ou probabilité d’un événement en fonction de facilité de seremémorer exemples de événement ».
ex: homicide vs cancer
3-Heuristique d’ancrage: grandeur (fréquence, probabilité…)d’un nouvel événement estimée à partir d’infosquiêtre pertinentes ounon (ancre).
4-Effet de cadrage : gens réagissent différemment à choix dépendament comment conséquences présentées: résultat positif (gains, % des vies sauvées) ou négatif (pertes, % de morts).
Prend attitude - risquée dans le cadre positif que dans le cadre négatif.
Cadre négatif: tendance à prendre + risques vs cadre positif: + conservateurs
Prise de décisions dans contexte social-récompenses sociales
Activation:
-aire tegmentale ventrale
-cortex préfrontal ventromédian
(comme récompenses primaires)
exp: pay-per-view
yeux vers T1-> jus, yeux vers T2-> jus ajustable + image
image: carré gris, singe rang inférieur, supérieur, périnée femelle
Ajustement qté jus T2 pour que T1 et T2 soient équiprobables
résultats:
- carré gris et singe rang inférieur: - jus seul qu’avec image donc payer singes pour regarder
- > stimuli aversifs=punition sociale
- singe rang supérieur et périnée femelle: + jus seul qu’avec image donc payent pour regarder
- > renforcements sociaux
Comportements prosociaux (dons charité), contre homo economicus-> récompense sociale
théories:
1-warm-glow: signal de récompense interne-activité striatum ventral
Étude: récompense ou donner à charité
Activation mêmes régions
2-prosocial behavior requires social cognition processes that recognize someone’s needs
Brain regions associated with social cognition (lateral parietal cortex and medial frontal cortex) predict degree to which individual will engage in altruistic behavior
Coopération sociale: dilemme du prisonnier (Albert W. Tucker)
2homo economicus auraient intérêt à coopérer, mais en absence de communication, chacun choisira detrahir l’autre
= pire des situations collectives
va contre modèle économie néoclassique de homo economicus
coopération corrèle avec activation noyau accumbens car prédit récompense future
Meilleur algorithme Anatol Rapoport: 1e coopère, puis option de l’adversaire au temps t-1