Cours 8: Prise de décision Flashcards

1
Q

Homo economicus

A
  • fondement économie néoclassique
  • homme rationnel: analyser/anticiper évén pour prendre décisions pour maximiser satisfaction en utilisant le mieux ressources
  • modèle de l’humain pour comprendre prise de décisions

Blaise Pascal: fondements de théorie des probabilités dans correspondance avec Pierre de Fermat

critiques:

  • Herbert Simon:humain a rationalité limitée (modèles information, fondateur sciences cognitives et IA)
  • Amos Tversky + Daniel Kahnman: explorent limites rationalité dans prise de décisions

neuroéconomie: étude empirique de prise de décision en mettant l’emphase sur le cerveau à l’aide de diverses techniques de neuroimagerie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Valeur espérée-> théorie de l’utilité espérée

A

=somme du produit de la probabilité de chaque événement par la valeur associée à cet événement

Prendre une décision: choisir option avec la + haute valeur espérée
Si valeur espérée > offre, on refuse
Si valeur espérée < offre, on accepte

trop simple pour décrire comp humain
-> Paradoxe de St-Petersboug: gens sont prêts à miser petit montant alors que toujours défavorable à la banque

Solution: utilité (Daniel Bernouilli)

  • valeur psychologique évén
  • fonction du logarithme de valeur: utilité petite augmentation inversement proportionnelle à richesse actuelle
  • utilité espérée=somme des utilités pondérées par probabilités
  • Indépendante du contexte et des limites cognitives.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Théorie des perspectives

Daniel Kahneman et Amos Tversky

A

Perspective: situation dans laquelle valeurs économiques et probabilités des événements sont connues, sans incertitude.

1-Dépendance à la référence

  • choix en fonction des gains et pertes par rapport état présent SANS tenir compte richesse (histoire locale, pas globale)
  • compression effets marginaux
  • pente + raide pertes>gains
  • > éviter pertes>faire gains
  • neurones DA déclenchent avec une fréquence de PA proportionnelle à cette loi

2-Probabilités «pondérées»
-surestimation probabilités faibles et sous-estimation probabilités élevées

Calcul décision: combinaison probabilités pondérées et utilité dépendante à référence (multipliés et somme)

Comportements résultants:

1- aversion pour le risque quand gain hautement probable
Ex: pousse à prendre taux hypothécaires fixes
2- aversion pour le risque quand perte peu probables
Ex: pousse à acheter des assurances contre le vol

Inverse:
3- attirance pour le risque quand gain peu probable
Ex: pousse à acheter billets de loterie
4- attirance pour le risque quand perte hautement probable
Ex: pousse à garder actions boursières perdantes, ou bitcoins, espérant que valeur augmente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Systèmes dopaminergiques

A

2 groupes de neurones DA ayant caractéristiques systèmes modulateurs diffus

1-origine de substance noire dans mésencéphale->projettent sur striatum ->forment système dopaminergique nigrostrié
DA striatum pour mouv volontaires (dégénérescence subst noire=MP)

2-origine dans partie ventrale tegmentum mésencéphalique=aire tegmentale ventrale
axones VTA ->cortex frontal et parties cortex limbique
->forment système dopaminergique mésocorticolimbique

système de récompense: VTA connecté noyaux accumbens (dans striatum ventral des ganglions de base), amygdale, hippocampe et régions corticales comme lobe frontal médian

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Système dopaminergique mésocorticolimbique dans circuit de la récompense

A

1-drogues d’abus créent dépendance en modifiant circuit

Héroïne et nicotine: agissent sur VTA où neurones DA ont récepteurs nicotidiques et aux opiacés -> stimulent libération DA

Cocaïne: agit sur noyau accumbens (cible de VTA)-> prolonge libération DA en bloquant recapture

DONC drogues créent addiction en stimulant noyau accumbens

2-Parkinsoniens ont dégénérescence syst dopanimergique nigrostrié
-Traitement: agoniste DA
-5-7% traités dév problèmes jeu. ou dép sexuelle/magasinage
CAR médicaments ciblent pas syst et syst dopaminergique mésocorticolimbique pour apprentissage lié à récompense
(lien neuroleptiques conventionnels)

3- Stimulation de ce circuit sert de renforcement puissant
Exp: Olds et Milner
électrodes dans faisceau médian du télencéphale contenant neurones DA projetant vers noyaux accumbens

résultats:
-comp +stimulation=comp répétitivement en oubliant tout jusqu’à parfois mort
DONC faisceau médian du télencéphale proche de notion utilité et de dépendance à référence (histoire locale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

DA pas neurotransmetteur du plaisir

A

Exp: Berridge et Robinson
Injection neurotoxine spécifique aux neurones dopaminergiques (6-hydroxydopamine ou 6-OHDA) dans noyaux accumbens de rats->lésions au système dopaminergique mésocorticolimbique

résultats:

  • aphagique (mangent pas)
  • réponse hédonique normale au sucrose et quitine (amer)

➔ DA: désir, motivation à obtenir renforcement ou éviter punition. Pas plaisir.

Études neuroimagerie: noyau accumbens activé par stimuli avec pertinence motivationnelle

Perte de motivation->diminution activité système DA
ex: dévaluation de récompense

->neurones sensibles opiacés et endocannabinoïdes pour plaisir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Phénomène de dévaluation de la récompense

A

Murayama et al. (2001) entrainent sujets à arrêter chronomètre à moment précis.=Motivation intrinsèque.

groupes:
-contrôle: pas payés (motivation intrinsèque)
-récompense: payés selon perfo 1e séance, mais pas 2e
(association apprise entre comp et récompense-> motivation extrinsèque)

résultats:
-contrôle: activation hémodynamique du striatum ventral associée à succès
-récompense: Activation striatum ventral dans 1e séance (comme contrôle), mais rien dans 2e
-> perte motivation intrinsèque car perte de motivation extrinsèque
=phénomène de dévaluation de récompense

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

situations presque gagnantes dans jeux de hasard

A

Clark et al
ex: machine à sous
Striatum ventral:
- Activation combinaisons gagnantes > perdantes.
- Activation combinaisons presque gagnantes > clairement perdantes.

+ marqué chez:

  • individus qui ont problèmes de jeu.
  • personnes agées: cortex préfrontal ventromédian micro-lésé.
  • Parkinsoniens: agonistes de DA qui affectent système de récompense
  • 14 et 22 ans: fonctions exécutives immatures
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erreur de prédiction de la récompense

A

Encodée par VTA
Exp: Wolfram Schultz
singes apprennent appuyer levier quand voyant lumineux pour jus

  • sans indice->jus=augmentation fréquence PA dans VTA
  • apprentissage associer indice-rép-récompense -> neurones rép - en - à récompense et + en + à indice (prédicteur de récompense)
  • si pas récompense après indice: fréquence PA sous niveau de base

Erreur de prédiction de récompense (temps t)= récompense actuelle (temps t)
+ récompense prédite dans un futur rapproché (au temps t+1)
- récompense prédite (au temps t).
-> prédit fréquence déclenchement neurone:
Si positive: répond + qu’à l’état de repos
Si négative: déclenche - qu’à l’état de repos

(similaire idée Kahnement et Twersky que utilité dépendant histoire locale, point de référence départ)

Autres études:
-fréquence de déclenchement de neurones proportionnelle à probabilité de récompense et utilité de récompense

Exp: Gehring et Willoughby, EEG
-comp ERP varie selon gain ou perte inattendu dès 200 ms
-origine d’un dipôle dans cortex cingulaire antérieur
ou
-VTA

Exp: Vickery et al, IRMf, MVPA
«matching pennies»
toutes régions du cerveau discriminent entre gagner et perdre

Exp: Matsumoto et Hikosaka:
1-Indices prédictifs de renforcement (disque=100%, croix=50%)
➔ neurone VTA +/- actif en fonction de niveau de probabilité de récompense
2-Indices prédictifs de punition (cercle=100%, triangle=50%)
➔ neurone de VTA +/- actif en fonction de niveau de probabilité de punition

DONC répond même façon à indice prédictif de punition ou renforcement->répond vrm à erreur de prédiction de l’utilité

Neurones DA: encoder l’erreur de prédiction de l’utilité, peu importe sa valence (positive-récompense ou négative-punition)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Prise de décision en situation d’incertitude

A

Risque si plusieurs conséquences avec des probabilités connues ou estimables

Risque estimé par variance normalisée par tailles gains et pertes

Exp: Mohr et al
4 régions dans évaluation risque:
-cortex préfrontal dorsolatéral
-cortex préfrontal dorsomédian 
-cortex pariétal postérieur 
-insula antérieure: aversion au risque

Ambiguité: la probabilité des différents événements possibles ne peut pas être estimée.

Exp: hsu et al:
activation cortex latéral orbitofrontal: ambiguité>risque.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Temporal discounting: tendance à ignorer récompense future

A

Récompense à venir a - utilité que récompense immédiate
->perte hyperbolique en fonction du temps

100$ mtn>1104 1 sem
mais si 2 lointains: 100$ 46 jours<110$ 53 jours

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

2 systèmes décisionnels en compétition

A

système 1:

  • récompense immédiate, smaller sooner
  • Automatique, rapide, inconscient
  • Heuristique, «chaud»
  • Émotions, stéréotypes

Activité dépendante du délai:

  • striatum ventral (VStr)
  • cortex préfrontal médian (mPFC)
  • cortex cingulaire postérieur (PCC).

système 2:

  • récompense future, larger later
  • Controlé, conscient, lent
  • Algorithmique, «froid»
  • Logique, systématique

Activité indépendante du délai:

  • cortex préfrontal dorsolatéral
  • cortex pariétal postérieur
  • autres régions associées aux fonctions exécutives

évidences 1 système ou compromis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Heuristiques

A

Opérationsmentales automatiques, intuitives et rapides.
Raccourciscognitifs, stratégie décisionnelle imparfaite très souvent suffisante pour bonne décision
->mènent parfois àbiais et erreurs dans prise de décision

1-Heuristiquede représentativité: «estimer probabilité d’appartenance d’un objet à classe d’objets à partir deressemblanceavec cas prototypique».
ex: avocat ou ingénieur

2-Heuristiquede disponibilité: «juger fréquence ou probabilité d’un événement en fonction de facilité de seremémorer exemples de événement ».
ex: homicide vs cancer

3-Heuristique d’ancrage: grandeur (fréquence, probabilité…)d’un nouvel événement estimée à partir d’infosquiêtre pertinentes ounon (ancre).

4-Effet de cadrage : gens réagissent différemment à choix dépendament comment conséquences présentées: résultat positif (gains, % des vies sauvées) ou négatif (pertes, % de morts).

Prend attitude - risquée dans le cadre positif que dans le cadre négatif.
Cadre négatif: tendance à prendre + risques vs cadre positif: + conservateurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Prise de décisions dans contexte social-récompenses sociales

A

Activation:
-aire tegmentale ventrale
-cortex préfrontal ventromédian
(comme récompenses primaires)

exp: pay-per-view
yeux vers T1-> jus, yeux vers T2-> jus ajustable + image
image: carré gris, singe rang inférieur, supérieur, périnée femelle
Ajustement qté jus T2 pour que T1 et T2 soient équiprobables

résultats:

  • carré gris et singe rang inférieur: - jus seul qu’avec image donc payer singes pour regarder
  • > stimuli aversifs=punition sociale
  • singe rang supérieur et périnée femelle: + jus seul qu’avec image donc payent pour regarder
  • > renforcements sociaux

Comportements prosociaux (dons charité), contre homo economicus-> récompense sociale

théories:
1-warm-glow: signal de récompense interne-activité striatum ventral

Étude: récompense ou donner à charité
Activation mêmes régions

2-prosocial behavior requires social cognition processes that recognize someone’s needs
Brain regions associated with social cognition (lateral parietal cortex and medial frontal cortex) predict degree to which individual will engage in altruistic behavior

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Coopération sociale: dilemme du prisonnier (Albert W. Tucker)

A

2homo economicus auraient intérêt à coopérer, mais en absence de communication, chacun choisira detrahir l’autre
= pire des situations collectives
va contre modèle économie néoclassique de homo economicus

coopération corrèle avec activation noyau accumbens car prédit récompense future

Meilleur algorithme Anatol Rapoport: 1e coopère, puis option de l’adversaire au temps t-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Coopération sociale: jeu de l’ultimatum

A

Punitionaltruiste: punir quelqu’un qui respectepas normes sociales même si on y perd

selon homo economicus rationnel:

  • répondant devrait accepter toute offre supérieure à zéro
  • proposeur,anticipant réponse répondant, devraitfaire + petite offre possible

MAIS
-Répondant acceptentpas n’importe quoi (refuser = censuring antisocial behavior)
-Proposeur proposent paspresquerien (risk of rejection pushes toward fair offers)
30%=magique

Activations:

  • Insula répondant si offre trop faible, corrélée avec ampleur injustice (système 1)
  • Cortex préfrontal dorsolatéral droit toujours (système 2, homo economicus)

-> Solution altruiste=système 1 gagne sur 2
=appuie 2 systèmes décisionnels

Exp1: Knoch et al
stimulation cortex préfrontal dorsolatéral droit, TMS
-> augmente probabilité accepter offre injuste
-> + conforme à homo economicus
(pas effet sur impression injustice)

+ cortexpréfrontaldorsolatéraldroit disrupted
->décision + consistent with rational economic models

DONC cortexpréfrontaldorsolatéraldroit supporte pas economic rationality (self-control)

17
Q

Combiner et intégrer de l’information pour prendre une décision

A

Exp: Iowa Gambling Task, Bechara et Damasio
4 paquets de cartes:
-mauvais: valeur espérée négative
-bons: valeur espérée positive

Résultats:

  • sujets normaux: évitent mauvais, privilégient bons
  • lésions préfrontales ventromédianes (syndrome frontal désinhibition): insensibles rétroaction négatives-> sélection mauvais + pas signes physiologiques

DONC normaux apprennent infrequent losses vs lesions apprennent frequent large gains

Exp: Shiv et al
résultats:
-patients>contrôles si bons paquets + risqués mais + payants
CAR contrôle trop aversion pour risque

Conclusion:
lésions dans le cortex préfrontal ventromédian-> problème de comparaison et d’intégration de gains et de pertes

18
Q

Devise commune pour utilité

A

Exp: Ranger et al, IRMf
1-barres de choco-> combien voudrait payer pour?
2-activité cérébrale quand offre barres de choco

résultats:
-activité cortex prérontal ventromédian postérieur corrèle avec utilité barres