Cours 8: Prise de décision Flashcards

Question 1

Q

Homo economicus

Answer

A

fondement économie néoclassique
homme rationnel: analyser/anticiper évén pour prendre décisions pour maximiser satisfaction en utilisant le mieux ressources
modèle de l’humain pour comprendre prise de décisions

Blaise Pascal: fondements de théorie des probabilités dans correspondance avec Pierre de Fermat

critiques:

Herbert Simon:humain a rationalité limitée (modèles information, fondateur sciences cognitives et IA)
Amos Tversky + Daniel Kahnman: explorent limites rationalité dans prise de décisions

neuroéconomie: étude empirique de prise de décision en mettant l’emphase sur le cerveau à l’aide de diverses techniques de neuroimagerie.

Question 2

Q

Valeur espérée-> théorie de l’utilité espérée

Answer

A

=somme du produit de la probabilité de chaque événement par la valeur associée à cet événement

Prendre une décision: choisir option avec la + haute valeur espérée
Si valeur espérée > offre, on refuse
Si valeur espérée < offre, on accepte

trop simple pour décrire comp humain
-> Paradoxe de St-Petersboug: gens sont prêts à miser petit montant alors que toujours défavorable à la banque

Solution: utilité (Daniel Bernouilli)

valeur psychologique évén
fonction du logarithme de valeur: utilité petite augmentation inversement proportionnelle à richesse actuelle
utilité espérée=somme des utilités pondérées par probabilités
Indépendante du contexte et des limites cognitives.

Question 3

Q

Théorie des perspectives

Daniel Kahneman et Amos Tversky

Answer

A

Perspective: situation dans laquelle valeurs économiques et probabilités des événements sont connues, sans incertitude.

1-Dépendance à la référence

choix en fonction des gains et pertes par rapport état présent SANS tenir compte richesse (histoire locale, pas globale)
compression effets marginaux
pente + raide pertes>gains
> éviter pertes>faire gains
neurones DA déclenchent avec une fréquence de PA proportionnelle à cette loi

2-Probabilités «pondérées»
-surestimation probabilités faibles et sous-estimation probabilités élevées

Calcul décision: combinaison probabilités pondérées et utilité dépendante à référence (multipliés et somme)

Comportements résultants:

1- aversion pour le risque quand gain hautement probable
Ex: pousse à prendre taux hypothécaires fixes
2- aversion pour le risque quand perte peu probables
Ex: pousse à acheter des assurances contre le vol

Inverse:
3- attirance pour le risque quand gain peu probable
Ex: pousse à acheter billets de loterie
4- attirance pour le risque quand perte hautement probable
Ex: pousse à garder actions boursières perdantes, ou bitcoins, espérant que valeur augmente.

Question 4

Q

Systèmes dopaminergiques

Answer

A

2 groupes de neurones DA ayant caractéristiques systèmes modulateurs diffus

1-origine de substance noire dans mésencéphale->projettent sur striatum ->forment système dopaminergique nigrostrié
DA striatum pour mouv volontaires (dégénérescence subst noire=MP)

2-origine dans partie ventrale tegmentum mésencéphalique=aire tegmentale ventrale
axones VTA ->cortex frontal et parties cortex limbique
->forment système dopaminergique mésocorticolimbique

système de récompense: VTA connecté noyaux accumbens (dans striatum ventral des ganglions de base), amygdale, hippocampe et régions corticales comme lobe frontal médian

Question 5

Q

Système dopaminergique mésocorticolimbique dans circuit de la récompense

Answer

A

1-drogues d’abus créent dépendance en modifiant circuit

Héroïne et nicotine: agissent sur VTA où neurones DA ont récepteurs nicotidiques et aux opiacés -> stimulent libération DA

Cocaïne: agit sur noyau accumbens (cible de VTA)-> prolonge libération DA en bloquant recapture

DONC drogues créent addiction en stimulant noyau accumbens

2-Parkinsoniens ont dégénérescence syst dopanimergique nigrostrié
-Traitement: agoniste DA
-5-7% traités dév problèmes jeu. ou dép sexuelle/magasinage
CAR médicaments ciblent pas syst et syst dopaminergique mésocorticolimbique pour apprentissage lié à récompense
(lien neuroleptiques conventionnels)

3- Stimulation de ce circuit sert de renforcement puissant
Exp: Olds et Milner
électrodes dans faisceau médian du télencéphale contenant neurones DA projetant vers noyaux accumbens

résultats:
-comp +stimulation=comp répétitivement en oubliant tout jusqu’à parfois mort
DONC faisceau médian du télencéphale proche de notion utilité et de dépendance à référence (histoire locale)

Question 6

Q

DA pas neurotransmetteur du plaisir

Answer

A

Exp: Berridge et Robinson
Injection neurotoxine spécifique aux neurones dopaminergiques (6-hydroxydopamine ou 6-OHDA) dans noyaux accumbens de rats->lésions au système dopaminergique mésocorticolimbique

résultats:

aphagique (mangent pas)
réponse hédonique normale au sucrose et quitine (amer)

➔ DA: désir, motivation à obtenir renforcement ou éviter punition. Pas plaisir.

Études neuroimagerie: noyau accumbens activé par stimuli avec pertinence motivationnelle

Perte de motivation->diminution activité système DA
ex: dévaluation de récompense

->neurones sensibles opiacés et endocannabinoïdes pour plaisir

Question 7

Q

Phénomène de dévaluation de la récompense

Answer

A

Murayama et al. (2001) entrainent sujets à arrêter chronomètre à moment précis.=Motivation intrinsèque.

groupes:
-contrôle: pas payés (motivation intrinsèque)
-récompense: payés selon perfo 1e séance, mais pas 2e
(association apprise entre comp et récompense-> motivation extrinsèque)

résultats:
-contrôle: activation hémodynamique du striatum ventral associée à succès
-récompense: Activation striatum ventral dans 1e séance (comme contrôle), mais rien dans 2e
-> perte motivation intrinsèque car perte de motivation extrinsèque
=phénomène de dévaluation de récompense

Question 8

Q

situations presque gagnantes dans jeux de hasard

Answer

A

Clark et al
ex: machine à sous
Striatum ventral:
- Activation combinaisons gagnantes > perdantes.
- Activation combinaisons presque gagnantes > clairement perdantes.

+ marqué chez:

individus qui ont problèmes de jeu.
personnes agées: cortex préfrontal ventromédian micro-lésé.
Parkinsoniens: agonistes de DA qui affectent système de récompense
14 et 22 ans: fonctions exécutives immatures

Question 9

Q

Erreur de prédiction de la récompense

Answer

A

Encodée par VTA
Exp: Wolfram Schultz
singes apprennent appuyer levier quand voyant lumineux pour jus

sans indice->jus=augmentation fréquence PA dans VTA
apprentissage associer indice-rép-récompense -> neurones rép - en - à récompense et + en + à indice (prédicteur de récompense)
si pas récompense après indice: fréquence PA sous niveau de base

Erreur de prédiction de récompense (temps t)= récompense actuelle (temps t)
+ récompense prédite dans un futur rapproché (au temps t+1)
- récompense prédite (au temps t).
-> prédit fréquence déclenchement neurone:
Si positive: répond + qu’à l’état de repos
Si négative: déclenche - qu’à l’état de repos

(similaire idée Kahnement et Twersky que utilité dépendant histoire locale, point de référence départ)

Autres études:
-fréquence de déclenchement de neurones proportionnelle à probabilité de récompense et utilité de récompense

Exp: Gehring et Willoughby, EEG
-comp ERP varie selon gain ou perte inattendu dès 200 ms
-origine d’un dipôle dans cortex cingulaire antérieur
ou
-VTA

Exp: Vickery et al, IRMf, MVPA
«matching pennies»
toutes régions du cerveau discriminent entre gagner et perdre

Exp: Matsumoto et Hikosaka:
1-Indices prédictifs de renforcement (disque=100%, croix=50%)
➔ neurone VTA +/- actif en fonction de niveau de probabilité de récompense
2-Indices prédictifs de punition (cercle=100%, triangle=50%)
➔ neurone de VTA +/- actif en fonction de niveau de probabilité de punition

DONC répond même façon à indice prédictif de punition ou renforcement->répond vrm à erreur de prédiction de l’utilité

Neurones DA: encoder l’erreur de prédiction de l’utilité, peu importe sa valence (positive-récompense ou négative-punition)

Question 10

Q

Prise de décision en situation d’incertitude

Answer

A

Risque si plusieurs conséquences avec des probabilités connues ou estimables

Risque estimé par variance normalisée par tailles gains et pertes

Exp: Mohr et al
4 régions dans évaluation risque:
-cortex préfrontal dorsolatéral
-cortex préfrontal dorsomédian 
-cortex pariétal postérieur 
-insula antérieure: aversion au risque

Ambiguité: la probabilité des différents événements possibles ne peut pas être estimée.

Exp: hsu et al:
activation cortex latéral orbitofrontal: ambiguité>risque.

Question 11

Q

Temporal discounting: tendance à ignorer récompense future

Answer

A

Récompense à venir a - utilité que récompense immédiate
->perte hyperbolique en fonction du temps

100$ mtn>1104 1 sem
mais si 2 lointains: 100$ 46 jours<110$ 53 jours

Question 12

Q

2 systèmes décisionnels en compétition

Answer

A

système 1:

récompense immédiate, smaller sooner
Automatique, rapide, inconscient
Heuristique, «chaud»
Émotions, stéréotypes

Activité dépendante du délai:

striatum ventral (VStr)
cortex préfrontal médian (mPFC)
cortex cingulaire postérieur (PCC).

système 2:

récompense future, larger later
Controlé, conscient, lent
Algorithmique, «froid»
Logique, systématique

Activité indépendante du délai:

cortex préfrontal dorsolatéral
cortex pariétal postérieur
autres régions associées aux fonctions exécutives

évidences 1 système ou compromis

Question 13

Q

Heuristiques

Answer

A

Opérationsmentales automatiques, intuitives et rapides.
Raccourciscognitifs, stratégie décisionnelle imparfaite très souvent suffisante pour bonne décision
->mènent parfois àbiais et erreurs dans prise de décision

1-Heuristiquede représentativité: «estimer probabilité d’appartenance d’un objet à classe d’objets à partir deressemblanceavec cas prototypique».
ex: avocat ou ingénieur

2-Heuristiquede disponibilité: «juger fréquence ou probabilité d’un événement en fonction de facilité de seremémorer exemples de événement ».
ex: homicide vs cancer

3-Heuristique d’ancrage: grandeur (fréquence, probabilité…)d’un nouvel événement estimée à partir d’infosquiêtre pertinentes ounon (ancre).

4-Effet de cadrage : gens réagissent différemment à choix dépendament comment conséquences présentées: résultat positif (gains, % des vies sauvées) ou négatif (pertes, % de morts).

Prend attitude - risquée dans le cadre positif que dans le cadre négatif.
Cadre négatif: tendance à prendre + risques vs cadre positif: + conservateurs

Question 14

Q

Prise de décisions dans contexte social-récompenses sociales

Answer

A

Activation:
-aire tegmentale ventrale
-cortex préfrontal ventromédian
(comme récompenses primaires)

exp: pay-per-view
yeux vers T1-> jus, yeux vers T2-> jus ajustable + image
image: carré gris, singe rang inférieur, supérieur, périnée femelle
Ajustement qté jus T2 pour que T1 et T2 soient équiprobables

résultats:

carré gris et singe rang inférieur: - jus seul qu’avec image donc payer singes pour regarder
> stimuli aversifs=punition sociale
singe rang supérieur et périnée femelle: + jus seul qu’avec image donc payent pour regarder
> renforcements sociaux

Comportements prosociaux (dons charité), contre homo economicus-> récompense sociale

théories:
1-warm-glow: signal de récompense interne-activité striatum ventral

Étude: récompense ou donner à charité
Activation mêmes régions

2-prosocial behavior requires social cognition processes that recognize someone’s needs
Brain regions associated with social cognition (lateral parietal cortex and medial frontal cortex) predict degree to which individual will engage in altruistic behavior

Question 15

Q

Coopération sociale: dilemme du prisonnier (Albert W. Tucker)

Answer

A

2homo economicus auraient intérêt à coopérer, mais en absence de communication, chacun choisira detrahir l’autre
= pire des situations collectives
va contre modèle économie néoclassique de homo economicus

coopération corrèle avec activation noyau accumbens car prédit récompense future

Meilleur algorithme Anatol Rapoport: 1e coopère, puis option de l’adversaire au temps t-1

Question 16

Q

Coopération sociale: jeu de l’ultimatum

Answer

A

Punitionaltruiste: punir quelqu’un qui respectepas normes sociales même si on y perd

selon homo economicus rationnel:

répondant devrait accepter toute offre supérieure à zéro
proposeur,anticipant réponse répondant, devraitfaire + petite offre possible

MAIS
-Répondant acceptentpas n’importe quoi (refuser = censuring antisocial behavior)
-Proposeur proposent paspresquerien (risk of rejection pushes toward fair offers)
30%=magique

Activations:

Insula répondant si offre trop faible, corrélée avec ampleur injustice (système 1)
Cortex préfrontal dorsolatéral droit toujours (système 2, homo economicus)

-> Solution altruiste=système 1 gagne sur 2
=appuie 2 systèmes décisionnels

Exp1: Knoch et al
stimulation cortex préfrontal dorsolatéral droit, TMS
-> augmente probabilité accepter offre injuste
-> + conforme à homo economicus
(pas effet sur impression injustice)

+ cortexpréfrontaldorsolatéraldroit disrupted
->décision + consistent with rational economic models

DONC cortexpréfrontaldorsolatéraldroit supporte pas economic rationality (self-control)

Question 17

Q

Combiner et intégrer de l’information pour prendre une décision

Answer

A

Exp: Iowa Gambling Task, Bechara et Damasio
4 paquets de cartes:
-mauvais: valeur espérée négative
-bons: valeur espérée positive

Résultats:

sujets normaux: évitent mauvais, privilégient bons
lésions préfrontales ventromédianes (syndrome frontal désinhibition): insensibles rétroaction négatives-> sélection mauvais + pas signes physiologiques

DONC normaux apprennent infrequent losses vs lesions apprennent frequent large gains

Exp: Shiv et al
résultats:
-patients>contrôles si bons paquets + risqués mais + payants
CAR contrôle trop aversion pour risque

Conclusion:
lésions dans le cortex préfrontal ventromédian-> problème de comparaison et d’intégration de gains et de pertes

Question 18

Q

Devise commune pour utilité

Answer

A

Exp: Ranger et al, IRMf
1-barres de choco-> combien voudrait payer pour?
2-activité cérébrale quand offre barres de choco

résultats:
-activité cortex prérontal ventromédian postérieur corrèle avec utilité barres