COURS 2 EXAM 2 Flashcards

1
Q

neuroéconomie?

A

une branche de recherche au croisement de l’économieet desneurosciences cognitivesqui étudie l’influence des facteurs cognitifs etémotionnelsdans lesprises de décisions, qu’il s’agisse d’investissement, d’achat, de prise derisqueou deconsommation.

-neuroscience de la cognition et du comportement dans les prises de décisions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Homo economicus?

A

l’homme serait rationnel
-capable de maximiser sa satisfaction en utilisant au mieux ses ressources.
Il sait analyser et anticiper le mieux possible la situation et les événements du monde qui l’entoure afin de prendre les décisions permettant cette maximisation.

-Fondement de l’économie néoclassique. L’économie classique est celle d’Adam Smith et de David Ricardo qui ont vécu la révolution industrielle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

un des pères fondateur de l’école néoclassique?

A

Alfred Marshall

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

critique de Herbert Simon de l’homo economicus

A

l’homo economicus n’est pas un bon modèle de l’humain qui possède une rationnalité limitée (bounded rationality, en anglais)

L’humain est incapable de prendre des decisions optimales selon Herbert Simon. Il prend des decisions limitées par la mémoire finie, par les capacités de projection dans le future limitées.

A fait des modèles informatiques. L’un des fondateurs des sciences cognitives et de l’intelligence artificielle. (participé au collocque du 11 sept)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

valeur espérée?

A

La somme de la probabilité de chaque événement fois la valeur économique qui lui est associée.

-Mais cette notion de valeur espérée est beaucoup trop simple pour décrire (ou prédire) le comportement d’un humain.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

théorie des probabilités par Blaise Pascal

A

-a expliqué ce qu’un être rationnel ferait (prescriptif). Ce que nous ferions si nous étions des homo economicus
-calcul de la valeur espérée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

calcul valeur espérée?

A

: La somme du produit de la probabilité de chaque événement (dans l’exemple du banquier, un événement est de terminer avec un montant de 0.01$—sa probabilité est de 1/22) par la valeur associée à cet événement (ici, trivialement, 0.01$). Donc 1/220.01+11/22+51/22+101/22, etc.

Ici, les événements sont équiprobables donc simplement la moyenne : ~100 600 donc l’offre devrait être ACCEPTÉE parce que supérieure à la valeur espérée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Considérez l’exemple suivant : laquelle des deux roues choisiriez-vous de faire tourner dans un jeu du genre The Price is Right?

La gauche?

A

Pourtant c’est celle dont la valeur espérée est la plus petite (5/2010,000$ + 15/209,000$ = 9,250$ à gauche; versus 5/204$ + 15/2020,000$ = 15,001$ à droite).
(tous les montants sont équiprobables)

La plupart des humains choissent la droite donc la valeur espérée décrit mal la prise de décisions des humains

Limite de la valeur espérée comme modèle descriptif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

qui propose une alternative à la limite de la valeur espérée comme modèle descriptif?

A

La réponse de Daniel Bernouilli

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Paradoxe de St-Petersbourg?

A

Soit le jeu de pile ou face suivant: un joueur et une banque. Le joueur parie une mise initiale. La banque encaisse la mise du joueur. On lance une pièce de monnaie. Si face apparaît, la banque paie 2$ au joueur, et on arrête le jeu. Sinon, on relance la pièce. Si face apparaît, la banque paie 4$, et on arrête le jeu. Sinon, on relance la pièce. Si face apparaît, la banque paie 8$ au joueur, et ainsi de suite.

Les gens misent moins, sont prets à miser pas grand chose pour jouer (environ 20$ mais en fait tt mise est défavorable à la banque)

Quelle somme seriez-vous prêt à miser pour jouer à ce jeu? C’est-à-dire pour que ni la banque ni le joueur ne soient avantagés par ce jeu?

En fait, le jeu est donc défavorable à la banque dans tous les cas, sauf si la mise initiale est infinie.

Pourquoi?

Le montant du gain est égal au dénominateur de la probabilité, dont le numérateur est tjs égal a 1 donc ca donne tjs 1 + 1 +1 … valeur espérée de infinie

Mais malgré ça, personne est prêt à parier une grosse somme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

réponse alternative à la valeur espérée de Daniel Bernouilli?

A

il faut utiliser l’utilité plutôt que la valeur, c’est-à-dire la valeur psychologique (et non économique) d’un événement.

Propose que l’utilité est fonction du logarithme de la valeur (quand la valeur est connue, évidemment).

L’utilité espérée est calculée un peu comme la valeur espérée mais à partir de l’utilité plutôt que la valeur.

En fait, c’est un peu plus compliqué que ça parce que la notion d’utilité de Bernouilli tient compte aussi de la richesse de l’individu… Mais nous n’en tiendrons pas compte dans ce qui suit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

est ce que le calcul de l’utilité est considéré comme faisant partie de l’homo economicus?

A

oui meme sil s’agit dun aspect psychologique
(et que l’homo economicus est faible du côté psychologique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

utilité est indépendante du contexte et des limites cognitives?

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

calcul utilité
ex: roue avec 5 fois 10 000$ et 15 fois 9 000$

A

-faire (log10(montant) *nbfois quil apparait)/nb montant total

ex: (log10(10000)5 + log10(9000)15) / 20

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

travaux fondateurs sur la théorie des perspectives, base de la finance comportementale (neuroéconomie)?

A

Daniel Kahneman

Ses principales découvertes, sur lesanomalies boursières etles biaiscognitifs et émotionnelsqui les causent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

dans la théorie des perspectives; que veut dire perspective?

A

une situation dans laquelle les valeurs économiques et probabilités des événements sont connues. Autrement dit, une situation sans incertitude.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

théorie des perspectives diffère de 2 manières la théorie de l’utilité espérée de Bernouilli
-raison 1

A

1- Dépendance à la référence : gens font des choix en fonction des gains et des pertes par rapport à leur état présent, sans tenir compte de leur richesse. = Sensible à l’histoire locale, pas à l’histoire globale.

Comme pour l’utilité espérée de Bernouilli, il y a compression des effets marginaux mais la pente est plus raide pour les pertes que pour les gains.

Autrement dit, les gens cherchent davantage a éviter les pertes qu’à faire des gains.

Des neurones dopaminergiques semblent déclencher avec une fréquence proportionnelle à celle prédite par cette loi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

théorie des perspectives diffère de 2 manières la théorie de l’utilité espérée de Bernouilli
-raison 2

A

Et 2- les probabilités sont dites «pondérées» :
Surestimation des probabilités faibles et sous-estimation des probabilités élevées.

On calcule la décision basée sur une combinaison de ces probabilités pondérées et de l’utilité dépendante à la référence en multipliant les deux et en sommant tous les termes, comme l’utilité espérée et la valeur espérée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

patron distinctif de comportements selon la théorie des perspectives

A

1- aversion pour le risque quand gain hautement probable

Disons que la probabilité de gain est de 0.95; la probabilité subjective est donc de 0.8, c’est-à-dire à une sous-estimation du gain—et donc à une surestimation de la probabilité de la perte, ce qui particulièrement est aversif—souvenez vous de la dépendance à la référence.

2- aversion pour le risque quand perte peu probable

Disons que la probabilité de la perte est de 0.1; la probabilité subjective est donc de 0.2, c’est-à-dire une surestimation de la perte, ce qui est particulièrement aversif.

3- attirance pour le risque quand gain peu probable

Disons que la probabilité du gain est de 0.1; la probabilité subjective est donc de 0.2, c’est-à-dire une surestimation de la probabilité du gain, ce qui est attrayant.

C’est ce qui nous pousse, par exemple, à acheter des billets de loterie pour le grand bonheur du gouvernement du Québec.

4- attirance pour le risque quand perte hautement probable

Disons que la probabilité de la perte est de 0.95; la probabilité subjective de la perte sera de 0.8, c’est-à-dire une sous-estimation de la perte—et donc une surestimation du gain, ce qui est attrayant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

aversion pour le risque quand gain hautement probable

nous pousse à faire quoi?

A

C’est ce qui nous pousse, à prendre des taux hypothécaires fixes (sont plus chers—trop chers pour l’homo economicus—mais moins risqués contre une envolée des taux d’intérêts) plutôt que variables (sont moins chers—plus proche d’un prix juste selon l’homo economicus—mais plus risqués).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

aversion pour le risque quand perte peu probable

nous pousse à faire quoi?

A

C’est ce qui nous pousse à acheter des assurances contre le vol.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

attirance pour le risque quand gain peu probable

nous pousse à faire quoi?

A

C’est ce qui nous pousse, par exemple, à acheter des billets de loterie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

attirance pour le risque quand perte hautement probable

nous pousse à faire quoi?

A

C’est ce qui nous pousse par exemple à garder des actions boursières perdantes—ou des bitcoins—dans l’espoir que leur valeur augmente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

2 groupes principales de neurones de dopamine?

A

Mais 2 groupes ont les caractéristiques des systèmes modulateurs diffus : l’un d’eux origine de la substance noire (substancia nigra) dans le mésencéphale.

Comme on l’a vu dans le cours sur le contrôle central du mouvement, ces neurones projettent sur le striatum formant le système dopaminergique nigrostrié.

La DA dans le striatum facilite les mouvements volontaires et la dégénérescence de la substance noire est responsable de la maladie de Parkinson.

L’autre, celle qui nous intéresse plus particulièrement aujourd’hui, originedans la partie ventrale du tegmentum mésencéphalique, à côté de la substance noire — l’aire tegmentale ventrale (VTA en anglais).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

axones de l’aire tegmentale ventrale dopaminergiques innervent où?

A

Les axones issus du VTA vont innerver une zone bien définie du télencéphale, comprenant le cortex frontal et certaines parties du cortex limbique. Il s’agit du système dopaminergique mésocorticolimbique.

Impliqué dans le système de «récompense».

VTA est connecté aux noyaux accumbens dans les ganglions de la base (plus spécifiquement dans le striatum ventral), mais aussi à l’amygdale, l’hippocampe et régions corticales comme le lobe frontal médian.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

3 évidences que circuit dopaminergique mésocorticolimbique est impliqué dans le circuit de la récompense
-première? lié à quelle loi

A

1- Toutes les drogues d’abus—sauf possiblement les drogues psychédéliques comme le LSD—rendent l’utilisateur dépendant en modifiant ce circuit.

Souvenez-vous de la loi de l’effet de Thorndike (ou du renforcement dans le conditionnement opérant de Skinner) : une réponse est plus susceptible d’être reproduite si elle entraîne une satisfaction pour l’organisme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

3 évidences que circuit dopaminergique mésocorticolimbique est impliqué dans le circuit de la récompense
-2e évidence?

A

2- Les patients qui ont le Parkinson subissent une dégénérescence de l’autre système dopaminergique, le système nigrostrié (en particulier au niveau de la substance noire). Ceci mène à des problèmes divers dont la difficulté à contrôler certains mouvements.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

traitement parkinson implique souvent de fortes doses de ?

A

Le traitement implique souvent de fortes doses d’un agoniste de la dopamine comme, par exemple, la pramipexole. Habituellement, ceci améliore grandement leur qualité de vie au moins pour un moment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

effets négatifs que développent les gens avec Parkinson qui prennent un traitement agoniste de la dopamine?

-> raison de ces effets?

A

Cependant, on s’est rendu compte qu’environ 5 à 7% des patients traités développaient un problème de jeu pathologique, ce qui est très supérieur à la normale.

Vous avez des exemples dans le tableau ci-dessus. Certains développent aussi des dépendances sexuelles et au magasinage.

Parce que le système dopaminergique—l’autre, le système mésocorticolimbique—est important pour tout ce qui est l’apprentissage lié à des récompenses. Et que les médicaments ne ciblent pas un système en particulier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

3 évidences que circuit dopaminergique mésocorticolimbique est impliqué dans le circuit de la récompense
-3e évidence?

A

Qui plus est, une stimulation de ce circuit sert de renforcement particulièrement puissant.

ex: Dans les années 1950, James Olds et Peter Milner (le mari de Brenda Milner) ont implanté des électrodes dans le faisceau médian du télencéphale (median forebrain bundle) de rats.

Ce faisceau contient des axones en provenance de plusieurs régions du cerveaux mais une proportion importante de ces axones origine de neurones dopaminergiques qui projettent vers le noyau accumbens.

Ont découvert que lorsque les rats recevaient une stimulation dans ce faisceau quand ils effectuaient un certain comportement (e.g. tourner dans un certain coin de la cage), ils se mettaient à faire ce comportement répétitivement, à l’exclusion de tout le reste y compris les comportement alimentaires et sexuels parfois jusqu’à épuisement ou même la mort.

Donc stimulation du faisceau médian du télencéphale est un renforcement très efficace.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

définition renforcement ou la récompense?

A

un stimulus qui augmente la probabilité d’un comportement dans une situation d’apprentissage opérant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

centre du plaisir?

A

Donc stimulation du faisceau médian du télencéphale est un renforcement très efficace.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

renforcement primaire vs secondaire?
renforcement + vs - ?

A

[[Renforcement primaire : récompense qui a valeur adaptative intrinsèque pour l’organisme (e.g. nourriture, sexe)

Renforcement secondaire : pas de valeur adaptative intrinsèque (e.g. argent)

Renforcement positif -> renforcement administré

Renforcement négatif -> punition retirée]]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

L’effet de la stimulation du faisceau médian du télencéphale est proche de quelle notion en neuroéconomie?

A

utilité

-En fait, très proche de l’idée de la dépendance à la référence de Kahneman et Tvserky (parce que dépendant de l’histoire locale, seulement).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Héroïne, nicotine et cocaïne agissent sur des systèmes de neurones utilisant différents types de neurotransmetteurs.

-lesquels pr héroine?
-lesquels pr nicotine?
-lesquels pr cocaine?

A

Les peptides opioïdes pour l’héroine.

Les systèmes cholinergiques pour la nicotine.

Les systèmes dopaminergiques pour la cocaïne.

35
Q

l’origine de processus lié à l’addiction. Qu’ont en commun héroïne, nicotine et cocaïne?

A

Les expériences d’auto-injection intracérébrale de ces drogues ont permis de caractériser les régions où l’agent agit pour produire une addiction.

Pour l’héroïne et la nicotine, c’est l’aire tegmentale ventrale où se trouve les corps cellulaires des neurones dopaminergiques qui projettent vers le cerveau.

Ces neurones expriment sur leur membrane des récepteurs nicotinique et aux opiacés. Stimulent la libération de dopamine.

Pour la cocaïne, c’est plutôt le noyau accumbens, qui est l’une des cibles majeures des neurones de l’ATV. Prolonge la libération de dopamine en bloquant la recapture.

Donc toutes ces drogues stimulent ultimement le noyau accumbens.

36
Q

Dopamine: le neurotransmetteur du plaisir alors?
Dans une expérience classique, Berridge et Robinson (1998) ont montré que ce n’était pas le cas.

expérience?

A

Ont injecté une neurotoxine spécifique aux neurones dopaminergiques (6-hydroxydopamine ou 6-OHDA) dans noyaux accumbens de rats causant de d’importantes lésions au système dopaminergique mésocorticolimbique.

Les rats sont devenus aphagiques, c’est-à-dire qu’ils ont cessé de s’alimenter.

Cependant, ces rats montraient une réponse hédonique normale au sucrose sur la langue (goût sucré; renforcement primaire; sortent la langue et se lèchent les pattes avants) et à la quinine sur la langue (goût amer; punition primaire (souvenez-vous plusieurs poisons sont amers); ouvrent la bouche, se frottent le menton, nettoient leur visage).

Sous-groupe Ns : 98% du striatum détruit.
Sous-groupe Ac : 99% du noyau accumbens lésé.

-> Dopamine serait impliquée dans le désir, la motivation à obtenir un renforcement ou à éviter une punition.

Pas dans le plaisir. Aujourd’hui, on pense plutôt que les neurones sensibles aux opiacés et aux endocannabinoïdes seraient associés au plaisir.

37
Q

noyau accumbens est activé par tout un ensemble de stimuli qui ont quoi

A

une pertinence motivationnelle

Par exemple, du jus, de l’argent, des signaux sociaux, des dons à son organisme de charité préféré, ou même la punition d’un rival. Ce qu’on en commun toutes ces situations, c’est le renforcement d’une association désirable.

38
Q

qu’est ce qui se produit dans le phénomène de dévaluation de la récompense (reward undermining, en anglais).

A

Toute perte de motivation entraine une diminution de l’activité dans le système dopaminergique.

39
Q

-étude Murayama et al. ont entrainé des sujets a arrêter un chronomètre à un moment précis
-motivation intrinsèque, plaisant

-effet de la dévaluation d’une récompense?

A

Si bien que les sujets «contrôle» qui n’étaient pas payés montraient une activation hémodynamique du striatum ventral associée à leur succès dans le jeu pendant les deux séances de scanning.

Un autre groupe de participants, les sujets «récompense» étaient payés selon leur performance lors de la première séance mais pas la seconde.

Ces sujets ont appris une association entre un comportement et une récompense monétaire.

Motivation extrinsèque.

Comme le groupe contrôle lors de la 1ière séance (striatum ventral encore plus activé) mais plus rien lors de la 2ième pourtant identique chez les deux groupes de sujets.

Perte de motivation extrinsèque.

C’est le phénomène de dévaluation de la récompense.

40
Q

situations presque gagnantes ont une valeur de récompense anormalement élevée dans les jeux de hasard?

A

true

«near-miss» (combinaisons presque gagnante) -> valeur de récompense anormalement élevée
que «full-miss» (combinaison clairement perdante)

C’est ce qu’ont montré Clark et al. (2009)…

41
Q

étude de Clark et al. machine à sous

-activation de quelle régions davantage pr quel type de situation?
-davantage marqué pour quel type d,individus?

A

Striatum ventral activé par des combinaisons gagnantes plus que par des combinaisons perdantes.

Mais aussi plus par des combinaisons presque gagnantes que clairement perdantes.

Et c’est encore plus marqué chez les individus qui ont des problèmes de jeu.

Surtout les adolescents et jeunes adultes entre 14 et 22—fonctions exécutives immatures—

et les personnes agées—cortex préfrontal ventromédian micro-lésé.

42
Q

Qu’encodent les neurones de l’aire tegmentale ventrale exactement?

A

pas la récompense elle-même mais l’erreur de prédiction de la récompense.

Dans une série d’expériences classiques, Wolfram Schultz et ses collègues à la University of Cambridge ont étudié comment les neurones de l’aire tegmentale ventrale changent leur fréquence de déclenchement en réponse à des récompenses.

Des singles éveillés avec des électrodes implantées dans le VTA permettant des enregistrements électrophysiologiques unitaires ont appris à appuyer sur un levier quand un voyant lumineux s’allumait pour recevoir une gorgée de jus (renforcement positif primaire).
Au début de la tâche, sans indice ici (mais serait pareil avec un indice avant apprentissage de l’association entre cet indice, la réponse et la récompense—dans les deux cas il s’agirait d’une récompense inespérée) : récompense (jus) suivit d’une forte augmentation de la fréquence des potentiels d’action de certains neurones du VTA.

43
Q

étude de Schultz et al.
les singes encodent la récompense?

A

Alors que les singes apprennent la tâche, c’est-à-dire qu’ils apprennent à associer l’indice—la lumière—avec la réponse—appuyer sur un levier—puis la récompense—la gorgée de jus—les mêmes neurones du VTA répondent de moins en mois à la récompense et de plus en plus à l’indice annonçant la récompense

(indice qui n’est pas un renforcement en lui-même mais est prédictif d’un renforcement primaire).

Réponse à un indice prédictif dun renforcement

Finalement, si un renforcement espéré ne suit pas la réponse de l’animal à l’indice, la fréquence de ces neurones du VTA diminue sous leur niveau de base au moment prédit de la récompense.

*ici pas de récompense -> diminue quand la récompense est pas présentée par la suite

44
Q

étude Schultz et al. équation de l’erreur de prédiction de la récompense?

A

1er terme = récompense actuelle au temps t

2e terme = récompense prédite dans un futur rapproché (au temps t+1)

3e terme = récompense prédite (au temps t)

= donne l’erreur de prédiction de la récompense au temps t à un moment précis

L’erreur de prédiction de la récompense (au temps t) est égale
à la récompense actuelle (au temps t)
plus la récompense prédite dans un futur rapproché (au temps t+1)
moins la récompense prédite (au temps t).

45
Q

étude Schultz et al. équation de l’erreur de prédiction de la récompense -> similaire à quelle idée de Kahneman et Tversky?

A

Très similaire à l’idée de Kahneman et Tversky que l’utilité dépend du point de référence de départ. Histoire locale seulement.

46
Q

D’autres études par le groupe de Schultz ont montré que la fréquence de déclenchement de ces neurones est proportionnelle à quoi? (2)

A

que la fréquence de déclenchement de ces neurones est proportionnelle à la probabilité de la récompense (on en verra un exemple tout à l’heure) et à l’utilité de la récompense.

47
Q

différentes situations -erreur de la prédiction de la récompense
1.premier panneau/image: aucun indice présenté pour annoncer une récompense et la récompense n’arrive pas à un moment qu’on peut prédire (temps variable bcp entre les récompenses)

A

= récompense tjs une surprise pour l’animal -> juste le premier terme dans l’équation qui est positif -> erreur de prédiction de la récompense/augmentation activation
*cette situation on aurait la mm situation si yavait un indice ici mais qu’il n’y a pas encore eu un apprentissage que l’indice est lié à la récompense (avant association)

48
Q

différentes situations -erreur de la prédiction de la récompense
2.2e panneau: quand indice est présenté, ya pas de récompense donné (1er terme à 0); pas de récompense prédite (3e à 0) mais l’animal a appris qu’un indice était annonciateur d’une récompense 1 sec plus tard (2e terme positif)

-situation 1 sec plus tard?

A

= erreur de prédiction de la récompense positif = activation neurones suite à la présentation de l’indice

-1 sec plus tard quand l’animal reçoit la récompense annoncée par l’indice; premier terme positif, récompense prédite (donc 3e terme positif donc ya un – devant donc -), pas d’annonce d’une prochaine récompense donc 2e terme de 0 = aucune activation quand l’animal reçoit la récompense (il s’y attendait)

49
Q

3.3e cas de figure: présentation indice, animal a appris que indice est prédicteur d’une récompense -> quand indice présenté

-1 sec plus tard si on truc l’animal et on lui donne pas de récompense comme il sen attendait?

A

-> erreur de prédiction récompense positive

1 sec plus tard -> on truc l’animal et on ne lui donne pas de récompense comme il s’en attendait, ya une erreur de prédiction (terme 3 positif (avec le – devient -), premier terme de 0, 2e terme de 0 ) = erreur de prédiction de la récompense NÉGATIVE (activation plus faible des neurones qu’au niveau de repos)

50
Q

Il est possible de voir des signaux EEG qui corrèlent avec l’erreur de prédiction de la récompense.

Gehring et Willoughby (2002) ont identifié une composante ERP qui varie en fonction d’un gain inattendu ou d’une perte inattendue dès environ 200 ms.

A

Un algorithme de localisation de source indique que cette composante origine probablement d’un dipôle dans le cortex cingulaire antérieur, important pour les fonctions exécutives.

Les neurones du VTA projettent dans plusieurs régions du cerveau entre autre dans les ganglions de la base (noyaux accumbens) et dans le cortex préfrontal ventromédian. Donc possible que cette composante ERP origine en fait du VTA.

Il a été proposé que ce signal d’erreur de prédiction de la récompense module l’information essentiellement de tout le cerveau.

51
Q

Il a été proposé que ce signal d’erreur de prédiction de la récompense module l’information essentiellement de tout le cerveau.
->Une évidence supportant cette hypothèse vient d’une étude récente réalisée par Vickery et al. (2011) en IRMf et ayant utilisée la technique d’analyse de MVPA (multivoxel pattern analysis).

-L’idée de cette technique d’analyse ?

A

qu’on regarde si l’activité dans un ensemble de voxels (à l’intérieur d’une sphère d’un rayon donné, par exemple) peut discriminer—décoder—plusieurs conditions expérimentales.

52
Q

est-ce que les neurones dopaminergiques signalent nécessairement l’erreur de prédiction de la RÉCOMPENSE?

A

Matsumoto et Hikosaka (2009) ont montré que certains oui mais pas tous.

D’autres neurones semblent encoder l’erreur de prédiction de l’utilité, peu importe sa valence (positive ou négative).

Voici la réponse d’un neurone dans le striatum ventral d’un singe dans une étude de Matsumoto et Hikosaka qui s’inspire du paradigme utilisé par Schultz et collègues (mais pas de réponse du singe, ici).

Notez aussi la réponse intermédiaire pour la probabilité d’un renforcement/punition de 50%.

-un indice annonce un renforcement -> en fonction du % prédictif de l’indice, le neurone du striatum ventral est plus ou moins actif

-dans lautre expérimentation, suivi dune punition; ce neurone répond bcp à un indice qui prédit à un haut niveau de prédiction

= répond autant à la punition ou récompense

53
Q

étude Vickery et al. jeu matching pennies effet sur cerveau?

A

-signal d’intérêt général pour le cerveau/ envoyer partout dans le cerveau

-les participants devaient jouer à un jeu; le joueur se voit assigner un nom pile ou face à chaque essai, ya un écran, y joue avec un participant simulé -> le participant gagne si 2 pile ou 2 face et si cest différent, il perd (aucun choix, jeu passif)

-ya aucun indice et ya une récompense donnée imprédictible à prévoir -> erreur de prédiction de la récompense -> activité des neurones dopaminergiques de l’ATV
-meme si jeu aléatoire, quand essai est gagnant, il reçoit de l’argent -> il ne peut prévoir la récompense

54
Q

l’expérience de Matsumoto et Hikosaka est un exemple de quoi?

A

La neuroéconomie s’intéresse aussi à la prise de décision dans des situations comportant une part d’incertitude à propos de ce qui arrivera.

Cette expérience en est un exemple

55
Q

Une décision qui a plusieurs conséquences avec des probabilités connues ou estimables comporte un élément de risque.
vrai ou faux

A

vrai

On en a parlé un peu dans le calcul de l’utilité espérée et de la théorie des perspectives

56
Q

le risque est habituellement estimé par ( ) qui est normalisée par la taille de ces gains et pertes

A

Le risque est habituellement estimé par la variance (les variations des gains et pertes) normalisée par la taille de ces gains et pertes (e.g. la somme des valeurs absolues de ces gains et de ces pertes).

E.g. pile = 0$ et face = 20$ semble plus risqué que pile = 10 000$ et face = 10 020$, même si la variance est la même (100$ ici). Mais 100/20&raquo_space; 100/20020.
Plus de risque dans la première condition

57
Q

Dans une méta-analyse de Mohr et al. (2010) ont identifié quatre régions cérébrales impliquées dans l’évaluation du risque :

A

cortex préfrontal dorsolatéral,
cortex préfrontal dorsomédian,
cortex pariétal postérieur
et insula antérieure.

58
Q

Insula plutôt discuté dans le cours sur les émotions (particulièrement le dégoût).

Dans la prise de décision, l’insula antérieure serait impliquée dans ?

A

l’aversion au risque.

59
Q

Une situation comporte de l’ambigüité—et non du risque—si la probabilité des différents événements possibles ne peut pas être estimée.

En laboratoire, on produit de l’ambigüité en éliminant la possibilité d’évaluer les probabilités.

Une étude Hsu et al. (2005) montre que l’ambigüité active quelle région plus que le risque?

A

cortex latéral orbitofrontal

60
Q

En général, on juge une récompense à venir comme ayant moins d’utilité qu’une récompense immédiate.
vrai ou faux?

A

true

C’est le «temporal discounting» ou notre tendance à ignorer une récompense future.

Il s’agit d’une perte hyperbolique en fonction du temps.

E.g. Sujets préfèrent habituellement 100$ maintenant à 110$ dans une semaine.
Mais pas 100$ dans 46 jours à 110$ dans 53 jours.

Une autre explication de ce phénomène est que deux systèmes décisionnels sont en compétition.

Quand on préfère«larger, later», l’un de ces systèmes gagne; quand on préfère «smaller, sooner» c’est l’autre système qui gagne.

61
Q

modèle à deux systèmes?

A

développé récemment notamment par Chaiken et Trope (1999); Smith et De Coster
-Daniel Kahnman (2011), par exemple, a défendu dans un livre récent une version assez générale de ce modèle à deux systèmes.

Une récompense immédiate engage le système 1 qui l’emporte habituellement sur le système 2. Ça expliquerait la préférence pour les récompenses «smaller, sooner».

Les récompenses futures engagent le système 2 et n’intéresse pas le système 1. Ça expliquerait la préférence pour les récompenses «larger, later».

Il existe certaines évidences en neuroimagerie pour le modèle à deux systèmes.

62
Q

système 1 caractéristiques?

A

Automatique, rapide, inconscient
Heuristique, «chaud»
Émotions, stéréotypes

63
Q

système 2 caractéristiques?

A

Controlé, concscient, lent
Algorithmique, «froid»
Logique, systématique

64
Q

McClure et al. (2004). Cherchaient des endroits répondants à des recompenses indépendamment du moment où elle est promise

Les différentes regions impliquées ds système 1 devraient avoir réponses dépendantes du moment auquel est promise la recompense vs celles au système 2 devraient répondre indépendamment (selon eux/hypotheses)

-activité de quelles régions dépendantes du délai? -liée à quel système?

A

Activité dépendante du délai dans le striatum ventral (VStr), cortex préfrontal médian (mPFC) et cortex cingulaire postérieur (PCC).

Système 1.

65
Q

McClure et al. (2004)
-quelles régions associées à activité indépendante du délai? -lié à quel système?

A

Activité indépendante du délai dans le cortex préfrontal dorsolatéral, cortex pariétal postérieur et d’autres régions associées aux fonctions exécutives.

Système 2.

Aussi, si on rTMS sur la région préfrontal dorsolatéral — on la potentialise — on favorise les décisions de type «larger, later» (système 2).

Cependant, les évidences les plus récentes supportent plutôt un modèle a un seul processus. Donc modèle à deux systèmes demeure controversé.

66
Q

heuristiques définition?
-associées à quel système?

A

Lesheuristiquessont des opérationsmentales automatiques, intuitives et rapides. Associées au système 1.

Cesraccourciscognitifs sont utilisés par lesindividus afin de simplifier leurs opérations mentales dans le but de répondreaux exigences del’environnement.

67
Q

dans le jeu du banquier, la solution prescrite et optimale est calculer la valeur espérée mais cest pas ce que les participants font. Se concentrent sur les gros montants. Il y a 4 gros montants, 22 valises à éliminer—beaucoup—, donc je refuse.
-ils utilisent quoi?

A

Lesheuristiques permettent aux individus un gain de temps car en les utilisant,ils ne tiennent pas compte de toute la complexité des informationspertinentesà la situation. Elles sont habituellement suffisamment bonnes (good enough)…

Ici, cette heuristique est souvent en accord avec la valeur espérée parce que plus il y a de gros montants, plus la valeur espérée sera grande.

Cependant, elles mènent parfois à desbiais et des erreurs dansla prise de décision.

68
Q

Les quatre principales heuristiques qu’ont étudiées Kahneman et Tversky sont :

A

lareprésentativité
deladisponibilité
del’ancrage
du cadrage.

69
Q

1- L’heuristiquede représentativité ?

A

une règle qui « consiste à estimer laprobabilitéd’appartenance d’un objet à une classe d’objets à partir de saressemblanceavec un cas prototypique de cette classe ».

E.g.En 1973,TverskyetKahnemanont étudié ce phénomène en demandant àdes sujets de lire une brève description d’un individu pris d’ungroupe de 100personnes.

La moitié des sujets étaient informés que le groupe de 100 personnesétait composé de 30 % d’avocats et 70 %d’ingénieurs (le taux debase) et l’autre moitié que la composition du groupe était de 70 %d’avocats et de 30 % d’ingénieurs.

La description lue par lessujetscorrespondait au stéréotype de l’ingénieur.

La tâche des participants étaitd’estimer la probabilité de cet individu d’être un ingénieur plutôt qu’unavocat. Quel que soit le taux de base fourni aux sujets, ceux-ci ont estimé quel’individu décrit avait une grande probabilité d’être ingénieur : il n’yavaitdonc pas de différence significative entre les deux groupes departicipants.

Par contre, lorsque les sujets n’avaient pas de description àleurdisposition, ils tenaient effectivement compte du taux de base.TverskyetKahnemanenont conclu que, lorsque les sujets disposaient d’unedescription de l’individu,ils avaient utilisé l’heuristique de représentativité en ignorant le taux debase fourni.

70
Q

2- L’heuristiquede disponibilité ?

A

« consiste à juger la fréquence ou la probabilité d’unévénement en fonction de la facilité avec laquelle on peut seremémorer desexemples de cet événement ».

Parexemple, les sujets de l’étude deSlovic,Fischoffet Liechtenstein croyaient que mourird’un homicide était plus fréquent que mourir d’uncancer de l’estomac. Or ledécès par cancer de l’estomac est 17 fois plus fréquent que l’homicide.

Cependant, les cas de meurtre sont plusfacilement accessibles en mémoiregrâce, entre autres, aux médias.

71
Q

3- Dansl’heuristique d’ancrage?

A

la grandeur (fréquence, probabilité…)d’un nouvel événement est souvent estimée à partir d’informationsquipeuventêtre pertinentes ounon (ancre).

E.g. DansTverskyetKahneman(1974), les sujets devaient tout d’abordtourner une roue de la fortune truquée. Ils recevaient alors un pourcentage quiétaitsoit 10 % soit 65 %.

Ensuite, ils devaient évaluer si lepourcentage était inférieur ou supérieur à celui du nombre de pays africainsreprésentés auxNationsunies.

Enfin, ils devaient en estimer le pourcentage exact.

Les résultatsmontrent que l’estimation estinfluencéepar le pourcentage fourni par la roue de la fortune—l’ancre. L’estimation deceux dont l’ancre était de 10 % tournait autour de 25 % tandisquel’estimation de ceux qui avaient reçu 65 % était aux alentours de45 %.

C’est environ 28% en réalité.

72
Q

4-heuristique de cadrage?

A

L’effet de cadrage : les gens réagissent différemment à un choix tout dépendant comment ses conséquences sont présentées. Comme ayant un résultat positif (e.g. gains, % des vies sauvées) ou négatif (pertes, % de morts).

En bref, on adopte une attitude moins risquée dans le cadre positif que dans le cadre négatif.

E.g. : Vous êtes un médecin essayant de stopper une maladie mortelle avec 2 vaccins : le premier est un vaccin qui va sauver 200 des 600 villageois exactement (vaccin A), et un vaccin qui a une probabilité de 33% de sauver tout le monde et 67% de sauvez personne (vaccin B).

Lequel choisirez-vous?

La plupart choisissent le vaccin A.

Maintenant supposez que vous avez les deux options thérapeuthiques suivantes : un traitement qui va tuer 400 des 600 villageois exactement (traitement C) et un traitement qui a une probabilité de 67% de tuer tout le monde ou de 33 de ne tuer personne. Lequel choisiriez-vous?

La plupart choisissent le traitement D.

Notez que le vaccin A est équivalent au traitement C; et le vaccin B est équivalent au traitement D.

La seule différence est le cadrage : sauvez vs. tuer des individus.

Quand le cadre est négatif, on tendance a etre plus risqué

73
Q

Les récompenses sociales—sourires, approbation d’autrui (pensez aux “thumb’s up”), de beaux visages—sont omniprésentes dans notre société—c’est le fondement-même de Facebook entre autres—et produisent des réponses robustes dans quelles régions du cerveau?

A

dans l’aire tegmentale ventrale

cortex préfrontal ventromédian.

74
Q

étude
Deaner et al. (2005) ont entrainé des singes mâles à bouger leurs yeux vers T1 pour obtenir du jus ou vers T2 pour obtenir une quantité de jus ajustable + une image d’un singe, par exemple (plus spécifiquemnt, 1- d’un carré gris, 2- d’un singe du même groupe social de rang inférieur, 3- d’un rang supérieur ou 4- du périnée d’une femelle). [cliquer]

Ont ajusté la quantité de jus pour que T1 et T2 soient équiprobables.

Jus dans T1 – jus dans T2 = utilité des différents groupes d’images!

Tâche de «pay-per-view».

Mesure la valeur de quantité de jus en fonction de l’image

A

Ce qui est négatif dans l’histogramme (carré gris [?!?] et singe d’un rang inférieur) correspond aux images qu’il fallait payer les singes pour qu’ils les regardent! Autrement dit, moins de jus seul que de jus avec l’image. Donc ces images étaient aversives.

Ce qui est positif correspond aux images que les singes étaient prêts à payer pour voir (singe mâle d’un rang supérieur [?!?] et, surtout, le périnée d’une femelle). Renforcements sociaux.

75
Q

Comportements prosociaux (altruistes?) comme donner aux organismes de charité peuvent aussi constituer une récompense sociale robuste.

(Remet en question l’homo economicus qui est égoïste.)

Ces comportements s’accompagnent d’un «warm glow» qui est un signal de récompense associés à une activité dans des régions comme le ?

A

striatum ventral

76
Q

dilemme du prisonnier?

A

énoncé en 1950 parAlbert W. Tucker àPrinceton,caractérise enthéorie des jeux une situation où deuxhomo economicus auraient intérêt à coopérer, maisoù, en l’absence de communication entre les deux joueurs, chacun choisira detrahir l’autre—de faire cavalier seul.

l’utilité espérée du joueur 1 s’il coopère et s’il fait cavalier seul. Si les deux font cavalier seul. Obtiendront une utilité de 1.

77
Q

La coopération dans une versionrépétitive du jeu corrèle avec une activation de quelles régions du cerveau?

A

desnoyauxaccumbens.

Parce qu’une coopération estprédictive d’unerécompense future.

78
Q

Robert Axelrod a organisé une compétition dans les années 1980 d’une version répétitive du jeu et l’algorithme d’Anatol Rapoport— «tit for tat» ou «œil pour œil, dent pour dent», en français — le plus simple de tous les algorithmes soumis à la compétition a gagné :

A

commence par coopérer et ensuite, au temps t, opte pour l’option de ton adversaire au temps t-1.

79
Q

jeu de l’ultimatum: punition altruiste

A

Punir quelqu’un qui ne respectepasles normes sociales même si on y perd.

Lejeude l’ultimatumse jouede la manière suivante : une première personne (proposeur) se voitattribuer une certaine somme d’argent, et doit déciderquelle part elle gardepour elle et quelle part elle donne à une seconde personne (répondant). Lerépondant doit alors décider si elle accepteou refuse l’offre. Si elle accepte, chacun reçoit ce que l’offre stipule. Si ellela refuse, aucun des deux individus ne reçoit d’argent.

Le modèle standard de l’homo economicuspostule que les individus poursuivent leur intérêt matériel individuel etagissent de manière rationnellepour atteindre leurs objectifs. Dans un tel casde figure, le répondant devrait accepter toute offre supérieure à zéro de lapart du proposeur, et le proposeur,anticipant la réponse du répondant, devraitfaire la plus petite offre possible.

Encoreunefois, nous ne sommes pas des homoeconomicus. Comme répondant, nous n’acceptonspas n’importe quoi. Et commeproposeur, nous ne proposons paspresquerien.

Le pourcentage «magique» est ~30%.

NOTES COURS:
Jeu ultimatum: 2 joueurs; proposeur et répondeur
-le proposeur choisit une proportion du 10$ et donne le reste au répondant
-ensuite, le proposeur décide cmb il garde et le répondeur décide si ca lui convient ce qu’il a reçu; si ca lui convient -> il dépose sinon aucun des 2 à l’argent
-joué à répétition
-découverte, avec proposition de 2$ au répondant, il aurait refusé l’offre (vrai pratiquement pour tous les montants/proportion du montant total; si le répondant reçoit pas 30%, l’offre est refusée)
Ce qui est irrationnel car nimporte quel montant est mieux que rien
-punition altruisme; peut bénéficier au répondant

80
Q

région d’un répondant qui s’active quand unproposeurluipropose trop peu disons 20% (système 1 de la théorie des deux systèmes). Son activité est corrélée avec l’ampleur de l’injustice.

A

insula

81
Q

région qui ) s’active peu importe si l’offre est acceptée ou pas (système 2 de la théorie desdeux systèmes)?

A

cortex préfrontal dorsolatéral droit

82
Q

étude Knoch et al.
ont montré que de stimuler le cortex
préfrontaldorsolatéraldroit à l’aide de TMS (stimulation magnétique transcrânienne)—potentialisation ici—augmente la probabilité d’accepter une offre injuste—25% du montant donné au proposeur offert au répondant—c’est-à-dire le rend plus conforme à l’homo economicus—mais n’a pas d’effet sur l’impression de justice de cette offre.

A

vrai

83
Q

Iowa Gambling Task ?

A

on présente 4 paquets de cartes virtuels sur un écran d’ordinateur aux participants.

On leur dit que chaque paquet contient des cartes qui les récompenseront ou les pénaliseront en argent.

Le but du jeu est de gagner autant d’argent que possible.

Les paquets diffèrent les uns des autres en termes de valeur espérée. Ainsi, certains paquets sont de «mauvais paquets» (100$ par carte habituellement mais rarement une perte très importante de disons -10 000$, ce qui résulte en une valeur espérée négative), et les autres de «bons paquets» (50$ par carte habituellement et parfois de petites pertes de disons -10$, ce qui résulte en une valeur espérée positive).

84
Q

étude Bechara et Damasio et collègues
-patients avec des lésions préfrontales ventromédianes—souffrant du syndrome frontal de déshinibition -> performance au Iowa Gambling Task?

A

étaient relativement insensibles à des rétroactions négatives dans ce jeu et sélectionnaient souvent les «mauvais paquets».

Qui plus est, ces patients ne montraient pas les même signes physiologiques (e.g. réponse galvanique de la peau) quand ils choisissaient ces «mauvais paquets».

Interprété comme si ces patients ignoraient les signaux physiologiques d’alarme ou de risque.

Mais le risque n’est pas toujours corrélé avec la valeur espérée…

85
Q

expérience de Shiv et al.
-patients avec lésions préfrontales ventromédianes
-performance au Iowa Gambling test?

A

ces patients performaient mieux que des contrôles dans une version de la tâche dans laquelle les «bons paquets» étaient plus risqués mais plus payant et les «mauvais paquets» étaient moins risqués mais moins payant.

Les sujets contrôle ont trop d’aversion pour le risque pour des situations comme celles-ci.

Bref, ces résultats suggèrent un problème de comparaison et d’intégration de gains et de pertes après des lésions dans le cortex préfrontal ventromédian.

86
Q

étude Rangel et al. ont montré que chez l’humain en IRMf avec plusieurs paradigmes que quelle région utilise une devise commune?

A

cortex préfrontal ventral

Par exemple, des collations abordables comme des barres de chocolat sont montrées aux participants. On leur demande : combien vous voudriez payer pour ces collations (mesure de l’utilité)? Ensuite, on enregistre l’activité du cerveau quand on offre certaines de ces collations aux mêmes participants. Cette activité dans cortex préfrontal ventromédian (postérieur) corrèle avec l’utilité des collations.