Cours 11 Les théories du conditionnement instrumental Flashcards
Clark Hull
- Il propose le concept de l’homéostasie comportementale
- Hull assume l’existence de comportements non-observables.
- La théorie de l’apprentissage S-R souvent qualifiée de moléculaire, parce qu’elle postule que le comportement consite en une longue châine de réponses spécifique, associées à des stimulus spécifiques.
- Tous les renforcateurs sont associés directement ou indirectement à la réduction de pulsions.
- Bémol, ce n’est pas tout les renforcateurs qui réduisent les pulsions
- L’apprentissage fut sa troisième carrière en psychologie:
- Psychométrie (1920)
- Hypnose (1933)
- La traduction d’un ouvrage de Pavlov va l’initier aux concepts du conditionnement.
La Tendance (Drive)
(motivation)
- Homéostasie physiologique: état dans lequel tous les systèmes biologiques de l’individu sont en équilibres ;
- Tout organisme est motivé à maintenir ou restaurer cet équilibre :
- un déséquilibre de l’homéostasie crée un “besoin”;
- ce besoin a un effet psychologique : la Tendance (ou “Drive”) (motivation).
- Certains renforçateurs primaires réduisent la tendance.
- Théorie S-R stricte, l’apprentissage consiste en l’établissement de liens entre des stimuli spécifiques et des réponses spécifiques.
E = (H x D)
- E = la force du comportement observable
- H = “Habit” ou apprentissage/conditionnement
- D = “Drive” ou tendance (motivation de besoin)
E = (H x D) - (nIc +Ic)
E = la force du comportement observable
H = “Habit” ou apprentissage/conditionnement
D = “Drive” ou tendance (motivation de besoin)
nIc = “Inhibition non-conditionnée” (la fatigue)
Ic = “Inhibition conditionnée” (la peur)
Néobéhaviorisme
- Est un type de béhaviorisme qui fait appel à des variables intermédiaires (événement intérieurs processus physiologique comme la faim), sous la forme de processus physiologiques hypothétiques, afin d’expliquer le rapport entre le milieu et le comportement.
Le béhaviorisme de Tolman
- Rejette l’approche Néobéhavioriste de Hull.
- Plus utile d’analyser le comportement au niveau molaire c’est à dire plus large.
- Tout est d’avantage que la somme de ses parties
- Effort dirigé plutôt qu’une longue chaîne de liens distinct.
- Le comportement est plus qu’une chaine d’action ponctuelle associés à des stimulus ponctuels.
La théorie de la réduction des pulsions
- Selon cette théorie, un événement est renforçant dans la mesure ou il se trouve associé à la réduction d’un type quelconque de pulsion physiologique.
- Ainsi une privation de nourriture entraine une pulsion de faim, qui pousse l’animal à chercher de la nourriture. Une fois qu’il a mangé de la nourriture la pulsion faiblit
- En même temps, le comportement ayant précédé cette baisse de la réduction des pulsions et ayant abouti à l’obtention de la nourriture est automatiquement renforcé.
Motivation incitatrice
- La motivation issue d’une certaine propriété du renforçateur, par opposition à une pulsion interne, est qualifiée de motivation incitatrice.
- Forme de stimulation sensorielle qui joue un rôle très renforçant.
- Ex: écouter de la musique, jouer à un jeu vidéo
Une motivation créée par le renforçateur lui-même indépendant de sa capacité objective à satisfaire le besoin à l’origine de la Tendance.
–p.e. la crème glacée peut nous faire manger alors que nous n’avons plus vraiment faim
Théorie dite du “Push” et du “Pull” (très bien connue des gens de marketing)
–“Push”: la motivation vient de l’intérieur (p.e. la Tendance);
–“Pull” : la motivation vient de l’extérieur (p.e. l’incentive).
Principe de Prémack
- Un comportement très probable peut servir à renforcer un comportement peu probable.
- Par exemple lorsqu’un rat a faim, l’action de manger, soit le comportement très probable (CTB), (non la roue) peut server à renforcer le comportement cible consistant à courir dans une petite roue, soit le comportement peu probable (CPP). Le rat coure dans la roue pour accèder à la nourriture.
- Fondé sur la notion selon laquelle un renforçateur peut souvent êre envisagé comme un comportement plutôt que que comme un stimulus.
- Au lieu de dire que presser le levier est renforcé par l’obtention de la nourriture (un stimulus), on peut dire que presser le levier est renforcé par l’acte de manger.(un comportement)
- Le processus de renforcement peut être conceptualisé comme une suite de deux comportements: d’abord le comportement faisant l’objet du renforcement et ensuite le comportement agissant comme renforcateur.
- Si on observe la fréquence de divers comportements il est possible de déterminer si l’un deux peut servir de renforçateur à l’autre.
*
L’hyptothèse de la déprivation de réponse
(Timberlake et Allison)
- Postule qu’un comportement peut servir de renforçateur à deux conditions: l’accès à ce comportement est restreint, et sa fréquence se situe donc sous son niveau préférentiel
- Postule l’existence d’un niveau optimal de réponse qu’un sujet s’efforce de maintenir.
- Le niveau préférentiel d’une activité correspond à son niveau de référence lorsque le sujet peut librement pratiquer cette activité. (exemple du rat qui aime courrir pendant 1 heure et on réduit a 15 minute et doit peser sur le levier pour avoir plus d’accès)
- Tout comportement produit à un niveau inférieur à son niveau optimal peut être un renforçateur.
- Ainsi, si le niveau optimale de préférence d’un individu est d’étudier 20 % du temps et qu’il ne peut étudier que 10 %, alors pouvoir étudier plus que 10 % pourra servir à renforcer un autre comportement.
- « Ce qui constitue un renforçateur change avec le contexte. »
L’approche comportementale axée sur le point de satiété
- Un sujet ayant libremet accès à de multiples activités va répartir son comportement de façon à maximiser le renforçement global.
Tolman et l’apprentissage latent (expérience de Crespi)
- Dans un labyrinthe, des rats sont entraînés à courir pour 1 (vert), 16 (jaune) ou 256 (rouge) pilules de nourriture (phase 1) ;
- Lors de la phase 2, tous les rats reçoivent 16 pilules.
- Résultat : la modification de la taille de la récompense influence immédiatement la vitesse de parcours.
- Conclusion : Clairement les rats du groupe vert avaient appris avant
- C’est l’apprentissage laten
Rôle de l’attention dans le conditionnement
- On ne peut apprendre que les choses auxquelles on prête attention.
- L’attention filtre l’énorme quantité d’information normalement disponible dans l’environnement
Le modèle de Mackintosh
- Mackintosh (1975) propose un modèle alternatif à Rescorla dans lequel l’attention du sujet à un SN/SC est liée à la capacité du SN/SC à prédire le SI (« contingence »)
- Contingence: Eventualité, probabilité d’une chose à exister ou à ne pas exister.
Quantité d’apprentissage à faire = l’attention (l’aprentissage à faire - l’apprentissage fait)
- Mais à la différence de Rescorla qui voyait l’attention comme une constante, Mackintosh déclare que le l’attention va augmenter si SN/SC est un bon prédicteur de SI, et diminuer dans le cas inverse. Cela permet d’expliquer l’inhibition latente.
- Le modèle explique aussi le blocage de Kamin en termes de non-attention à B lorsque A a déjà été conditionné avec SI.
- Le modèle ne fonctionne toutefois pas dans tous les cas.
L’expérience 1 de Pearce et Hall
- Le transfert négatif de Hall- Pearce
- Alors que Mackintosh propose que l’attention est attirée par les stimuli utiles, Pearce et Hall croient qu’il est inutile pour un organisme de gaspiller des ressources sur de tels stimuli et proposent que ce sont les stimuli encore non-compris (p.e. nouveaux, surprenant, etc.) qui attirent l’attention.
- Pearce et Hall utilisent une formule similaire à Rescorla et à Mackintosh mais les variables sont légèrement différentes.
- DV=attention et depend du degré de surprise à l’essai précédent (la quantité de surprise)