Cours 11 Les théories du conditionnement instrumental Flashcards

1
Q

Clark Hull

A
  • Il propose le concept de l’homéostasie comportementale
  • Hull assume l’existence de comportements non-observables.
  • La théorie de l’apprentissage S-R souvent qualifiée de moléculaire, parce qu’elle postule que le comportement consite en une longue châine de réponses spécifique, associées à des stimulus spécifiques.
  • Tous les renforcateurs sont associés directement ou indirectement à la réduction de pulsions.
  • Bémol, ce n’est pas tout les renforcateurs qui réduisent les pulsions
  • L’apprentissage fut sa troisième carrière en psychologie:
      1. Psychométrie (1920)
      1. Hypnose (1933)
  • La traduction d’un ouvrage de Pavlov va l’initier aux concepts du conditionnement.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La Tendance (Drive)

(motivation)

A
  • Homéostasie physiologique: état dans lequel tous les systèmes biologiques de l’individu sont en équilibres ;
  • Tout organisme est motivé à maintenir ou restaurer cet équilibre :
    • un déséquilibre de l’homéostasie crée un “besoin”;
    • ce besoin a un effet psychologique : la Tendance (ou “Drive”) (motivation).
  • Certains renforçateurs primaires réduisent la tendance.
  • Théorie S-R stricte, l’apprentissage consiste en l’établissement de liens entre des stimuli spécifiques et des réponses spécifiques.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

E = (H x D)

A
  • E = la force du comportement observable
  • H = “Habit” ou apprentissage/conditionnement
  • D = “Drive” ou tendance (motivation de besoin)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

E = (H x D) - (nIc +Ic)

A

E = la force du comportement observable

H = “Habit” ou apprentissage/conditionnement

D = “Drive” ou tendance (motivation de besoin)

nIc = “Inhibition non-conditionnée” (la fatigue)

Ic = “Inhibition conditionnée” (la peur)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Néobéhaviorisme

A
  • Est un type de béhaviorisme qui fait appel à des variables intermédiaires (événement intérieurs processus physiologique comme la faim), sous la forme de processus physiologiques hypothétiques, afin d’expliquer le rapport entre le milieu et le comportement.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Le béhaviorisme de Tolman

A
  • Rejette l’approche Néobéhavioriste de Hull.
  • Plus utile d’analyser le comportement au niveau molaire c’est à dire plus large.
  • Tout est d’avantage que la somme de ses parties
  • Effort dirigé plutôt qu’une longue chaîne de liens distinct.
  • Le comportement est plus qu’une chaine d’action ponctuelle associés à des stimulus ponctuels.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La théorie de la réduction des pulsions

A
  • Selon cette théorie, un événement est renforçant dans la mesure ou il se trouve associé à la réduction d’un type quelconque de pulsion physiologique.
  • Ainsi une privation de nourriture entraine une pulsion de faim, qui pousse l’animal à chercher de la nourriture. Une fois qu’il a mangé de la nourriture la pulsion faiblit
  • En même temps, le comportement ayant précédé cette baisse de la réduction des pulsions et ayant abouti à l’obtention de la nourriture est automatiquement renforcé.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Motivation incitatrice

A
  • La motivation issue d’une certaine propriété du renforçateur, par opposition à une pulsion interne, est qualifiée de motivation incitatrice.
  • Forme de stimulation sensorielle qui joue un rôle très renforçant.
  • Ex: écouter de la musique, jouer à un jeu vidéo

Une motivation créée par le renforçateur lui-même indépendant de sa capacité objective à satisfaire le besoin à l’origine de la Tendance.

–p.e. la crème glacée peut nous faire manger alors que nous n’avons plus vraiment faim

Théorie dite du “Push” et du “Pull” (très bien connue des gens de marketing)

–“Push”: la motivation vient de l’intérieur (p.e. la Tendance);

–“Pull” : la motivation vient de l’extérieur (p.e. l’incentive).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Principe de Prémack

A
  • Un comportement très probable peut servir à renforcer un comportement peu probable.
  • Par exemple lorsqu’un rat a faim, l’action de manger, soit le comportement très probable (CTB), (non la roue) peut server à renforcer le comportement cible consistant à courir dans une petite roue, soit le comportement peu probable (CPP). Le rat coure dans la roue pour accèder à la nourriture.
  • Fondé sur la notion selon laquelle un renforçateur peut souvent êre envisagé comme un comportement plutôt que que comme un stimulus.
  • Au lieu de dire que presser le levier est renforcé par l’obtention de la nourriture (un stimulus), on peut dire que presser le levier est renforcé par l’acte de manger.(un comportement)
  • Le processus de renforcement peut être conceptualisé comme une suite de deux comportements: d’abord le comportement faisant l’objet du renforcement et ensuite le comportement agissant comme renforcateur.
  • Si on observe la fréquence de divers comportements il est possible de déterminer si l’un deux peut servir de renforçateur à l’autre.
    *
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

L’hyptothèse de la déprivation de réponse

(Timberlake et Allison)

A
  • Postule qu’un comportement peut servir de renforçateur à deux conditions: l’accès à ce comportement est restreint, et sa fréquence se situe donc sous son niveau préférentiel
  • Postule l’existence d’un niveau optimal de réponse qu’un sujet s’efforce de maintenir.
  • Le niveau préférentiel d’une activité correspond à son niveau de référence lorsque le sujet peut librement pratiquer cette activité. (exemple du rat qui aime courrir pendant 1 heure et on réduit a 15 minute et doit peser sur le levier pour avoir plus d’accès)
  • Tout comportement produit à un niveau inférieur à son niveau optimal peut être un renforçateur.
  • Ainsi, si le niveau optimale de préférence d’un individu est d’étudier 20 % du temps et qu’il ne peut étudier que 10 %, alors pouvoir étudier plus que 10 % pourra servir à renforcer un autre comportement.
  • « Ce qui constitue un renforçateur change avec le contexte. »
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

L’approche comportementale axée sur le point de satiété

A
  • Un sujet ayant libremet accès à de multiples activités va répartir son comportement de façon à maximiser le renforçement global.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Tolman et l’apprentissage latent (expérience de Crespi)

A
  • Dans un labyrinthe, des rats sont entraînés à courir pour 1 (vert), 16 (jaune) ou 256 (rouge) pilules de nourriture (phase 1) ;
  • Lors de la phase 2, tous les rats reçoivent 16 pilules.
  • Résultat : la modification de la taille de la récompense influence immédiatement la vitesse de parcours.
  • Conclusion : Clairement les rats du groupe vert avaient appris avant
  • C’est l’apprentissage laten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Rôle de l’attention dans le conditionnement

A
  • On ne peut apprendre que les choses auxquelles on prête attention.
  • L’attention filtre l’énorme quantité d’information normalement disponible dans l’environnement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Le modèle de Mackintosh

A
  • Mackintosh (1975) propose un modèle alternatif à Rescorla dans lequel l’attention du sujet à un SN/SC est liée à la capacité du SN/SC à prédire le SI (« contingence »)
  • Contingence: Eventualité, probabilité d’une chose à exister ou à ne pas exister.

Quantité d’apprentissage à faire = l’attention (l’aprentissage à faire - l’apprentissage fait)

  • Mais à la différence de Rescorla qui voyait l’attention comme une constante, Mackintosh déclare que le l’attention va augmenter si SN/SC est un bon prédicteur de SI, et diminuer dans le cas inverse. Cela permet d’expliquer l’inhibition latente.
  • Le modèle explique aussi le blocage de Kamin en termes de non-attention à B lorsque A a déjà été conditionné avec SI.
  • Le modèle ne fonctionne toutefois pas dans tous les cas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

L’expérience 1 de Pearce et Hall

A
  • Le transfert négatif de Hall- Pearce
  • Alors que Mackintosh propose que l’attention est attirée par les stimuli utiles, Pearce et Hall croient qu’il est inutile pour un organisme de gaspiller des ressources sur de tels stimuli et proposent que ce sont les stimuli encore non-compris (p.e. nouveaux, surprenant, etc.) qui attirent l’attention.
  • Pearce et Hall utilisent une formule similaire à Rescorla et à Mackintosh mais les variables sont légèrement différentes.
  • DV=attention et depend du degré de surprise à l’essai précédent (la quantité de surprise)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Tranfert négatif et inhibition latente

A
  • Pearce et Hall expliquent le transfert négatif vu précédemment par le fait qu’après la phase 1, le CS est bien connu et donc moins surprenant. De fait,  est plus faible que normalement au début de la phase 2.
  • L’inhibition latente est expliquée de façon similaire.
17
Q

L’expérience 2 de Pearce & Hall

A
  • La lumière est soit associée à un SI (continu), soit à l’absence de SI (nul). Pour le troisième groupe, il y a présentation aléatoire de la lumière et du SI (partiel).
  • Pearce & Hall observent que les réponses d’orientation diminuent pour « continu » et « nul », mais restent fortes pour « partiel » (qui reste surprenant).
18
Q

Tranfert négatif et inhibition latente

A
  • Pearce et Hall expliquent le transfert négatif vu précédemment par le fait qu’après la phase 1, le CS est bien connu et donc moins surprenant. De fait, l’attention est plus faible que normalement au début de la phase 2.
  • L’inhibition latente est expliquée de façon similaire.
19
Q

La théorie sociale cognitive

A

Selon la théorie de l’apprentissage social élaborée par Albert Bandura, les individus apprennent de nouveaux comportements ou de nouvelles connaissances en observant leurs pairs.

Ce type d’apprentissage est aussi nommé « apprentissage vicariant ».

Ainsi, l’apprentissage serait déterminé par trois facteurs, à savoir :

  • Un stimulus externe
  • Un renforcement externe
  • Une médiation cognitive

Or, l’apprentissage social peut aller dans les deux directions.

C’est le modèle du déterminisme réciproque.