Cours 2 : Le conditionnement instrumental (PART 1) Flashcards
Conditionnement instrumental, c’est quoi ?
La modification de la probabilité d’apparition d’un comportement due à l’apparition ou au retrait d’une conséquence (renforçateur).
Le renforçateur peut diminuer ou augmenter
Le renforçateur peut diminuer = punition
Ou augmenter = renforcement, l’occurence d’un comportement.
Le conditionnement instrumental, est-ce un apprentissage associatif
OUI !! Les chercheurs ne sont pas tous d’accord à quel niveau ce fait l’apprentissage…
Par contre, c’est en effet une forme d’apprentissage puisque nous faisons référence à modifier un comportement.
(EX. Un enfant qui reçoit 2$ lorsqu’il nettoye sa chambre, donc il associe le comportement = nettoyer avec la renforçateur = la monnaie. C’est un renforçement puisque nous voulons augmenter l’occurence du comportement.
Qui est le père du conditionnement instrumental ?
Edward Thorndike
Les propos de Thorndike ? La boite aux chats…
Un chat est enfermé dans une boite de laquelle il peut sortir en appuyant sur un levier.
Lorsque le chat s’échappe, il reçoit de la nourriture
Sortir de la boite n’est pas instinctif pour le chat, donc la première fois ça va arriver par hasard.
Nous allons continuer à placer le chat dans la boite à plusieurs reprises et mesurer le temps qu’il prend à sortir…
Résultats = le temps nécessaire diminue à chaque reprise, donc apprentissage faite au niveau du fonctionnement de la boite.
Une procédure avec des essais discrets, c’est quoi ?
C’est l’expérimentateur qui défini lorsque l’essai débute et lorsqu’elle fini.
- Le début et la fin doivent être facile à identifier
Dans le cat de la boite aux chats, l’essai débute lorsque le chat entre dans la cage et l’essai se termine lorsque le chat appuit sur le levier.
Nous utilisons les essais discrets pour que les essais sont clairement séparés les un les autres.
Les paradigmes d’essais discrets sont principalement utilisés pour ?
Les labyrinthes
La situation opérante libre de Skinner
Le comportement est émis chaque fois que l’animal le souhaite (pas comme essais discrets).
Le début et la fin ne sont pas clairement identifiables
On mesure la fréquence du comportement par unité de temps (ex. 5 comportements dans 5 minutes)
EX. On place un rat dans cage pour 2h et on mesure la fréquence du comportement au lieu de s’intéresser au comportement de façon individuelle (il a réussi à sortir de la cage dans 2 minutes).
L’objectif n’est pas de sortir de la boite, ça pourrais être de monter une rampe pour obtenir de la nourriture.
Il va se rendre à la fin pour retourner au début, répétition constante de comportements et de cycles (début-fin)
La boite de Skinner
Si le rat appuie sur le levier, il reçoit une boulette de nourriture.
Au début, il appuie sur le levier par hasard
Le nombre de fois que l’animal appuie sur le levier à chaque minute augmente
Puisqu’il se fait une apprentissage, nous savons que c’est une apprentissage associatif puisque l’apprentissage se manifeste en comportement (appuyer sur le levier)
Il existe 2 façons de représenter les données dans le praradigme opérant libre
Nombre de réponses par minutes
Nombre de réponses cumulées
Nombre de réponses par minute - Définir la phase d’acquisition et la phase d’extinction
La phase de l’acquisition : Période du comportement qui est suivis par le renforçement
EX. appuyer sur le levier pour reçevoir une boulette
La phase de l’extinction : Période ou le renforçement cesse d’être émis
EX. il va appuyer sur le levier et les boulettes ne vont pas sortir, il va finir par comprendre qu’il ne va plus en reçevoir.
Comment passe t’on de la période d’acquisition à la période d’extinction ?
Les comportements suivis de récompenses vont continuer à augmenter jusqua l’atteinte d’un certain plateau. Puisqu’il va atteindre la limite de récompenses qu’il peut avoir dans une certaine période de temps, minute, on assume que le comportement a été completement appris.
Ceci dit, la phase de l’extinction commence
Note : le plus l’apprentissage est robuste, plus longtemps qu’il va continuer à émettre le comportement lors de la période d’extinction.
Nombre de réponses cumulées
AXE X = temps
AXE Y = réponses cumulées
Chaque fois que le rat va émettre le comportement, la ligne va continuer à monter. Lorsqu’on tombe dans la période d’extinction, il continue le comportement pour un certain bout, mais éventuelle il arrête.
Plateau dans ce cas = comportement a été completement extinct.
Les composantes du conditionnement opérant
Stimulus - Réponse (comportement) - Conséquence
Le levier dans la boite - Appuyer sur levier - Boulette
Situation 1 : identifier le stimulus, la réponse (comportement) et la conséquence -
Tom est turbulant en classe parce que ça fait rire ses amis
stimulus : être en classe
réponse : être turbulant
conséquence : faire rire ses amis
Situation 2 : Identifier le stimulus, la réponse et la conséquence -
Au centre d’achat, Annie fait une crise lorsqu’elle voit un jouet qu’elle désire parce que chaque fois qu’elle fait une crise, ses parents lui achètent le jouet pour la calmer
Stimulus : la crise
Réponse : ajouter le jouet
Conséquence : se calmer
Situation 3 : Identifier le stimulus, la réponse et la conséquence -
Lorsque John croise un policier en voiture, il ralentit pour ne pas avoir de contravention
Stimulus : croiser le police
réponse : ralentir
conséquence : éviter la contravention