Béhaviorisme IIa : Le conditionnement opérant (Partie I) Flashcards
Que montre l’étude d’Edward THORNDIKE?
Un chat se trouve dans une cage munie d’un levier mécanique connecté à une porte (= puzzle box). A l’extérieur il y a de la nourriture placée bien en vue. Le chat explore la cage et par hasard il ouvre la porte.
- Le chat apprend un nouveau comportement (appuyer sur le levier) ® devient de plus en plus expert à manipuler le levier et quitte la cage dès que la nourriture est présentée.
- Au 4ème essai ® stabilisation. Þ Le chat a appris en faisant quelque chose par hasard qui a une conséquence (accès à la nourriture) et qui change son comportement. Il a remplacé le SI par le SC ® il a été conditionné.
Que c’est que la Loi d’effet?
Loi importante de l’apprentissage : tendance d’un animal à reproduire un comportement dépend des effets de ce comportement sur l’environnement et de l’impact de ces effets sur l’animal.
Le comportement est donc une fonction de ses conséquences.
- Conditionnement instrumental : Processus d’apprentissage dans lequel le comportement a un caractère instrumental dans l’accomplissement d’un but, la satisfaction (ex: obtenir de la nourriture). THORNDIKE
Qui a créé le terme de conditionnement opérant et pourquoi_
- C’est Skinner .Le comportement opère sur l’environnement afin de produire une conséquence
- Les opérants sont des comportements émis (produits spontanément) plutôt que générés par l’environnement
Quelles sont les 3 suppositions fondamentales du conditionnement opérent selon Skinner?
- 3 suppositions fondamentales :
- Organismes fréquemment actifs ® les organismes manifestent des comportements d’une manière continue.
- Les conséquences des comportements influencent la probabilité avec laquelle ces comportements seront répétés à l’avenir.
- L’état motivationnel de l’organisme et son environnement physique et social influencent l’efficacité de ces conséquences.
Donne un exemple pour les 3 suppositions fondamentaux du conditionnement opérant
Ex: efficacité de la nourriture pour augmenter la probabilité d’un comportement dépend de la durée de privation de nourriture.
- Dans le conditionnement opérant, le comportement précède l’évènement environnemental qui produit le futur comportement (VS conditionnement classique ® stimulus environnemental précède la réaction)
- L’idée principale est que tout le comportement est déterminé par ses conséquences (selon la “loi d’effet”)
Quelles sont les deux types de conséquences?
- Il y a 2 types de conséquences :
- Renforcement : augmente la probabilité qu’une réaction se produise.
- Punition : diminue la probabilité qu’une réaction se produise.
“Skinner box” : SKINNER étudie surtout les rats puis les pigeons. Pas de contact entre l’expérimentateur et l’animal (¹ THORNDIKE)
Que c’est-que le renforcement positif?
Un renforçateur (SR) est une conséquence environnementale qui se produit après la réaction d’un organisme et qui rend la réapparition de cette réponse plus probable.
- Il y a des renforçateurs positifs et négatifs.
- Positif : processus par lequel la présentation d’un stimulus après un comportement augmente la probabilité que ce comportement se produise à nouveau.
Ex: dans étude de Thorndike ® nourriture = renforçateur pour appuyer sur le levier
Que c’est-que le renforcement négatif
Renforcement négatif
- Négatif : processus par lequel l’élimination d’un stimulus après un comportement augmente la probabilité que ce comportement se produise à nouveau. (enlève quelque chose de désagréable)
- Apprentissage d’échappement : renforcement par l’élimination d’un événement aversif déjà existant.
Ex: rat apprend à appuyer sur levier pour interrompre stimulatiuon douloureuse, enfant apprend à ranger sa chambre pour ne plus entendre ses parents rouspéter
- Apprentissage d’évitement : renforcement par l’élimination d’un événement qui est signalé par avance.
Ex: rat apprend à appuyer sur levier si un son signale qu’un choc électrique va suivre, enfant apprend à ranger sa chambre avant d’entendre ses parents rouspéter
Que c’est-qu’une punition?
Une punition (Sp) est une conséquence environnementale d’un comportement qui diminue la probabilité d’une réponse (R).
En quoi consiste la punition positif et négatif?
- Punition positive : présentation d’un stimulus aversif. (ajout de quelque chose)
Ex: rat évite d’appuyer sur levier après avoir reçu choc électrique, enfant ne fait plus de désordre dans sa chambre après avoir entendu ses parents rouspéter
- Punition négative: élimination d’un stimulus agréable.
Ex: employé n’obtient pas d’augmentation de salaire à cause de ses fréquents retards
Quels sont les problèmes du renforcement et de la punition?
Problèmes du renforcement et de la punition
- Organisme doit savoir exactement quel comportement est renforcé ou puni ® il faut connaître les “contingences” (lien clair avec cette conséquence amène tel comportement)
- Un des problèmes de la punition est la difficulté à distinguer quel opérant a été puni
Ex: “experts” appellent plusieurs fois de suite chien (ou enfant) et lui crient dessus parce qu’il n’est pas venu tout de suite ® punissent le bon comportement : venir après l’appel, si maman demande au papa de gronder enfant quand il rentre ® enfant n’apprend rien mais a peur du papa
- A long terme, extinction est plus efficace que punition positive (ESTES, SKINNER) Après arrêt de la punition positive, il y a fréquemment une récupération spontanée.
Que c’est-qui montre l’étude de Etude de ESTES : la punition et l’extinction?
Etude de ESTES : la punition et l’extinction
Des rats sont renforcés avec de la nourriture pour appuyer sur un levier.
Puis, 2 groupes sont formés:
- Punition (positive): Au cours d’une session, des chocs électriques sont émis suite à l’action d’appuyer sur le levier.
- Extinction (punition négative): Au cours d’une session, il n’y a plus de renforcement.
- Observation des rats au cours de 4 jours d’extinction.
- Mesure : fréquence d’appui sur le levier.
- Résultats: La punition réduit le comportement cible (appuyer sur le levier), mais ensuite il y a une récupération spontanée. (® renforcement négatif pusique arrêt des chocs)
Þ avec punition, on peut toujours supprimer un comportement mais pas l’effacer
D’autres problèmes avec la punition?
D’autres problèmes de la punition
- association de la peur de celui qui apprend avec la personne qui punit (via conditionnement classique) plutôt qu’avec sa propre activité (via conditionnement opérant)
- punition ne peut pas éliminer les récompenses déjà existantes pour un comportement (ex: punition d’un enfant qui suce son pouce)
- apprentissage secondaire : un enfant puni apprend qu’on peut résoudre des prblèmes par voie de l’agression
- punition seulement efficace lorsqu’elle est accompagnée d’un raisonnement et d’un comportement alteratif qui est renforcé
Comment peut-on changer une réaction conditionnée?
3 stratégies pour changer ou éliminer réactions conditionnées:
1) Extinction: arrêter de renforcer une réaction (ex: ignorer le mauvais comportement d’un enfant) ® il faut être conséquent : suffisamment d’essais pendant lesquels opérant n’est pas suivi de la conséquence qui lui était préalablement associée
2) Punition: présenter une conséquence aversive ou éliminer une conséquence agréable du comportement
3) Contre-conditionnement: renforcer un comportement incompatible (alternatif) (ex: féliciter un enfant d’être assis afin d’éliminer son habitude de courir partout)