COURS 7: Behaviorisme IIa : Le conditionnement opérant I Flashcards
Etude d’EDWARS THORNDIKE (1898)
- un chat se trouve dans une cage munie d’un levier mécanique (la puzzle box) : à l’extérieur, nourriture placée bien en vue
- chat explore la cage ; PAR HASARD il trébuche sur le levier, la porte de la cage s’ouvre et le chat a accès à nourriture
- une fois remis dans la cage, le chaut devient de + en + expert à manipuler le levier et quitte la cage dès que la nourriture est présentée
différences entre conditionnement classique et conditionnement opérant
- Conditionnement classique : on avait une réaction qui naturellement présente chez l’animal que l’on va lie avec un autre stimulus
→ comportement existe déjà et l’apprentissage consiste dans l’ajout d’un autre stimulus lié a ce reflex naturel - Conditionnement opérant :pas de réflexe naturel : par hasard le chat découvre et donc apprentissage n’est pas basé sur un réflexe mais sur une action avec un but ( il y a une action de la part du chat pas que une réaction)
la courbe d’apprentissage
→ fonction logarithmique
1er fois: prend 160 sec avant que chat ouvre la cage (ici par hasard
2eme fois : chat commence à comprendre
la suite il réussi completement et le temps baisse drastiquement
OPERANT = pas de comportement reflexe inné, c’est uniquement l’apprentissage constant
La loi de l’effet
→THORNDIKE, suite à ses observations a crée une loi importante de l’apprentissage : LA LOI DE L’EFFET
-La loi de l’effet : la tendance d’un animal à reproduire un comportement dépend des effets de ces comportement sur sont environnement et de l’impact de ces effets sur l’animal :
→LE COMPORTEMENT EST DONC UNE FONCTION DE SES CONSEQUENCES
-THORNDIKE a nommé ce processus de l’apprentissage le CONDITIONNEMENT INSTRUMENTAL parceque le comportement avait un caractère instrumental dans l’accomplissement d’un but - la satisfaction
B.F SKINNER : le conditionnement opérant
-suite à expérience sur rats et pigeons, SKINNER a systématisé la façon dont le comportement est contrôlé par l’environnement selon la loi de l’effet
-POSITION BEHAVIORISTE RADICALE : explication du comportement sans utilisation des concepts mentaux : SKINNER nie complètement les émotions et néglige le rôle de la cognition dans le comportement
- Introduction du terme CONDITONNEMENT OPERANT qui signifie : que le comportement OPERE sur l’environnement afin de produire une conséquence
- les opérants sont des comportements émis (produits spontanément) plutôt que générées pas l’environnement
Quels sont les 3 suppositions fondamentales de SKINNER (1938)
- Il n’est pas possible de ne pas agir → les organisme manifestent des comportement de manière continue
- Conséquence influence la probabilité avec laquelle ces comportement seront répétés à l’avenir
État émotionnel de l’organisme et son environnement physique et social influencent l’efficacité de ces conséquence
- Conséquence influence la probabilité avec laquelle ces comportement seront répétés à l’avenir
→ exemple : l’efficacité de la nourriture pour augmenter la proba d’un comportement de la durée de la privation de la nourriture (si chat est repu ca ne marchera pas, il faut qu’il soit affamé)
Le conditionnement opérant
- définition
- le comportement précède l’évènement environnemental qui produit le futur comportement OPPOSE au conditionnement classique ou le comportement suit le stimulus environnemental)
IDEE PRINCIPALE : tout comportement est déterminé par ses conséquences (selon la loi de l’effet)
Les 2 types de conséquences:
- le renforcement (qui augmente la proba qu’une réaction se produise=n’importe quel élément qui va rendre la proba de répéter un comportement + grande)
- la punition : n’importe quel élément qui diminue la proba que la réaction se produise, que le comportement se repasse)
→ illusion de la liberté :en réalité on n’est pas libre mais on est soumis à des comportements que l’on a appris dans le passé
L’équipement de recherche : La skinner box
- besoin de tout contrôler
- renforcement positif VS renforcement négatif:
- Positif veut dire que on présente qqch
-négatif ca veut dire que on enlève qqch qui aura l’effet de réduire un comportement
Renforçateur : définition
Un renforçateur (Sr) est une conséquence environnemental qui se produit après la réaction d’un organisme et qui rend la réapparition de cette réponse plus probable
Il y a des renforçateur positif et négatif
Renforcement positif
le renforcement positif est le processus par lequel la présentation d’un stimulus après le comportement AUGMENTE la proba que ce comportement se produise à nouveau
→ ex : dans etude de thorndike, renforçateur positif =nourriture
renforcement négatif
- est le processus par lequel L’ELIMINATION d’un stimulus après un comportement augmente la probabilité que ce comportement se produise à nouveau
- APPRENTISSAGE D’ECHAPPEMENT : renforcement par l’élimination d’un évènement aversif déjà existant:
→ rend la proba que le comportement qui a arrêté le stimulus gênant +grande
ex: rat apprend à appuyer sur le levuer pour INTERROMPRE une stimulation douloureuse, ou enfant apprend à ranger sa chambre pour NE PLUS entendre ses parents se plaindre
-APPRENTISSAGE D’EVITEMENT : renforcement par l’élimination d’un évènement qui est signalé par avance:
ex : rat apprend à appuyer sur levier si un son signal qu’un choc électrique va arriver, ou enfant va apprendre à ranger sa chambre AVANT que il entende ses parents rouspéter
Punition définition
une punition (Sp) est une une conséquence environnementale d’un comportement qui DIMINUE la probabilité d’une réponse (que le comportement se répète)
Punition positive
- il y a un stimulus aversif présenté,
→on ajoute un stimulus aversif qui va empêcher de répéter le comportement:
ex. un rat EVITE d’appuyer sur levier après avoir obtenu un choc électrique. Enfant NE FAIT PLUS de désordre dans sa chambre après avoir entendu ses parents rouspéter
Punition négative
- un stimulus appétitif est éliminé, on enlève un stimulus:
ex : un employé n’obtient pas d’augmentation de salaire à cause de ses fréquent retards
le problème du renforcement et de la punition
- l’orgnaisme doit savoir exactement quel comportement est renforcé ou puni. Il doit connaître les CONTINGENCES
-Un des problèmes de la punition est la difficulté à distinguer quel opérant est puni :
ex: si j’appel mon chien plusiuers fois qu’il viennent et que je lui crie dessu quand il vient car il est pas venu tout de suite, je punis le bon comportement soit le fait qu’il soit revenu
- a long terme, l’extinction est + efficace que la punition positive. Après l’arrêt de la punition positive, il y a fréquemment une récupération spontanée(enfant recommence à foutre le bordel)