COURS 8 : behaviorisme IIb : le conditionnement opérant II Flashcards
Extinction
- l’extinction se produit lorsque l’opérant n’est plus suivis par la conséquence qui lui est préalablement associée
- ETUDE de WILLIAMS (1959) :
- un petit garçon de 21mois a reçu l’attention 24/24 quand il était malade.
- une fois guéri, enfant a demandé le même niveau d’attention ( le renforçateur)
- Nouveau régime de sommeil : les parents ferment la porte et refusent de réagir aux pleurs du bébé
RESULTATS :
après 45 min, le garçons s’assoupi. Ensuite il s’assoupit en moins de 10 min. A 6 mise au lit, le garçons ne crie plus du tout
(dans le contexte du behaviorisme, l’extinction est un processus par lequel un comportement cesse de se produire parce que le renforcement associé à ce comportement est retiré. Cela illustre l’importance des conséquences dans le façonnement des comportements selon cette perspective théorique.)
Programmes de renforcement - SKINNER
- programme de RENFORCEMENT CONTINU : chaque réaction correcte est renforcée
- programme RENFORCEMENT INTERMITTENT (partiel): seules quelques-unes des réactions correctes sont renforcées :
-le renfoncement intermittent est généralement + efficace en terme de maintient du comportement acquis, et les comportements maintenus sous renforcement intermittent sont en général + résistants à l’extinction - programme à PROPORTION : les récompenses sont liées au nombre de réponse émises ( p. ex une réaction correcte sur trois est récompensée)
- programme à INTERVALLE: les récompenses n’apparaissent qu’après un laps de temps ( ex une réaction correct après 5 min est récompensée)
des spécification
Des réactions cumulatives
- au cours du conditionnement les réaction s’s’accumulent:
il est possible de mettre en relation le temps passé et le taux de réaction - le conditionnement est + efficace si bcp de réaction avec peu de latence entre temps sont produites
Les effets cumulatif des programmes de renforcement
- programmes à PROPORTIONS FIXES :
Des réactions rapides MAIS pas durable - programme à des proportions variables (VR):
des réactions rapides et durables - programme à intervalle fixe : seulement des réactions à la fin de intervalle et peu durable
- programme à intervalle variable : très efficaces pour créer une performance constante et durable
→ on peut combiner les programmes : par . ex commencer avec proportion fixe pour acquisition rapide et continuer un programmes à intervalle variable pour maintenir le comportement
exemple de programmes de renforcement dans la vie quotidienneD
Contingence et renforçateur
CONTINGENCE : une relation entre un comportement (R) et une conséquences (Sr: stimulus renforçateur) dans une certaine situation
- une conséquence : Le comportement supertitieux SKINNER:
un renforcateur (nourriture) était donné à des intervalles de temps réguliers, sans rapport avec le comportement que les pigeons produisaient → conséquence : chaque pigeon développais sa propre idiosyncratique (contingence pas illusion, TOC)
RENFORCATEURS SECONDAIRES : stimuli qui ont obtenus la qualité d’un renforçateur par association avec un renforçateur primaire qui satisfait directement un besoin :
ex renforçateur primaire : nourriture, douleur
ex renforçateur secondaire : argent critique
Le “PREMACK principe”
→ une application dans l’éducation : les comportement peuvent fonctionner comme renforçateurs
- ex : “si tu fais tes devoirs tu pourras regarder la tv”–> le comportement de regarder la tv est un renforcateur qui motive enfant à faire ses devoirs
-PROCEDURE selon PREMACK:
1. on observe comportement de individus et determine la proba des actions qui sont exécutées spontanément
2. - action exécuté fréquemment peuvent fonctionner comme renforçateurs
-action exécuté rarement peuvent fonctionner comme punition
EXEMPLE :
- renforcement positif : d’abord tu joue au piano et puis tu peux regarder tv
- punition négative: si tu arrives trop tard a table il n’y a pas de dessert pour toi
Les comportements complexes
SKINNER
- apprentissage des comportement complexes =DISCRIMINER des stimuli qui signalent renforcement vs non renforcement- simtuli discriminatifs (Sd)
→ S.C+, S.C- suite au conditionnement classique (association S-S)
L’apprentissage discriminatif
→stimulus discriminatif (Sd) signale la présence de contingences particulières de renforcement et punition → “stimulus controle”
- Dans la SKINNER Box, le Sd était un son ou une lumière. Les animaux apprenaient à manifester un comportement SEULEMENT en réponse à un stimulus discriminatif:
STIMULUS DISC.(Sd)→ COMPORTEMENT (R)→ CONSEQUENCES (Sr)
Lumière rouge → appuyer sur levier → RENFORCEMENT
Lumière verte → appuyer sur levier → PAS DE RENFORCEMENT
(les animaux appui + si la lumière est rouge car il y a un renforcement)
- Programmes d’apprentissage complexe, par ex resocialisation, par l’association de S.d avec des renforçateur (Sr) secondaire (TOKEN ECONOMY)
→un renforçateur secondaire est obtenu suite à un comportement spécifique dans une situation spécifique
Le shaping
shaping est une modification PROGRESSIVE d’un comportement spécifique pour produire une nouvelle réponse
→souvent utilisée dans le dressage : on produit un comportement nouveau en renforçant des comportement approximatif de + en + proches de la réponse désirée
ex: dressage d’un tigre :
1. s’assoir sur commande
2. sauter sur commande
3. sauter à travers un cerceau
4. sauter a travers un cerceau en feu
La chaîne (chaining)
- La chaîne est une mise en place d’une séquence de réponses (nouvelle et ou existantes) dans un ordre temporel
(ex : apprendre à écrire “hope” c’est compliqué mais apprendre à écrire toutes les lettre indépendamment rend l’écriture du mot “hope”+ facile) - dans exp de SKINNER le rat qui est entrain d’apprendre à presser un levier (R) suite à être mis dans une “skinner box”
L’apprentissage de l’échappement et de l’évitement dans une shuttle box
–> la phobie : comment se fait il qu’un comportement sans punition crée une phobie ?
Expérience avec un chien:
Au haut parleur on présente son
- Son et un choc élécritque –> le chien saute car il a mal
- Ensuite il suffit du son pour que le chien saute, il en a peur et donc il saute (comportement d’évitement ) –> éviter le renforcement aversif
C’est pareil pour phobie sociale (la personne évite d’aller dans des endroit ou y’a bcp de monde, elle ne va pas faire ses courses en même temps que les autres)
Ya plus de punition mais la personne a quand même un comportement –> comment se fait il ?
EXPLICATION DE PHOBIE :
MOWRER: l’apprentissage à 2 processus
-EXPLICATION pour l’apprentissage d’évitement qui est un phénomène de l’apprentissage discriminatif: l’organisme apprend à réagir à un signal pour éviter des conséquence aversives
-LES 2 PROCESSUS
1. LE CONDITIONNEMENT CLASSIQUE (sign Learning): association du S.C(son) avec un S.I (choc electrique)
2.LE CONDITIONNEMENT INSTRUMENTAL (solution learning) : Apprendre qu’un comportement spécifique va terminer une stimulation aversive (–> renforcement négatif)
En conséquence d’un conditionnement classique, un stimulus conditonné positif (S.C+) signale qu’il y a un une conséquence aversive (le stimulus inconditionné(S.I) ou un stimulus négatif (S.C-) signale qu’il n’y a PAS de conséquence
MOWRER Les vécu émotionnels comme renforçateur
Généralisation de la théorie : les émotions sont les guides primaires du comportement. Les émotions motivent le comportement
- Les vécus émotionnels conditionnées fonctionnent comme renforçateur et punitions
EX:
- si S.C - signale qu’il n’y a pas de récompense c’est la déception qui réduit la proba du comportement instrumental (punition négative)
- Si un S.C+ signale que on obtient une punition c’est la peur qui augmente la proba d’évitement (punition positive)
- si un S.C signale qu’il n’y a pas de punition c’est le soulagement qui renforce l’évitement (renforcement négatif)