Cours 5 ****IMPORTANT*** Flashcards
Les programmes de renforcement (schedules) : Les programmes continus
Les programmes continus
À chaque fois qu’un comportement a lieu
Rat pèse sur un levier = nourriture
Enfant range ses jouets = bravo !
Acquisition plus rapide d’un nouveau comportement
Limites
Applications réelles ?
Plus théorique, peu vu dans la vraie vie, peu réaliste, peu pratique
Les programmes intermittents
Proportion (ratio) fixe
Répétition du comportement un nombre fixe de fois (RF 3)
Rat reçoit de la nourriture après avoir pesé 3 fois sur le levier
Employé payé à la pièce (RF 1)
Travaille rapidement —» payé à ch fois qu’il fait le geste
Équivaut à un programme continu
Prend au comportement un nombre fixe de fois avant de recevoir le renforcement
Employé payé à la pièce (RF 1)
Travaille rapidement —» payé à ch fois qu’il fait le geste, ne va pas prendre de grandes pauses parce que ce n’est pas payant, plus c’est vite, plus tu travailles = plus tu es payé
Équivaut à un programme continu
Suite
Proportion (ratio) variable
Le nombre de comportement nécessaire pour un renforcement varie autour d’une moyenne
RV 5
Renforcement parfois après 2 comportements, parfois après 10
Moyenne 5 fois
Plus productif
Travaille plus rapidement que sur ratio fixe
Travaille plus rapidement que sur ratio fixe parce qu’il ne sait jamais quand il sera renforcé, donc essayer de travailler le plus fort et le plus intensément possible car il ne sait jamais quand le renforcement aura lieu
Ex : Vendeur sous commissions (vente à pression, va essayer le plus intensément possible de faire des ventes, essayer au max de faire des ventes car on ne sait jamais quand ça va marcher, extrêmement persistent, joue un peu avec la vérité)
Serveur avec tips
Proportion ratio variable
Proportion (ratio) variable
Vente à commission
Parfois fonctionne, parfois non
Jeu (casino)
Parfois la machine paie, parfois non
Enfants… Cédule RV à éviter !!!
Caractère imprévisible de la situation
Enfants : Comme je ne sais jamais quand il dira oui, je vais le tester au maximum. À ch fois qu’on leur dit non, ils vont persister et ils vont être gossants, ils reviennent à la charge plusieurs fois car ils savent que le non n’est pas fixe, peut être modifié en oui
»Mettre moins de règlements, mais qui peuvent tous être appliqués en tout temps
Intervalle fixe
Intervalle fixe
Cuire du pain dans un four
Regarde seulement dans les dernières minutes
Regarder l’heure
Plus fréquent avant la fin du cours
Étude des étudiants
Semaine avant l’examen (haute fréquence)
Semaine après l’examen (basse fréquence)
Évaluation annuelle
Chasser le naturel…
Intervalle variable
Intervalle variable
Chasseur qui attend
Parfois après 5 minutes, parfois après 3 heures
Examen surprise
Attendre un courriel
On ne sait jamais quand les renforcements vont arriver
Modification du ratio
Ratio
Par shaping
RF
RF 3
RF 5
RF 8 etc…
Modification du ratio
Avec un animal…
Casino
Stratégie
Laisser le client gagner au début
Modification en cours de partie
On va miser sur l’explosion de l’extinction quand le comportement ne donne plus de renforcement pour modifier le ratio (Extinction progressive) Ex : Mes parents ne me donnent plus d’argent de poche quand je fais du ménage
Extinction
L’effet partiel du renforcement
Un ratio intermittent (RV) est plus résistant à l’extinction qu’un ratio continu (contre-intuitif)
Deux principales hypothèses sont envisagées
Discrimination
Séquentielle
Comportements deviennent plus résistants à l’extinction
Hypothèse 1
Discrimination
Plus long de comprendre l’extinction sur RF 30 que RF 1
Besoins d’au moins 30 essais avant de comprendre que l’accès au renforcement est impossible
Hypothèse 2
Séquentielle
Plusieurs pesées sur le levier non renforcées ont précédé l’obtention d’un renforcement
X X X X 1000$ (Après 5 coups = 1000$) Elle a fini par payée, faire plusieurs fois avant de recevoir son renforcement, habituer d’avoir une séquence qui n’est pas payante avant d’avoir une séquence payante, va finir par y arriver parce que ça s’est passé comme ça dans le passé
Ex : J’ai vraiment faim, met 1 $ dans la machine distributrice, mais elle ne donne rien. Met un 2e $, mais donne rien. On dit que la machine est défectueuse, elle ne fonctionne plus
Applications
Au travail
Learned industriousness (Einsenberger)
Effort/fatigue = sensation aversive/désagréable
Si + effort, alors meilleurs résultats (généralement)
Pairage sensation d’effort et renforcement
Travailleur plus productif/persévérant
Manipulation des schedules
No pain, no gain
Travaillants, ont dû faire beaucoup d’efforts avant de recevoir un renforcement, ça les fait travailler plus parce que ça a pris beaucoup d’efforts pour obtenir le renforcement voulu
Application en thérapie
En thérapie
Modification progressive du ratio avant renforcement
Retrait du renforcement
Le client qui a les bons comportements au début = beaucoup de renforcement au début. Après, on va modifier notre ratio pour que même si on est plus là (fin de la thérapie) pour donner le renforcement, qu’il garde les habiletés qu’il a acquises
Applications: Jeu compulsif
Jeu compulsif
Moyenne du retour 90%
Pour chaque dollar dépensé, le casino remet 90 cent
Caractéristiques personnelles ?
Histoire de renforcement
Gains rapides ?
Redonne de l’argent au joueur, mais au long terme le joueur perd plus d’argent
Caractéristiques personnelles ? Pas impossible
Histoire de renforcement
Gains rapides ? Semblent jouer un rôle dans la cédule de renforcement
Expérience du pigeon
Étape 1
Expérience pigeon
50 coups de bec = 3 secondes accès à un plat de nourriture
Travail 30 minutes jour = maintien du poids santé de pigeon
Étape 2
Choix entre jeu (hasard) ou travail
Disque standard
50 coups de bec = 3 secondes accès à un plat de nourriture
Disque illuminé
Paie de manière imprévisible
Parfois 1 coup de bec = 15 secondes
Arrangement du chercheur
Certains pigeons feront de gros gain dès le départ
Étape 3
Extinction
Mieux de retourner travailler que de jouer
Les pigeons jouent jusqu’à perdre du poids
Retrait du jeu
Pigeon retour au poids normal
Suite
Étape 4
Réinstauration du jeu
Les pigeons jouent encore jusqu’à perdre du poids
Pigeons peuvent gagner plus par jeu
Ex: 15 secondes au jeu
Le jeu compulsif met le joueur compulsif sur une cédule de renforcement à RV, devient accros au jeu à cause de l’hypo séquentiel et aux possibilités de gagné, s’habitue à l’incertitude