7 Flashcards
Programme de renforcement:
La demande de réponse à satisfaire pour obtenir un renforcement
Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
Ensemble de règles à suivre pour obtenir un renforçateur
P.ex., Le rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture
Combien de temps dois-je attendre au McDo avant d’obtenir ma commande
Combien de fois devez-vous dire à votre coloc de faire sa vaisselle
Différents programmes (demandes) vont produire différents effets sur le comportement
Ces effets sont nommées «effets de programme»
Programme de renforcement continu:
Programme où chaque réponse est renforcée
P.ex., Chaque fois que le rat appuie sur le levier le choc cesse
Chaque fois que je vous pose une question, vous répondez
Très efficace
Facile à comprendre
Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
P.ex., Ma mère s’empressait de souligner qu’elle appréciait que j’avais appeler pour dire que je ne rentrerais pas à chaque fois que je le faisais.
Programme de renforcement intermittent
Aussi appelé partiel
Programme où seules certaines réponses sont renforcées
P.ex., Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
Dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence
Le plus courant dans la vie
L’environnement renforce rarement tous nos comportements
Relations amoureuses
4 types de programmes intermittents de base
Programme à proportion
Programme à proportion variable
Programme à intervalle fixe
Programme à intervalle variable
Différences au niveau des modes de comportements en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible
Débit de réponse
Pause
Les programmes à proportion
Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites
Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses
P.ex., efficacité de donner des bonus à la performance ($ par vente)
Les programmes à composante fixe ont tendance à engendre des pauses après le renforçateur
L’organisme sait qu’avant d’obtenir le prochain il devra nécessairement attendre (un délai, ou de faire un certain nombre de comportements)
Programme à proportion fixe
Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
P.ex., Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue
Il faut compter 3 buts avant de se faire dire que l’on a fait un tour du chapeau
Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PF3, PF200, PF3
PF1=programme continu
Ce type de programme engendre habituellement
Un débit de réponse rapide
Une courte pause après l’obtention de chaque renforçateur
Nommée pause après renforcement
Le retour rapide des réponses après la pause
p.ex., Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence
Après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
P.ex., Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….
Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement
Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce
Commencer par quelque chose de facile
PAS COMMENCER par le découpage
Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
Pause pour PF25 < pause pour PF100
On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE
On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL
Ratio = nb de comportements/renforçateur
Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
P.ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 3 fois
L’étirement de la proportion engendre parfois une dégradation dans le comportement
Tension du ratio: perturbation de la réponse causée par une demande trop exigeante
.ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 100 fois
Entrer au Doctorat
Programme à proportion variable
Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission
La plupart des sports ou des jeux
Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PV3, PV10
Le programme est fonction d’une moyenne donc on peut avoir un PV10
Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois
P.ex., 2, 18, 16, 4, 10,
Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois
P.ex., 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
Ce type de programme engendre habituellement
Un débit de réponse rapide et stable
Peu de pause après l’obtention de chaque renforçateur
Peut aller à aucune pause si le nombre minimum de réponses est très bas
p.ex.,PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10
Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec PV10 avec renforçateur après 8 à 12 réponses
Ces types de programmes peuvent engendrer des comportements mal adaptés
P.ex., Jeu compulsif
LA crise de bacon qui marche…
Programme à intervalle fixe
Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE
P.ex., Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture
Si je vous dis que les notes seront disponibles 5 jours après l’examen vous devez attendre 5 jours avant que d’aller sur Studium vous donne accès à vos notes
Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
En lien avec les exemples plus haut on a: IF30 sec, IF5 jours
Ce type de programme engendre habituellement
un mode de réponse ondulatoire
Courbe orientée vers le haut
Pause après l’obtention du renforçateur
Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne
Le temps est un SD qui devrait indiquer à l’organisme quand le renforçateur devient disponible
3 minutes (SD) : Ouvrir le micro-ondes (R) –> pizza pocket (SR)
Important: tout comportement fait avant l’intervalle n’est pas efficace
Programme à intervalle variable
Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE
P.ex., Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture
Si je vous dis que les notes seront disponibles en MOYENNE 5 jours après l’examen vous devez attendre autour de 5 jours avant que d’aller sur Studium vous donne accès à vos notes
Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
En lien avec les exemples plus haut on a: IV30 secondes, IV5 jours
Le programme est fonction d’une moyenne donc on peut avoir un IV10
Renforçateur obtenu après la première réponse faite entre 1 et 20 minutes mais en moyenne après 10 minutes
P.ex., 2, 18, 16, 4, 10,
Renforçateur obtenu après la première réponse faite entre 8 et 12 minutes mais en moyenne après 10 minutes
P.ex., 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
Ce type de programme engendre habituellement
un débit de réponse stable et modéré
Peu de pause après l’obtention de chaque renforçateur
Peut aller à aucune pause si l’intervalle minimum est très court
p.ex.,IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10
Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes
Puisqu’il s’agit de temps ici, le comportement devient très régulier
P.ex. pour un IV10 minutes avec renforçateur après 1 min à 20 min on aura souvent un patron de réponse d’un comportement par minutes
Ce patron permet de maximiser les chances de l’organisme d’obtenir le renforçateur (de ne pas le manquer)
Façon de faire produire des comportements régulier sans avoir besoin d’utiliser beaucoup de renforçateurs
P.ex., Pour obtenir un comportement à chaque minute
IV 10 minutes vs. IF 1 minutes
Autres types de programmes simples:
Programmes à durée
Programmes de débit de réponse
Programmes non contingents
Programmes à durée fixe:
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long D’UNE CERTAINE PÉRIODE DE TEMPS FIXE
P.ex., Un rat doit courir dans une roue pendant 10 secondes avant d’obtenir de la nourriture
On doit garder une position de yoga pendant 2 minutes avant de passer à l’autre
Notés DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur
En lien avec les exemples plus haut on a: DF10 secondes, DF2 minutes
Programmes à durée variable:
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement en continu pendant une période de temps IMPRÉVISIBLE ET VARIÉE
P.ex., Un rat doit courir dans une roue pendant en MOYENNE 10 secondes avant d’obtenir de la nourriture
On doit garder une position de yoga pendant en MOYENNE 2 minutes avant de passer à l’autre
Notés DVXX en fonction du nombre de temps moyen que doit être exécuter le comportement pour obtenir le renforçateur
En lien avec les exemples plus haut on a: DV10 secondes, DV2 minutes
Le programme est fonction d’une moyenne donc on peut avoir un DV10
Renforçateur obtenu si la réponse est faite en continue entre 1 et 20 minutes mais en moyenne pendant 10 minutes
P.ex., 2, 18, 16, 4, 10,
Renforçateur obtenu si la réponse est faite entre 8 et 12 minutes mais en moyenne pendant 10 minutes
P.ex., 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
Programmes à durée fixe et variable:
Comparés aux autres programmes simples vus, ils sont habituellement plus imprécis dans leur capacité à faire produire des comportements
Plus de place à l’interprétation de ce qui doit être fait
Courir pendant 10 minutes
Courir vite vs. courir lentement,
Travailler pendant 1h pour obtenir 15$
Travailler fort vs. être au bureau
Besoin de plus de spécifications sur les détails des comportements à produire afin que l’on obtienne le résultat désiré
Programmes à débit de réponse:
Programmes pour lesquels le renforcement est fonction du débit de réponse
Importance de l’aspect différentiel:
Un seul type de réponse est renforcé alors qu’un autre type ne l’est pas
Programmes à débit de réponse:Programmes de renforcement différentiel du débit rapide (RDDR):
Programme pour lequel le renforcement est fonction de la production d’au MOINS un certain nombre de réponses en une certaine période de temps
Plus généralement, seulement si le débit est assez rapide (aspect différentiel car tout débit plus lent n’est PAS renforcé)
P.ex., Un pigeon qui doit appuyer au moins 10 fois en 1 minute afin de mettre fin à une stimulation douloureuse
Pour passer l’examen physique pour être policier.ière il faut faire au moins X nombres de push-ups en Y temps
Programmes à débit de réponse:Programmes de renforcement différentiel du débit lent (RDDL):
Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponses en une certaine période de temps
Plus généralement, seulement si le débit est assez lent (aspect différentiel car tout débit plus rapide n’est PAS renforcé)
P.ex., Un pigeon qui doit appuyer au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse. Ou attendre au moins 5 secondes entre chaque coup de bec
Charlie doit manger son souper en au minimum 5 minutes (vs. 2 secondes)
Différence avec le programme à intervalle fixe?
Dans IF, les comportements faits dans l’intervalle n’ont pas de conséquence
Dans le RDDL, tout comportement de trop fait dans l’intervalle élimine la chance d’obtenir le renforçateur (on doit recommencer l’intervalle)