Cours 10 Plans de renforcement Flashcards
Programme de renforcement continu
- Se caractérise par le fait que chaque réponse spécificque est renforcée.
Effets de programme
- Différentes demandes de réponse vont produire des effets complètement dissemblables sur le comportement.
Un programme de renforcement intermittent (ou partiel)
- Se caractérise par le fait que seules certaines réponses sont renforcées.
4 types de base de renforcement intermittent
- à proportion fixe
- à proportion variable
- à intervalle fixe
- à intervalle variable
Mode de réponse caractéristique
- Le mode stable qui émerge après que le sujet (ou l’organisme) a bénéficié d’une exposition prononcée au programme.
- Ces modes stables sont appellé comportements stabilisés, par opposition aux types de comportements plus variables qui se manifestent lorsqu’un sujet commence à être exposé au programme.
Les 4 programes intermittents de base
Programme à proportion fixe (PF)
- Dans un programme à proportion fixe (PF), le renforcement est fonction d’un nombre de réponses prévisibles et fixe.
- Programme PF1 est identique à un programme de renforcement continu dans lequel chaque réponse se retrouve renforcée.
- Ex: dans un programme PF5 un rat doit appuyer 5 fois pour obtenir a manger.
- Un programme PF engendre généralement un débit de réponse rapide, moyenne une courte pause après l’obtention de chaque renforcateur, qui se nomme pause après renforcement.
- Chaque pause est suivie d’une reprise relativement prompte d’un débit de réponse. C’est pourquoi la configuration habituelle d’un programme PF est qualifée de pause et réponses, soit une courte pause suivie de réponse.
- L’adoption d’un programme à proportion plus élevée donne lieu à de plus longues pauses après l’obtention du renforcement.
- Un programme est considéré très dense ou très riche lorsque le renforcateur s’avère facile à obtenir, et frugal lorsque le renforcateur devient difficile à obtenir.
- PF5 Dense
- PF100 Frugal.
L’étirement de la proportion (tension de ratio)
- le fait de passer d’une faible proportion (un programme dense/riche) à une forte proportion (programme frugal), devrait être effectué graduellement.
- Si la proportion s’accroit trop rapidement, le comportement risque de devenir erratique et se degrader complètement.
- De même si on élève trop la proportion imposée, le comportement peut se dégénérer entièrement.
- Une telle dégradation du comportement s’appelle tension de ratio.
Tension de ratio
- Une perturbation de la réponse attribuable à une demande de réponse trop exigeante.
- La tension de ratio correspond à ce que désigne le terme courant ‘‘épuisement professionel’’.
Les 4 programmes intermittents de base
Programme à proportion variable (PV)
- Le renforcement est fonction d’un nombre de réponses imprévisible et varié (moyenne de la variation de demande).
- Le programme PV engendre de généralement un débit de réponse rapide et stable, souvent assorti de peu de pause àprès l’obtention du renforcement, voir aucune pause.
- Le programme PV explique en partie la persistance de comportements mal adaptés que manifestent certaines personnes, dont les parieurs. La nature imprévisible du jeu est à l’origine du débit très rapide de ce comportement (machine a sous)
Les 4 programmes intermittents de base
Programme à intervalle fixe (IF)
- Le renforcement est fonction de la première réponse donnée après une prériode de temps prévisible et fixe.
- Dans le cas d’un programme à intervalle fixe de 30 secondes. (IF 30 secs) pour un rat, celui ci obtient un morceau de nourriture la première fois qu’il appuie un levier après une intervalle de 30 secondes. Par la suite une autre intervalle de 30 secondes doit s’écouler avant que l’action d’appuyer sur le levier ne lui procure une nouveau morceau de nourriture.
- Engendre un mode de réponse ondulant (courbe orientée ver le haut) qui comprend une pause après l’obtention du renforcement suivie d’un débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule. (exemble regarder montre pour magasin et étude pour examen)
- Dans un programme IF strict, toute réponse produite durant l’intervalle ne sert à essentiellement à rien.
- Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
- Fixe : la durée de l’intervalle ne change pas d’un renforcement à un autre
Exemple : vérifier si on a reçu un chèque de bien-être social, attendre l’autobus.
- Comportement observé : des réponses isolées et espacées dans le temps
Les 4 programmes intermittents de base
Programme à intervalle variable (IV)
- Le renforcement est fonction de la première réponse survenant après une période de temps imprévisible et variée. (moyenne de temps)
- Engendre un débit de réponse stable et modéré, souvent assorti à peu de pauses après l’obtention du renforcement, voir d’aucune. Engendre un débit de réponse prévisible ainsi qu’un débit de renforcement prévisible.
- Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
-
Variable : la durée de l ’intervalle varie d ’un renforcement à un autre
- Exemple : recomposer un numéro de téléphone occupé
- Comportement observé : rythme de réponses lent mais assez constant.
Les programmes à durée
- Dans un programme à durée, le renforcement est fonction de l’exécution d’un comportement étalé tout au long d’une certaine période de temps.
- Plutôt imprécis, comparativement aux quatre programmes de base analysés précédemment. Dans le cas d’un programme PF, on sait précisément ce qui a été fait pour obtenir le renforçateur tandis que dans le DF (durée fixe), la personne active et paresseuse vont tout les deux l’avoir.
Programme de durée fixe (DF)
- Le comportement doit être exécuté en continu pendant une période de temps prévisible et fixe. Par exemple, Julie peut autoriser son fils à écouter la télé chaque soir, aprés 2 heures d’études (DF 2h).
Programme à durée variable (DV)
- Le comportement doit être exécuté en continu pendant une période de temps imprévisible et variée, Par exemple le rat doit courrir dans la petite roue pendant 60 secondes en moyenne avant d’obtenir de la nourriture, et le temps requis varie de 1 à 120 seconds au cours d’un essai donné. (DV 60 sec)
Progrmame de débit de réponse
- Le renforcement est directement fonction du débit de réponse du sujet.