cours 7 Flashcards
Programme de renforcement:
-La demande de réponse à satisfaire pour obtenir un renforcement
-Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
-Ensemble de règles à suivre pour obtenir un renforçateur
–>P.ex., Le rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture
–>Combien de temps dois-je attendre au McDo avant d’obtenir ma commande
–>Combien de fois devez-vous dire à votre coloc de faire sa vaisselle
Différents programmes (demandes) vont produire différents effets sur le comportement
–>Ces effets sont nommées «effets de programme»
Programme de renforcement continu:
Programme où chaque réponse est renforcée
–>P.ex., Chaque fois que le rat appuie sur le levier le choc cesse
–>Chaque fois que je vous pose une question, vous répondez
Très efficace
-Facile à comprendre
-Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
–>P.ex., Ma mère s’empressait de souligner qu’elle appréciait que j’avais appeler pour dire que je ne rentrerais pas à chaque fois que je le faisais.
Programme de renforcement intermittent
-Aussi appelé partiel
-Programme où seules certaines réponses sont renforcées
–>P.ex., Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
–>Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
–>Dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence
-Le plus courant dans la vie
–>L’environnement renforce rarement tous nos comportements
–>Relations amoureuses (pas tjrs nice parfois faut faire des trucs gentil plusiuers fois avant de get des rewards)
4 types de programmes intermittents de base
-Programme à proportion
-Programme à proportion variable
-Programme à intervalle fixe
-Programme à intervalle variable
Programme à proportion fixe
-Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
–>P.ex., Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
–>Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue
–>Il faut compter 3 buts avant de se faire dire que l’on a fait un tour du chapeau
Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
–>En lien avec les exemples plus haut on a: PF3, PF200, PF3
–>PF1=programme continu
le programme à proportion fixe engendre habituellement..
Ce type de programme engendre habituellement
-Un débit de réponse rapide
-Une courte pause après l’obtention de chaque renforçateur
–>Nommée pause après renforcement
-Le retour rapide des réponses après la pause
–>p.ex., Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence
Programme à proportion fixe
Après une pause de renforcement, le retour des réponses peut parfois…
QUESTION ICI
être plus long
-P.ex., Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….
-Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement
-Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce
–>Commencer par quelque chose de facile
–>PAS COMMENCER par le découpage (????)
Programme à proportion fixe
temps de pause et taille de proportion
Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
-Pause pour PF25 < pause pour PF100
Programme à proportion fixe
bas ratio et haut ratio
-On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE
-On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL
Ratio = nb de comportements/renforçateur
Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
–>P.ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
–>À chaque 3 fois
L’étirement de la proportion engendre parfois une dégradation dans le comportement
-Tension du ratio: perturbation de la réponse causée par une demande trop exigeante
–>ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
–>À chaque 100 fois
–>Entrer au Doctorat
Programme à proportion variable
-Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
–>P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
–>Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission
–>La plupart des sports ou des jeux
-Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
–>En lien avec les exemples plus haut on a: PV3, PV10
-Le programme est fonction d’une moyenne donc on peut avoir un PV10
–>Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois
–>P.ex., 2, 18, 16, 4, 10,
–>Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois
–>P.ex., 12, 8, 9, 11, 10,
-Ne tient donc pas vraiment compte de la variance
Programme à proportion variable
–Ce type de programme engendre habituellement
-Un débit de réponse rapide et stable
-Peu de pause après l’obtention de chaque renforçateur
-Peut aller à aucune pause si le nombre minimum de réponses est très bas
–>p.ex.,PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10
–>Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
—->Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec PV10 avec renforçateur après 8 à 12 réponses
-Ces types de programmes peuvent engendrer des comportements mal adaptés
–>P.ex., Jeu compulsif
–>LA crise de bacon qui marche…
Programme à intervalle fixe
-Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE
–>P.ex., Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture
–>Si je vous dis que les notes seront disponibles 5 jours après l’examen vous devez attendre 5 jours avant que d’aller sur Studium vous donne accès à vos notes
-Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
–>En lien avec les exemples plus haut on a: IF30 sec, IF5 jours
Programme à intervalle fixe
-Ce type de programme engendre habituellement
-un mode de réponse ondulatoire (pcq longue pause après renforcement)
–>Courbe orientée vers le haut
-Pause après l’obtention du renforçateur
-Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
–>P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne
Programme à intervalle fixe
le temps est un…
Le temps est un SD qui devrait indiquer à l’organisme quand le renforçateur devient disponible
-3 minutes (SD) : Ouvrir le micro-ondes (R) –> pizza pocket (SR) (stimulus renfoçateur)
–>Important: tout comportement fait avant l’intervalle n’est pas efficace
Programme à intervalle variable
-Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE
–>P.ex., Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture
–>Si je vous dis que les notes seront disponibles en MOYENNE 5 jours après l’examen vous devez attendre autour de 5 jours avant que d’aller sur Studium vous donne accès à vos notes
-Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
–>En lien avec les exemples plus haut on a: IV30 secondes, IV5 jours
-Le programme est fonction d’une moyenne donc on peut avoir un IV10
–>Renforçateur obtenu après la première réponse faite entre 1 et 20 minutes mais en moyenne après 10 minutes
–>P.ex., 2, 18, 16, 4, 10,
–>Renforçateur obtenu après la première réponse faite entre 8 et 12 minutes mais en moyenne après 10 minutes
–>P.ex., 12, 8, 9, 11, 10,
-Ne tient donc pas vraiment compte de la variance
Programme à intervalle variable
-Ce type de programme engendre habituellement
-un débit de réponse stable et modéré
-Peu de pause après l’obtention de chaque renforçateur
-Peut aller à aucune pause si l’intervalle minimum est très court
–>p.ex.,IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10
–>Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
—->Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes
Programme à intervalle variable
Puisqu’il s’agit de temps ici, le comportement devient très …
régulier
–>P.ex. pour un IV10 minutes avec renforçateur après 1 min à 20 min on aura souvent un patron de réponse d’un comportement par minutes
–>Ce patron permet de maximiser les chances de l’organisme d’obtenir le renforçateur (de ne pas le manquer)
-Façon de faire produire des comportements régulier sans avoir besoin d’utiliser beaucoup de renforçateurs
–>P.ex., Pour obtenir un comportement à chaque minute
IV 10 minutes vs. IF 1 minutes (if c’est intervalle fixe)
Les programmes à proportion
engendrent
-Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites
–>Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses
–>P.ex., efficacité de donner des bonus à la performance ($ par vente)
différence au niveau des modes de cpt selon le programme de renforcement sont en fonction de..
+ c’est quoi les différences de comportement
en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible
–>Débit de réponse
–>Pause