Cours 7 Flashcards
Caractéristiques d’un programme de renforcement :
- La demande de réponse à satisfaire pour obtenir un renforcement
- Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
- Ensemble de règles à suivre pour obtenir un renforçateur
○ P.ex., Le rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture
○ Combien de temps dois-je attendre au McDo avant d’obtenir ma commande
- Différents programmes (demandes) vont produire différents effets sur le comportement,
ces effets sont nommées :
effets de programme
Qu’est-ce qu’un programme de renforcement continu :
- Programme où chaque réponse est renforcée
○ P.ex., Chaque fois que le rat appuie sur le levier le choc cesse
○ Chaque fois que je vous pose une question, vous répondez - Très efficace
○ Facile à comprendre
○ Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
□ P.ex., Ma mère s’empressait de souligner qu’elle appréciait que j’avais appeler pour dire que je ne rentrerais pas à chaque fois que je le faisais.
Qu’est-ce qu’un programme de renforcement intermittent :
- Aussi appelé partiel
- Programme où seules certaines réponses sont renforcées
○ P.ex., Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
○ Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau - Le plus courant dans la vie
○ L’environnement renforce rarement tous nos comportements
- 4 types de programmes intermittents de base, c’est quoi ?
- Programme à proportion
- Programme à proportion variable
- Programme à intervalle fixe
- Programme à intervalle variable
Qui suis-je ? Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
Programme à proportion fixe
Comment est noté le programme à proportion fixe :
- Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
○ En lien avec les exemples plus haut on a: PF3, PF200, PF3
Le programme à proportion fixe engendre habituellement quoi ?
○ Un débit de réponse rapide
○ Une courte pause après l’obtention de chaque renforçateur
□ Nommée pause après renforcement
○ Le retour rapide des réponses après la pause
□ p.ex., Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence
Dans un programme à proportion fixe, après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être…
plus long
○ P.ex., Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….
Une fois que l’on amorcé le programme à proportion fixe, les réponses/compt se font….
rapidement
Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce, comme :
Commencer par quelque chose de facile
PAS COMMENCER par le découpage
Dans un programme à proportion fixe, il y a habituellement une relation ___ entre la taille de la proportion et la ____ ?
- Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
○ Pause pour PF25 < pause pour PF100
Programme à proportion fixe
* On considère un programme à bas ratio où le renforçateur est facile à obtenir comme _____
* On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme ____
DENSE ou RICHE
FRUGAL
Ratio =
nb de comportements/renforçateur
Problème d’un programme à proportion fixe ?
- Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
- Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
○ P.ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter À chaque 3 fois
L’étirement de la proportion engendre parfois :
une dégradation dans le comportement
Tension du ratio:
perturbation de la réponse causée par une demande trop exigeante
○ .ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
□ À chaque 100 fois
□ Entrer au Doctorat
Qu’est-ce qu’un programme à proportion variable ?
- Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
○ P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
○ Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission
○ La plupart des sports ou des jeu
Comment est noté un programme à proportion variable ?
- Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
○ En lien avec les exemples plus haut on a: PV3, PV10
programme à proportion variable engendre habituellement :
○ Un débit de réponse rapide et stable
○ Peu de pause après l’obtention de chaque renforçateur
○ Peut aller à aucune pause si le nombre minimum de réponses est très bas
□ p.ex.,PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10
□ Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est « tenté » de ne jamais arrêter de faire le comportement
Quel type de programme peut engendrer des comportements mal adaptés ?
Programme à proportion variable
○ P.ex., Jeu compulsif
○ LA crise de bacon qui marche
Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE (qui suis-je ?)
- Programme à intervalle fixe
○ P.ex., Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture
- Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
○ En lien avec les exemples plus haut on a: IF30 sec, IF5 jours
Le programme à intervalle fixe engendre habituellement un mode de réponse ____
○ un mode de réponse ondulatoire
Courbe orientée vers le haut
○ Pause après l’obtention du renforçateur
○ Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne
Caractéristique d’un programme à intervalle variable ?
- Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE
○ P.ex., Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture - Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
○ En lien avec les exemples : IV30 secondes - Le programme est fonction d’une moyenne donc on peut avoir un IV10
Un programme à intervalle variable engendre habituellement :
○ un débit de réponse stable et modéré
○ Peu de pause après l’obtention de chaque renforçateur
○ Peut aller à aucune pause si l’intervalle minimum est très court
□ p.ex.,IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10
□ Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est « tenté » de ne jamais arrêter de faire le comportement
® Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes
Résumé des programmes à proportion ?
○ Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites
□ Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses
□ P.ex., efficacité de donner des bonus à la performance ($ par vente
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long D’UNE CERTAINE PÉRIODE DE TEMPS FIXE (qui suis-je ?)
Programmes à durée fixe
- Notés DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement en continu pendant une période de temps IMPRÉVISIBLE ET VARIÉE (qui suis-je ?)
Programmes à durée variable:
○ P.ex., Un rat doit courir dans une roue pendant en MOYENNE 10 secondes avant d’obtenir de la nourriture
○ On doit garder une position de yoga pendant en MOYENNE 2 minutes avant de passer à l’autre
- Notés DVXX en fonction du nombre de temps moyen que doit être exécuter le comportement pour obtenir le renforçateur
Programmes à durée fixe et variable:
- Comparés aux autres programmes simples vus, ils sont habituellement plus _____ dans leur capacité à faire produire des ____
○ Plus de place à ___ de ce qui doit être fait
imprécis
comportements
l’interprétation
Programmes à débit de réponse, c’est quoi ?
- Programmes pour lesquels le renforcement est fonction du débit de réponse
Importance de l’aspect différentiel:
○ Un seul type de réponse est renforcé alors qu’un autre type ne l’est pas
- A) Programmes de renforcement différentiel du débit rapide (RDDR), c’est quoi ?
- Programme pour lequel le renforcement est fonction de la production d’au MOINS un certain nombre de réponses en une certaine période de temps
○ Plus généralement, seulement si le débit est assez rapide (aspect différentiel car tout débit plus lent n’est PAS renforcé)
○ P.ex., Un pigeon qui doit appuyer au moins 10 fois en 1 minute afin de mettre fin à une stimulation douloureuse
Programmes de renforcement différentiel du débit lent (RDDL), c’est quoi ?
- Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponses en une certaine période de temps
○ Plus généralement, seulement si le débit est assez lent (aspect différentiel car tout débit plus rapide n’est PAS renforcé)
○ P.ex., Un pigeon qui doit appuyer au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse. Ou attendre au moins 5 secondes entre chaque coup de bec
Différence du RDDL avec le programme à intervalle fixe?
○ Dans IF, les comportements faits dans l’intervalle n’ont pas de conséquence
○ Dans le RDDL, tout comportement de trop fait dans l’intervalle élimine la chance d’obtenir le renforçateur (on doit recommencer l’intervalle)
Programmes de renforcement différentiel de réponses rythmées (RDRR), c’est quoi ?
- Programme pour lequel le renforcement est fonction d’une suite de réponses selon un débit préétabli
○ Plus généralement, seulement si le débit n’est NI TROP LENT, NI TROP RAPIDE (aspect différentiel car tout débit plus rapide ou plus lent n’est PAS renforcé)
P.ex., Un pigeon qui doit appuyer au minimum 5 fois et au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse
Programmes pour lesquels le renforcement apparaît indépendamment de toute réponse, qui suis-je ?
Programmes non contingents
Aucune réponse n’est nécessaire pour obtenir le renforçateur
* Aussi nommés programmes indépendants de la réponse
Programme à temps fixe, c’est quoi ?
- Programme pour lequel le renforcement apparaît après une période de temps PRÉVISIBLE et FIXE, peu importe le comportement du sujet
○ P.ex., Un poisson va recevoir de la nourriture toutes les 60 secondes
○ Cadeaux reçus à chaque année à son anniversaire - Noté TFXX en fonction du nombre de temps entre les renforçateurs
Programme pour lequel le renforcement apparaît après une période de temps IMPRÉVISIBLE et VARIÉE, peu importe le comportement du sujet, qui suis-je ?
Noté comment ?
Programme à temps variable:
○ P.ex., Un poisson va recevoir de la nourriture en MOYENNE toutes les 60 secondes
○ Les journées ensoleillées de novembre
- Noté TVXX en fonction du nombre de temps moyen entre les renforçateurs
○ En lien avec les exemples plus haut on a: TV60 secondes, TVjamais
Programmes non contigents ont un rôle dans quoi ?
- Rôle dans l’apparition et le maintien de comportement superstitieux
○ P.ex., Pigeons (Skinner, 1948)
○ Étudiants qui peuvent obtenir des points (Ono, 1987)
○ Athlètes, parieurs
Les comportements superstitieux apparaissent souvent chez les ____ dans des contextes ___
Ce sont des contextes _____
Tendance innée à être intolérant à____ et à essayer de prévoir ou de ____ l’incertitude
humains
TVXX
imprévisibles
l’incertitude
contrôler
Si un programme non contingent est ajouté à un programme contingent, que ce passe-t’il ?
Le débit de réponse est habituellement ralenti
Qu’est-ce qu’un programme complexe ?
Une combinaison d’au moins deux programmes simples
Qu’est-ce qu’un programme conjonctif ?
Un programme complexe dans lequel les exigences à au moins deux programmes simples doivent être satisfaites avant de recevoir le renforçateur
P.ex., Un rat qui doit courir dans une roue pendant 2 minutes (DF2 minutes) et appuyer en moyenne 10 fois sur un levier (PV10) pour obtenir de la nourriture
Qui suis-je ? Programme ou la demande de réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent.
- Programme ajustable
○ P.ex., Rat qui doit appuyer 10 fois sur un levier avant d’obtenir de la nourriture (PF10) puis qui doit appuyer 20 fois dans l’essai suivant (PF20)
- Très utile pour façonner exactement le comportement que l’on veut
○ On ajuste les critères pour les rendre le plus semblables à ce que l’on désire
Qu’est-ce qu’un programme en chaîne ? En quoi il diffère du programme conjonctif ?
- Programme qui consiste en une SUITE d’au moins deux programmes simples où chacun a son propre SD et dont le dernier produit un renforçateur terminal
- Diffère du programme conjonctif car les programmes doivent être complétés dans UN ORDRE PRÉCIS
- Dans ce type de programmes, les réponses aux premiers maillons ont tendance à être plus faibles que celles reliées au maillons plus près du renforçateur terminal.
Quelles sont les causes ?
programme en chaîne
○ Renforcement immédiat plus efficace que renforcement différé
○ Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien est fort
○ Principe général de l’effet du gradient
□ Hausse de la force ou de l’efficacité de la réponse à mesure que l’on s’approche de l’objectif
Pour établir un programme en chaîne on peut utiliser l’enchaînement à rebours, c’est quoi ?
○ Établir un programme en chaîne en débutant par le maillon terminal et et finissant par le maillon initial
Quelle est la théorie proposée par Clark Hull par rapport au renforcement ?
- Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique
- Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation)
- Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés
- Selon la théorie de la réduction des pulsions, tous les ____ peuvent être reliés directement ou_____ au besoin de réduire une_____
renforçateurs
indirectement
pulsion physiologique
V/F : certains comportements semblent n’être associés à aucun type de réduction des pulsions ?
VRAI
* Ou le lien entre le comportement et le besoin physiologique est très mince
○ P.ex., aller voir une pièce de théâtre-parce que ça me donne un sujet de conversation pour un rdv galant-ça me permet d’avoir une excuse pour manger chez Joe Beef-réduire ses pulsions de faim
motivation incitatrice, c’est quoi ?
motivation issue d’une certaine propriété du renforçateur
- Nos comportements sont beaucoup mieux expliqués si on tient compte des _____ que si on n’utilise que la _____
motivations incitatrices
réduction des pulsions
- Un comportement très probable peut servir à renforcer un comportement ____
Pour comprendre le principe de Premack on doit concevoir qu’un ____ peut être envisagé comme un ____ plutôt que comme un____
peu probable
renforçateur
comportement
stimulus
Deux catégories de comportement (très probable ou peu)
○ Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement
□ P.ex., si j’ai faim, manger est un CTP
○ Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
□ P.ex., si j’arrive du buffet des continents, manger est un CPP
Un comportement peut servir de renforçateur à deux conditions
- L’accès à ce comportement est restreint
- Sa fréquence se situe sous son niveau préférentiel
Niveau préférentiel=
niveau de référence lorsque le sujet peut librement faire ce comportement
P.ex., Charlie écouterait Ninjago the movie 24h par jour. Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel
- Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront _____
Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera ____
renforcés
sous le niveau préférentiel
**Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel
Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le ____
La durée de chaque activité représente leur____ (le point de satiété comportemental)
renforcement global
renforcement optimal