Cours #7 Flashcards
Théorie de la réduction des pulsions (Clark Hull)
Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique
Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation)
Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés
Ex: La privation de nourriture amène une pulsion de faim. L’animal va donc produire des comportements (ex: exploration) qui pourraient lui permettre de diminuer de cette pulsion (la faim). Si l’animal trouve de la nourriture et la consomme, la pulsion de faim va diminuer et les comportements qui lui ont permis d’obtenir la nourriture seront renforcés
Théorie de la réduction des pulsions : renforçateurs
On sait qu’il existe des renforçateurs primaires qui sont définis comme ceux qui relèvent de besoins (pulsions) physiologiques primaires (nourriture, eau, comportements sexuels, etc.)
Selon la théorie de la réduction des pulsions, tous les renforçateurs peuvent être reliés directement ou indirectement au besoin de réduire une pulsion physiologique
Ex: Étudier pendant 20 ans-obtenir un bon emploi-gagner de l’argent-manger chez votre resto pref.-réduire ses pulsions de faim
Théorie de la réduction des pulsions : certains compos associés à aucun type de réduction des pulsions
Cependant, certains comportements semblent n’être associés à aucun type de réduction des pulsions
Ou le lien entre le comportement et le besoin physiologique est très mince
Ex: aller voir une pièce de théâtre-donne un sujet de conversation pour un rdv galant- excuse pour manger chez Sushi Momo-réduire ses pulsions de faim
Souvent, l’aspect important semble plus être en lien avec l’aspect renforçant du stimulus en soi plutôt qu’au fait qu’il nous permet de diminuer une pulsion physiologique
On parle ici de motivation incitatrice:
motivation issue d’une certaine propriété du renforçateur
Théorie de la réduction des pulsions : compos mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions
Nos comportements sont beaucoup mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions
Ex: j’ai faim, je vais
Cuire du steak haché et le manger, ouvrir une boîte de maïs en crème et la manger, bouillir des pommes de terre et les manger
Cuire du steak haché, ouvrir une boîte de maïs, bouillir des pommes de terre, les organiser en étage et les manger
Abandon graduel de cette théorie
Principe de Premack : CTP px servir à renforcer CPP
Un comportement très probable peut servir à renforcer un comportement peu probable
Pour comprendre le principe de Premack on doit concevoir qu’un renforçateur peut être envisagé comme un comportement plutôt que comme un stimulus
Ex: renforçateur = nourriture vs. = manger
Ainsi le processus de renforcement passe du lien entre une réponse et un stimulus à une suite de deux réponses (ou comportements)
L’accent est mis sur les probabilités relatives (ou fréquences relatives) des comportements
Principe de Premack : deux catégories de comportement
Un comportement très probable peut servir à renforcer un comportement peu probable
Deux catégories de comportements
Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement
Ex: si j’ai faim, manger est un CTP
Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
Ex: si j’arrive du buffet all you can eat, manger est un CPP
Un comportement très probable peut servir à renforcer un comportement peu probable
Offre une façon d’identifier facilement des renforçateurs dans l’environnement
Temps mis pour X, temps mis pour Y
Ex: Jonathan met 2h pour se coiffer le matin, il met 1h pour faire ses lectures pour le cours d’apprentissage
étudier (CPP) (R) coiffer (CTP) (SR)
Hypothèse de la dépravation de réponse
Un comportement peut servir de renforçateur à deux conditions (Timberlake et Allison, 1974):
L’accès à ce comportement est restreint
Sa fréquence se situe sous son niveau préférentiel
Niveau préférentiel: niveau de référence lorsque le sujet peut librement faire ce comportement
Ex: Ma petite sœur qui aurait pu visionner 24h par jour sa cassette préférée.
Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel
Hypothèse de la dépravation de réponse
Permet de comprendre pourquoi les contingences de renforcement sont efficaces
Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront renforcés
Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera sous le niveau préférentiel
Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel
Permet d’explique un plus grand nombre de situations (avec deux CTP par exemple)
Approche comportementale axée sur le point de satiété
Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global (Allison, 1983)
La durée de chaque activité représente leur renforcement optimal (le point de satiété comportemental)
Cependant, dans des contingences de renforcement ces points de satiété peuvent devenir inatteignables
Puisque la plupart de nos comportements sont imbriqués dans des contingences de renforcement (ex: travailler vs. faire de la musique), nous devons ajuster notre temps afin d’atteindre un point qui nous rapproche de nos points de satiété (sans vraiment les atteindre)
Ainsi, les organismes vont tenter de répartir leur comportement de façon à maximiser le renforcement global
Programme de renforcement : définition
La demande de réponse à satisfaire pour obtenir un renforcement
Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
Ensemble de règles à suivre pour obtenir un renforçateur
Ex: Rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture?
Combien de temps dois-je attendre au McDo avant d’obtenir ma commande?
Combien de fois devez-vous dire à votre coloc de faire sa vaisselle?
Différents programmes (demandes) vont produire différents effets sur le comportement
Ces effets sont nommées «effets de programme»
Programme de renforcement continu
Programme où chaque réponse est renforcée
Ex: Chaque fois que le rat appuie sur le levier le choc cesse
Chaque fois que je vous pose une question, vous répondez
Très efficace
Facile à comprendre
Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
Ex: Votre conjointe s’empresse de souligner qu’elle appréciait que aviez appelé pour dire que vous rentrez tard, à chaque fois que vous le faites
Programme de renforcement intermittent
Aussi appelé partiel
Programme où seules certaines réponses sont renforcées
Ex: Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
Dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence
Le plus courant dans la vie
L’environnement renforce rarement tous nos comportements
Relations amoureuses
4 types de programmes intermittents de base
Programme à proportion fixe
Programme à proportion variable
Programme à intervalle fixe
Programme à intervalle variable
Programme à proportion fixe
Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
Ex: Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue
Il faut compter 3 buts avant de se faire dire que l’on a fait un tour du chapeau
Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PF3, PF200,
PF3
PF1=programme continu
Programme à proportion fixe : engendre généralement …
Ce type de programme engendre habituellement
- Un débit de réponse rapide
- Une courte pause après l’obtention de chaque renforçateur
- Nommée pause après renforcement
- Le retour rapide des réponses après la pause
- Ex: Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence
Programme à proportion fixe : après une pause de renforcement…
Après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
Ex: Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….
Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement
Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce
Commencer par quelque chose de facile
PAS COMMENCER par le découpage
Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
Pause pour PF25 < pause pour PF100
Programme à proportion fixe : dense vs frugal
On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE
On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL
Ratio = nb de comportements/renforçateur
Programme à proportion fixe : problème
Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
Ex: Féliciter son enfant d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 3 fois
L’étirement de la proportion engendre parfois une dégradation dans le comportement
Tension du ratio: perturbation de la réponse causée par une demande trop exigeante
Ex: Féliciter son enfant d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 100 fois
Entrer au Doctorat
Programme à proportion variable
Programme où le renforcement est en fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
Ex: Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission
La plupart des sports ou des jeux
Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PV3, PV10
Le programme est fonction d’une moyenne donc on peut avoir un PV10
Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois
Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois
Ex: 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
Programme à proportion variable : engendre habituellement…
Ce type de programme engendre habituellement
- Un débit de réponse rapide et stable
- Peu de pause après l’obtention de chaque renforçateur
- Peut aller à aucune pause si le nombre minimum de réponses est très bas
Ex:PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10
Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec PV10 avec renforçateur après 8 à 12 réponses
Ces types de programmes peuvent engendrer des comportements mal adaptés
Ex: Jeu compulsif
LA crise de bacon qui marche…
Programme à intervalle fixe
Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE
Ex: Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture
Si je vous dis que les notes seront disponibles 5 jours après l’examen vous devez attendre 5 jours avant que le fait d’aller sur StudiUM vous donne accès à vos notes
Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
En lien avec les exemples plus haut on a: IF30 sec, IF5 jours
Programme à intervalle fixe : engendre habituellement…
Ce type de programme engendre habituellement
un mode de réponse ondulatoire
Courbe orientée vers le haut
Pause après l’obtention du renforçateur
Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne
Le temps est un SD qui devrait indiquer à l’organisme quand le renforçateur devient disponible
3 minutes (SD) : Ouvrir le micro-ondes (R) Pizza Pocket (SR)
Important: tout comportement fait avant l’intervalle n’est pas efficace
Programme à intervalle variable
Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE
Ex: Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture
Si je vous dis que les notes seront disponibles en MOYENNE 5 jours après l’examen vous devez attendre autour de 5 jours avant que d’aller sur StudiUM vous donne accès à vos notes
Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
En lien avec les exemples plus haut on a: IV30 secondes, IV5 jours
Le programme est fonction d’une moyenne donc on peut avoir un IV10
Renforçateur obtenu après la première réponse faite entre 1 et 20 minutes mais en moyenne après 10 minutes
Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu après la première réponse faite entre 8 et 12 minutes mais en moyenne après 10 minutes
Ex: 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
Programme à intervalle variable: engendre habituellement…
Ce type de programme engendre habituellement
un débit de réponse stable et modéré
Peu de pause après l’obtention de chaque renforçateur
Peut aller à aucune pause si l’intervalle minimum est très court
Ex:IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10
Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement
Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes
Puisqu’il s’agit de temps ici, le comportement devient très régulier
Ex: pour un IV10 minutes avec renforçateur après 1 min à 20 min on aura souvent un patron de réponse d’un comportement par minutes
Ce patron permet de maximiser les chances de l’organisme d’obtenir le renforçateur (de ne pas le manquer)
Façon de faire produire des comportements réguliers sans avoir besoin d’utiliser beaucoup de renforçateurs
Ex: Pour obtenir un comportement à chaque minute
IV 10 minutes vs. IF 1 minutes
Résumé
Différences au niveau des modes de comportements en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible
- Débit de réponse
- Pause
Les programmes à proportion
Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites
Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses
Ex: efficacité de donner des bonus à la performance ($ par vente)
Différences au niveau des modes de comportements en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible
- Débit de réponse
- Pause
Les programmes à composante fixe ont tendance à engendre des pauses après le renforçateur
L’organisme sait qu’avant d’obtenir le prochain il devra nécessairement attendre (un délai, ou de faire un certain nombre de comportements)
Motivation incitatrice
Motivation issue d’une certaine propriété du renforçateur.
Aspect important = + en lien avec aspect renforçant du stimulus en soi qu’au fai qu’il ns permet de diminuer une pulsion physio