Cours #7 Flashcards
Théorie de la réduction des pulsions (Clark Hull)
Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique
Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation)
Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés
Ex: La privation de nourriture amène une pulsion de faim. L’animal va donc produire des comportements (ex: exploration) qui pourraient lui permettre de diminuer de cette pulsion (la faim). Si l’animal trouve de la nourriture et la consomme, la pulsion de faim va diminuer et les comportements qui lui ont permis d’obtenir la nourriture seront renforcés
Théorie de la réduction des pulsions : renforçateurs
On sait qu’il existe des renforçateurs primaires qui sont définis comme ceux qui relèvent de besoins (pulsions) physiologiques primaires (nourriture, eau, comportements sexuels, etc.)
Selon la théorie de la réduction des pulsions, tous les renforçateurs peuvent être reliés directement ou indirectement au besoin de réduire une pulsion physiologique
Ex: Étudier pendant 20 ans-obtenir un bon emploi-gagner de l’argent-manger chez votre resto pref.-réduire ses pulsions de faim
Théorie de la réduction des pulsions : certains compos associés à aucun type de réduction des pulsions
Cependant, certains comportements semblent n’être associés à aucun type de réduction des pulsions
Ou le lien entre le comportement et le besoin physiologique est très mince
Ex: aller voir une pièce de théâtre-donne un sujet de conversation pour un rdv galant- excuse pour manger chez Sushi Momo-réduire ses pulsions de faim
Souvent, l’aspect important semble plus être en lien avec l’aspect renforçant du stimulus en soi plutôt qu’au fait qu’il nous permet de diminuer une pulsion physiologique
On parle ici de motivation incitatrice:
motivation issue d’une certaine propriété du renforçateur
Théorie de la réduction des pulsions : compos mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions
Nos comportements sont beaucoup mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions
Ex: j’ai faim, je vais
Cuire du steak haché et le manger, ouvrir une boîte de maïs en crème et la manger, bouillir des pommes de terre et les manger
Cuire du steak haché, ouvrir une boîte de maïs, bouillir des pommes de terre, les organiser en étage et les manger
Abandon graduel de cette théorie
Principe de Premack : CTP px servir à renforcer CPP
Un comportement très probable peut servir à renforcer un comportement peu probable
Pour comprendre le principe de Premack on doit concevoir qu’un renforçateur peut être envisagé comme un comportement plutôt que comme un stimulus
Ex: renforçateur = nourriture vs. = manger
Ainsi le processus de renforcement passe du lien entre une réponse et un stimulus à une suite de deux réponses (ou comportements)
L’accent est mis sur les probabilités relatives (ou fréquences relatives) des comportements
Principe de Premack : deux catégories de comportement
Un comportement très probable peut servir à renforcer un comportement peu probable
Deux catégories de comportements
Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement
Ex: si j’ai faim, manger est un CTP
Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
Ex: si j’arrive du buffet all you can eat, manger est un CPP
Un comportement très probable peut servir à renforcer un comportement peu probable
Offre une façon d’identifier facilement des renforçateurs dans l’environnement
Temps mis pour X, temps mis pour Y
Ex: Jonathan met 2h pour se coiffer le matin, il met 1h pour faire ses lectures pour le cours d’apprentissage
étudier (CPP) (R) coiffer (CTP) (SR)
Hypothèse de la dépravation de réponse
Un comportement peut servir de renforçateur à deux conditions (Timberlake et Allison, 1974):
L’accès à ce comportement est restreint
Sa fréquence se situe sous son niveau préférentiel
Niveau préférentiel: niveau de référence lorsque le sujet peut librement faire ce comportement
Ex: Ma petite sœur qui aurait pu visionner 24h par jour sa cassette préférée.
Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel
Hypothèse de la dépravation de réponse
Permet de comprendre pourquoi les contingences de renforcement sont efficaces
Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront renforcés
Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera sous le niveau préférentiel
Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel
Permet d’explique un plus grand nombre de situations (avec deux CTP par exemple)
Approche comportementale axée sur le point de satiété
Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global (Allison, 1983)
La durée de chaque activité représente leur renforcement optimal (le point de satiété comportemental)
Cependant, dans des contingences de renforcement ces points de satiété peuvent devenir inatteignables
Puisque la plupart de nos comportements sont imbriqués dans des contingences de renforcement (ex: travailler vs. faire de la musique), nous devons ajuster notre temps afin d’atteindre un point qui nous rapproche de nos points de satiété (sans vraiment les atteindre)
Ainsi, les organismes vont tenter de répartir leur comportement de façon à maximiser le renforcement global
Programme de renforcement : définition
La demande de réponse à satisfaire pour obtenir un renforcement
Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
Ensemble de règles à suivre pour obtenir un renforçateur
Ex: Rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture?
Combien de temps dois-je attendre au McDo avant d’obtenir ma commande?
Combien de fois devez-vous dire à votre coloc de faire sa vaisselle?
Différents programmes (demandes) vont produire différents effets sur le comportement
Ces effets sont nommées «effets de programme»
Programme de renforcement continu
Programme où chaque réponse est renforcée
Ex: Chaque fois que le rat appuie sur le levier le choc cesse
Chaque fois que je vous pose une question, vous répondez
Très efficace
Facile à comprendre
Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
Ex: Votre conjointe s’empresse de souligner qu’elle appréciait que aviez appelé pour dire que vous rentrez tard, à chaque fois que vous le faites
Programme de renforcement intermittent
Aussi appelé partiel
Programme où seules certaines réponses sont renforcées
Ex: Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
Dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence
Le plus courant dans la vie
L’environnement renforce rarement tous nos comportements
Relations amoureuses
4 types de programmes intermittents de base
Programme à proportion fixe
Programme à proportion variable
Programme à intervalle fixe
Programme à intervalle variable
Programme à proportion fixe
Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
Ex: Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue
Il faut compter 3 buts avant de se faire dire que l’on a fait un tour du chapeau
Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PF3, PF200,
PF3
PF1=programme continu
Programme à proportion fixe : engendre généralement …
Ce type de programme engendre habituellement
- Un débit de réponse rapide
- Une courte pause après l’obtention de chaque renforçateur
- Nommée pause après renforcement
- Le retour rapide des réponses après la pause
- Ex: Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence