Cours 4 Flashcards
Conditionnement opérant : Histoire
Thorndike et ses recherches
La boîte de Thorndike
État satisfaisant
État insatisfaisant
Loi de l’effet
Force d’un comportement (fréquence, durabilité) dépend des conséquences du comportement dans le passé
Skinner et ses recherches
La boîte de Skinner
Apprentissage opérant ou instrumental
Thorndike : expériences avec des rats dans une boîte.
Loi de l’effet : Exemples : Criminalité (voler une voiture $$ vs emploi normal $) – Obtention ou non d’un secondaire 5 (Vente de drogues $$$ vs emploi avec un secondaire 5 $)
Entraînement gym routinier ou abandonner rapidement sans résultat concret ou commencer intense (3h première journée = full raquée après = démotivant, pas agréable) Mettre des petits objectifs atteignables au départ ! Objectif atteint = positif
Étude beaucoup d’efforts, mais peu de résultats = conditionnement va finir par partir
Réseaux sociaux : like = renforcement // Drame = beaucoup de réactions = renforcement pour la personne
Comportements avec des résultats satisfaisants/payants/agréables = vont être répétés
Skinner : A développé le vocabulaire/termes de l’apprentissage opérant
Termes et concepts du renforcement
Procédure
Augmenter le comportement
Renforcement positif
Renforcement négatif
Diminuer le comportement
Punition positive
Punition négative
Procédure
Procédure pour renforcement
Comportement doit avoir une conséquence
Le comportement doit augmenter en force/intensité
L’augmentation doit être le résultat de la conséquence
Types de renforcement
Positif: Un comportement est suivi d’une conséquence positive
Comportement Stimulus/Réponse
Jappe Nourriture
Termes et concepts du renforcement: le renforcement positif
Apprentissage par récompenses
Reward training
Considérer le renforcement variable selon les personnes
Se faire réprimander
Se faire emprisonner
Scared straight (Étude mise en émission de télé, emmener des jeunes avec des délits mineurs voir c’est quoi la vie en prison –Nuisible, inutile, les jeunes s’identifient aux prisonniers –Étiquette)
Être l’employé du mois
Considérer le renforcement variable selon les personnes : ce qui est un renforcement positif pour moi ne l’est peut-être pas pour tout le monde. Se poser la question si c’est vraiment un renforcement.
Réprimander peut-être un paradoxe, peut-être un renforcement : ex : ado qui fait exprès de faire fâcher le prof pour se faire expulser du cours. Expulsion du cours pas si pire comme conséquence et si aime pas l’école = récompense
Emprisonner : Ex : Centre Jeunesse – Abandonner mode de vie délinquant sinon tu vas aller en prison – Pas grave pour eux, car ils veulent être transférer aux adultes, ils sont des vrais criminels – Prison = souhaitable – Renforcer les comportements positifs du jeune pour essayer de casser les comportements négatifs : le prendre en flagrant délit quand il fait quelque chose de bien et le féliciter (rencontre 1-1, pas avec ses amis par exemple, sinon marchera pas)
Ex : Je prends une bière pour avoir du plaisir (renforcement positif) —- Je prends une bière pour diminuer mon stress (renforcement négatif – ne pas extrapoler, se fier à l’énoncer, ne pas faire comme oh on enlève le stress, donc on va avoir du plaisir –NON ! on enlève quelque chose d’aversif = renforcement négatif)
Termes et concepts du renforcement: le renforcement négatif
Renforcement négatif
Augmentation du comportement par retrait d’une conséquence aversive
Quelque chose que l’organisme tente d’éviter
Comportement Stimulus/Réponse
Cache sous remise Évite la tempête
Comportement Stimulus/Réponse
Fermer la porte Arrêter d’entendre la musique
Comportement Stimulus/Réponse
Faire de l’évitement Diminution de l’anxiété
Augmentation du comportement par retrait d’une conséquence = comportement va être répété
Cache sous remise : Chat se cache sous une remise lors d’une tempête = va le refaire
Faire de l’évitement : courbe d’exposition à l’anxiété – beaucoup de renforcement négatif
Types de renforcements
Renforcements primaires
Inné
Ne dépendent pas de l’association avec d’autres
Sexe
Centre du plaisir (nucleus accumbens)
Nourriture
Refuge contre le froid
Drogue
Renforcements secondaires
Dépendent de l’association avec d’autres (ex: bon chien)
Félicitations
Sourire
Encouragement
Leur force provient de l’association avec d’autres renforcements
Renforcements primaires ne dépendent pas d’autres aspects. Inné, inconditionnel
Renforcements secondaires dépendent de l’association avec autres choses (ex : chien bonne action + nourriture = renforcement)
Suite
Renforcements secondaires ou non ?
Utile en tout temps
Renforcement généralisé
Un exemple : l’argent
L’argent sert à payer tous les renforcements primaires mentionnés antérieurement.
Renforcements secondaires souvent avantageux car ils sont utiles en tout temps
Shaping ou renforcement par approximation/façonnement
Donner un renforcement pour le comportement s’approchant le plus possible du comportement désiré
Faire une petite demande puis renforcement
Faire une demande plus importante avant de renforcer de nouveau
Les pigeons de Skinner
Les apprentissages thérapeutiques
Shaping : Conditionnement par façonnement, à plus long terme. Ex : veut que mon chien aille se placer dans le coin droit = on va le récompenser (renforcement) à chaque fois qu’il se rapproche de l’objectif. Une gâterie à 2 pieds, après à 3 pieds, 6 pieds, jusqu’à ce qu’il atteigne l’objectif.
Exemple de Skinner et du pigeon qui fait un 360 degrés.
Modèle souvent utilisé dans les traitements contre la toxicomanie. (Roue de prochaska). Plus le client avance dans ses bons comportements, plus on lui donnera des renforcements. Renforcements donnés en fonction du client.
Shaping ou renforcement par approximation
Les apprentissages parentaux
L’enfant fait une petite crise
Le parent cède
Le parent reprend le contrôle la prochaine fois
L’enfant augmente l’intensité de la crise
Le parent recède pour éviter à gérer une crise très intense
Mécanisme ?
L’enfant est renforcé pour faire des crises plus intenses
Pourquoi passer par d’autres étapes (petites crises) ?
Peut aller dans le positif, mais certains renforcements par approximation fonctionnement malheureusement dans le négatif, fonctionne dans les 2 sens.
Enfant crise : parent veut acheter la paix, cède, renforcement du comportement négatif,
Prochaine fois : crise plus intense, parent cède pour éviter une crise plus intense
Enfant est façonné à faire des crises de plus en plus intenses puisque c’est cela qui donne une récompense, qui amène ce qu’il veut
Shaping: Meilleures pratiques
Meilleures pratiques des entraîneurs
Un pas à la fois
Renforcement immédiat
Petit renforcement
Meilleure approximation
Ciblé le client là où il est dans son processus, petite récompense pour une meilleure approximation (action qui se rapproche le plus) du comportement.
Caractéristiques affectant l’apprentissage
Contingence
+ c’est contingent, plus il y a apprentissage
Contiguïté
+ le temps est rapproché, + il y a apprentissage
Contingence parfaite si à chaque fois que j’étudie j’obtiens de bons résultats (réception de récompenses)
Suite
Caractéristiques du renforcement
Valeur pour l’individu
Privation
Rats affamés ou non
Personnes ayant besoin d’argent ou non
Plus le renforcement a une valeur pour l’individu, plus il sera facile à établir.
Comment savoir quel type de renforcement qui fonctionnerait ? Le temps passé à faire une activité OU en lui demandant tout simplement
Niveau de privation affectera aussi le renforcement. Si rats affamés, conditionnement se fait beaucoup plus facilement, même chose avec l’argent
Extinction du comportement renforcé
Extinction
Une réponse (ex: faire une crise) ne produit plus les conséquences attendues (pas de renforcement). Alors il y aura…
1) Explosion de l’extinction
Répétition du comportement pour obtenir le renforcement (ex: mettre plus d’argent dans la distributrice)
2) Augmentation de l’agressivité
(ex: frapper la distributrice)
3) Résurgence
Essayer un comportement qui a déjà renforcé dans le passé pendant l’extinction
On entraîne des pigeons à picorer
Puis, on met le fait de picorer en extinction
Ensuite, entraînement à battre des ailes
Extinction pour le comportement de battre des ailes
Réapparition du comportement de picorer
Explication du phénomène de régression ?
Exemple de la distributrice : Mettre 1$ pour obtenir quelque chose. La machine ne le prend pas, on remet plus d’argent. Ensuite étape 2,3…
Extinction ne fonctionne pas toujours, mais on valorise plus l’extinction que la punition, les deux ont les mêmes résultats à long terme, donc vaut mieux utiliser l’extinction.
Résurgence peut être une réponse réflexe ou un comportement volontaire, tout dépendant le cas.
Extinction : il n’y a plus le renforcement qui est donné
La théorie de réduction des drives du renforcement
La théorie de Hull
Drive Reduction Theory/Réduction pulsions
Hull croyait que le renforcement fonctionnait car il réduisait les pulsions de faim, de sommeil ou de sexe.
Ce ne sont pas les principaux renforcements
Les comportements non physiologiques sont parfois renforcés
Interruption de la copulation chez le rat avant l’éjaculation fonctionne comme renforcement mais ne réduit pas la pulsion sexuelle
Renforcement par le sucre fonctionne mais ne réduit pas la pulsion de faim
Théorie qui n’est plus vraiment en vigueur.
Drives —- Pulsions
Ont conditionnent beaucoup plus les gens avec de l’argent par exemple qu’en leur disant qu’on va les empêcher de dormir cette nuit. Ne fait pas partie des renforcements principaux
Punition
Types de punition
Positive
Qqchose d’aversif est ajouté à la situation
Chien jappe Frappe le chien
Négative
Qqchose d’agréable est retiré de la situation
Chien jappe Enlève jouet
Mise en garde pareille que pour le renforcement positif ou négatif :
Fait un crime, je vais en prison = Punition positive
Fait un crime et je perds ma liberté = Punition négative
Variables affectant la punition
Contingence
Corrélation entre le comportement et la punition
Contiguïté
Auprès d’enfants hyperactifs
Si réprimande immédiate alors effet positif
Si réprimande retardée alors aucun effet
Ex: retenue après l’école
Système judiciaire
Contingence : Est-ce qu’à chaque fois que je fais le comportement je reçois une punition ? —-Corrélation
Peut avoir une habituation dans le délit si ce n’est pas la première fois que cela arrive Ex : Délinquant pas stressé d’avoir commis un crime puisque ce n’est pas son premier
Contiguïté : Peut avoir beaucoup de temps entre le crime et les réprimandes, ça ne sert à rien de punir quelqu’un si c’est trop longtemps après le crime/l’action/le geste commis.
Ex : Retenue ne sert pas à grand-chose puisque cela arrive beaucoup plus tard que le moment du délit.
Suite
Introduction du niveau de la punition
Choc graduel avec les rats
Les rats endurent les chocs qui auraient normalement supprimé le comportement si appliqué du premier coup (Miller, 1960)
Habituation