Cours 8 Flashcards
Programme à durée fixe
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long d’une certaine période de temps fixe
- Ex: Un rat doit courir dans une roue pendant 10 secondes avant d’obtenir de la nourriture
- On doit garder une position de yoga pendant 2 minutes avant de passer à l’autre
- Notés DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur
- En lien avec les exemples plus haut on a: DF10 secondes, DF2 minutes
Programmes à durée variable
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement en continu pendant une période de temps imprévisible et variée
Ex: Un rat doit courir dans une roue pendant en MOYENNE 10 secondes avant d’obtenir de la nourriture
On doit garder une position de yoga pendant en MOYENNE 2 minutes avant de passer à l’autre
Notés DVXX en fonction du nombre de temps moyen que doit être exécuter le comportement pour obtenir le renforçateur
En lien avec les exemples plus haut on a: DV10 secondes, DV2 minutes
Le programme est fonction d’une moyenne donc on peut avoir un DV10
Renforçateur obtenu si la réponse est faite en continue entre 1 et 20 minutes mais en moyenne pendant 10 minutes
Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu si la réponse est faite entre 8 et 12 minutes mais en moyenne pendant 10 minutes
Ex: 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance
programme à durée : fixe et variable
Comparés aux autres programmes simples vus, ils sont habituellement plus imprécis dans leur capacité à faire produire des comportements
Plus de place à l’interprétation de ce qui doit être fait
- Courir pendant 10 minutes
- Courir vite vs. courir lentement,
- Travailler pendant 1h pour obtenir 15$
- Travailler fort vs. être au bureau
Besoin de plus de spécifications sur les détails des comportements à produire afin que l’on obtienne le résultat désiré
Programmes de débit de réponse
Programmes pour lesquels le renforcement est fonction du débit de réponse
Importance de l’aspect différentiel:
Un seul type de réponse est renforcé alors qu’un autre type ne l’est pas
Programmes de renforcement différentiel du débit rapide (RDDR)
Programme pour lequel le renforcement est fonction de la production d’au MOINS un certain nombre de réponses en une certaine période de temps
Plus généralement, seulement si le débit est assez rapide (aspect différentiel car tout débit plus lent n’est PAS renforcé)
Ex: Un pigeon qui doit appuyer au moins 10 fois en 1 minute afin de mettre fin à une stimulation douloureuse
Pour passer l’examen physique pour être policier.ière il faut faire au moins X nombres de push-ups en Y temps
Programmes de renforcement différentiel du débit lent (RDDL)
et différence avec prog …
Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponses en une certaine période de temps
Plus généralement, seulement si le débit est assez lent (aspect différentiel car tout débit plus rapide n’est PAS renforcé)
Ex: Un pigeon qui doit appuyer au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse. Ou attendre au moins 5 secondes entre chaque coup de bec
Différence avec le programme à intervalle fixe? VOIR ONE NOTE
Dans IF, les comportements faits dans l’intervalle n’ont pas de conséquence
Dans le RDDL, tout comportement de trop fait dans l’intervalle élimine la chance d’obtenir le renforçateur (on doit recommencer l’intervalle)
Programmes de renforcement différentiel de réponses rythmées (RDRR)
Programme pour lequel le renforcement est fonction d’une suite de réponses selon un débit préétabli
Plus généralement, seulement si le débit n’est NI TROP LENT, NI TROP RAPIDE (aspect différentiel car tout débit plus rapide ou plus lent n’est PAS renforcé)
Ex: Un pigeon qui doit appuyer au minimum 5 fois et au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse.
Danser un slow
Programmes non contingents (aussi appelés…)
Programmes pour lesquels le renforcement apparaît indépendamment de toute réponse
Aucune réponse n’est nécessaire pour obtenir le renforçateur
Aussi nommés programmes indépendants de la réponse
Programmes à temps fixe
Programme pour lequel le renforcement apparaît après une période de temps PRÉVISIBLE et FIXE, peu importe le comportement du sujet
Ex: Un poisson va recevoir de la nourriture toutes les 60 secondes
Cadeaux reçus à chaque année à son anniversaire
Noté TFXX en fonction du nombre de temps entre les renforçateurs
En lien avec les exemples plus haut on a: TF60 secondes, TF1 an
Programmes à temps variable
Programme pour lequel le renforcement apparaît après une période de temps IMPRÉVISIBLE et VARIÉE, peu importe le comportement du sujet
Ex: Un poisson va recevoir de la nourriture en MOYENNE toutes les 60 secondes
Les journées douces de février
Noté TVXX en fonction du nombre de temps moyen entre les renforçateurs
En lien avec les exemples plus haut on a: TV60 secondes, TFjamais
Le programme est fonction d’une moyenne donc on peut avoir un TV10
Renforçateur obtenu après 1 à 20 minutes mais en moyenne après 10 minutes
Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu après 8 à 12 minutes mais en moyenne après 10 minutes
Ex: 12, 8, 9, 11, 10,
Programmes non contingents ( et les composantes superstitieux…)
(compos sup peuvent aussi être en lien avec…)
DIAPO 1
Rôle dans l’apparition et le maintien de comportement superstitieux
Ex: Pigeons (Skinner, 1948)
Étudiants qui peuvent obtenir des points (Ono, 1987)
Athlètes, parieurs
Comportements
superstitieux peuvent aussi être en lien avec les détails du comportement
- Un comportement cause un renforcement mais comment il est fait n’est pas contingent du renforçateur
- Un «kit» confiance
DIAPO 2
Les comportements superstitieux apparaissent souvent chez les humains dans des contextes TVXX
Ce sont des contextes imprévisibles
Tendance innée à être intolérant à l’incertitude et à essayer de prévoir ou de contrôler l’incertitude
DIAPO 3
Si un programme non contingent est ajouté à un programme contingent
Le débit de réponse est habituellement ralenti (Rachlin & Baum, 1972)
Ex: joueurs de baseball (O’Brien et al., 1981)
Programmes de renforcement complexes
Programmes complexes
Une combinaison d’au moins deux programmes simples
Programme conjonctif
Un programme complexe dans lequel les exigences à au moins deux programmes simples doivent être satisfaites avant de recevoir le renforçateur
Ex: Un rat qui doit courir dans une roue pendant 2 minutes (DF2 minutes) et appuyer en moyenne 10 fois sur un levier (PV10) pour obtenir de la nourriture
Pour réussir une soirée presque parfaite vous devez compléter votre entrée, votre plat principal et votre dessert (PF3) et s’assurer de verser du vin au minimum à toutes les 2 minutes et au maximum à toute les 5 minutes (RDRR)
Programme ajustable
Programme ou la demande de réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent
Ex: Rat qui doit appuyer 10 fois sur un levier avant d’obtenir de la nourriture (PF10) puis qui doit appuyer 20 fois dans l’essai suivant (PF20)
Quand on apprend à faire de la musique, passer de faire la gamme lentement à rapidement
Très utile pour façonner exactement le comportement que l’on veut
On ajuste les critères pour les rendre le plus semblables à ce que l’on désire
Programme en chaîne
DIAPO 1
Programme qui consiste en une SUITE d’au moins deux programmes simples où chacun a son propre SD et dont le dernier produit un renforçateur terminal
Diffère du programme conjonctif car les programmes doivent être complétés dans un ordre précis
DIAPO 2 (images avec pigeon et les différents types de lumière, voir notes)
Programme en chaîne : dans ce type de renforcement ….. + causes
Dans ce type de programmes, les réponses aux premiers maillons ont tendance à être plus faibles que celles reliées aux maillons plus près du renforçateur terminal
Ex: avec une chaîne faite de plusieurs IF60 secondes, il y a des pauses plus longues et des débits plus lents au début qu’à la fin de la chaîne (Kelleher & Fry, 1962)
Causes
- Renforcement immédiat plus efficace que renforcement différé
- Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien est fort
- Principe général de l’effet du gradient
- Hausse de la force ou de l’efficacité de la réponse à mesure que l’on s’approche de l’objectif
Programme en chaîne : enchainement à rebours + revoir encore les notes des pigeons !!!
Pour établir un programme en chaîne on peut utiliser l’enchaînement à rebours
Enchaînement à rebours
- Établir un programme en chaîne en débutant par le maillon terminal et finissant par le maillon initial
L’apprentissage social
- Apprentissage social: généralités
- Apprentissage social: types
- Apprentissage social: imitation (vidéo sera ajoutée sur StudiUM)
- Apprentissage social: règles de contrôle du comportement (vidéo sera ajoutée sur StudiUM)
Apprentissage social : c’est quoi
Modifications du comportement par moyens indirects
Apprentissage par observation
Langage pour formuler des règles de contrôle du comportement
Apprentissage social : qui ?
Bandura & Walters (1963):
Les théories traditionnelles sur l’apprentissage demeurent très incomplètes puisqu’elles ignorent le rôle de l’apprentissage par observation
Une large proportion de l’apprentissage chez l’humain se produit par observation
App social : qui ?
apprentissage comme …. vs apprentissage comme…
Bandura & Walters (1963):
Apprentissage comme une expérience essentiellement individuelle
vs.
Apprentissage comme une expérience sociale
Apprentissage vicariant def
On observe le comportement chez les autres, on observe les conséquences et plus tard on produit ce comportement
Apprentissage par obs :
Apprentissage où un observateur regarde le comportement d’un modèle et modifie ensuite son propre comportement
Souvent appelé «apprentissage social»
Très efficace chez les humains
Processus social pour une espèce très sociale
Exemple 1 app social :
Amélioration (ou modification) de l’exécution de tâches en regardant d’autres personnes les réaliser
Exemple 2 app social
Amélioration (ou modification) de l’exécution de tâches en regardant d’autres personnes les réaliser
App social : conscient ou inconscient ?
L’apprentissage peut se faire inconsciemment
https: //www.youtube.com/watch?v=UYaY2Kb_PKI
https: //www.youtube.com/watch?v=XjJQBjWYDTs
L’enseignement peut aussi se faire inconsciemment
Le compo contagieux
Comportement plus ou moins instinctif ou réflexe que déclenche la manifestation du même comportement chez un autre individu
Ex: bâillements, tourner la tête lorsque l’on voit quelqu’un tourner la tête
Comportements reliés à la survie sont souvent contagieux
Ex: comportements de fuite
Comportements reliés aux interactions sociales sont souvent contagieux
Ex: rire
Ex: intimider une personne
VOIR 2 AUTRES DIAPOS QUI FONT UN LIEN AVEC
Intensification du stimulus (très efficace pour…)
c’est en raison de…
La probabilité qu’un individu manifeste un comportement donné se modifie parce que celui-ci dirige son attention vers un objet ou un endroit particulier en raison du comportement d’un autre individu
Relève de l’orientation contagieuse
Très efficace pour comportements reliés à l’action de manger, boire et se reproduire
Notion de déclencheurs
Le compo contagieux et l’intensification du stim ne produisent en gen…
Le comportement contagieux et l’intensification du stimulus ne produisent en général que des changements très temporaires dans le comportement.
Apprentissage par obs dans le cadre du conditionnement classique
Dans ce type d’apprentissage social, le stimulus a généralement un caractère émotif
Ex: Réponses émotionnelles vicariantes:
Réponses émotives issues d’un conditionnement classique qui résultent de l’observation de ces mêmes réponses chez d’autres personnes
Aussi appelées «conditionnement émotionnel vicariant»
Pomme (SN) : Peur chez autrui (SI) Peur (RI)
Pomme (SC) Peur (RC)
Apprentissage par obs dans le cadre du conditionnement classique : deux types de manif du fond émotionnel vicariant
Deux types de manifestations du conditionnement émotionnel vicariant
- Peur chez les autres = SI
Méduse (SN) : Peur chez autrui (SI) Peur (RI)
Méduse (SC) Peur (RC)
- Conditionnement d’ordre supérieur (Peur chez les autres = SC)
Peur chez autrui (SN1) : événements effrayants (SI) Peur (RI)
Peur chez autrui (SC1) Peur (RC)
Méduse (SN2) : Peur chez autrui (SC1) Peur (RC)
Méduse (SC2) Peur (RC)
Conditionnement supérieur impliqué dans le conditionnement de (1/2 é …)
Conditionnement supérieur aussi souvent impliqué dans le conditionnement d’émotions plus subtiles
Ex: les sourires
Sourires chez autrui (SN1) : événements agréables (SI) –> Émotions agréables (RI)
Sourires chez autrui (SC1) –> Émotions agréables (RC)
Huîtres (SN2) : Sourires chez autrui (SC1) –> Émotions agréables (RC)
Huître (SC2) –> Émotions agréables (RC)
Conditionnement supérieur impliqué dans le conditionnement de (1/2 impliqué pub …)
Sourires chez autrui (SN1) : événements agréables (SI) Émotions agréables (RI)
Sourires chez autrui (SC1) Émotions agréables (RC)
METTRE VOTRE PRODUIT ICI (SN2) : Sourires chez autrui (SC1) Émotions agréables (RC)
VOTRE PRODUIT (SC2) Émotions agréables (RC)
Émotions chez les autres peuvent donc être un SI ou un SC
Possibilité que les deux processus soient impliqués et même qu’ils pourraient se combiner et produire une réaction plus importante
Apprentissage par pbs ds le cadre du fond opérant
L’apprentissage par observation dans le cadre du conditionnement opérant
Acquisition vs. performance d’une réponse opérante
Ex: Observer des gens rouler des joints et avoir du fun pendant des années à la télévision et sur internet mais ne pouvoir le faire vous-même que depuis le 17 octobre 2018
Apprentissage par pbs ds le cadre du fond opérant : facteurs qui affectent l’acquisition
- L’observateur doit porter attention au comportement du modèle
- Conséquences du comportement du modèle - Est-ce que l’observateur reçoit un renforçateur s’il regarde un modèle
- Beaucoup utilisé par les professeurs et les entraîneurs - Est-ce que l’observateur possède les habiletés suffisantes pour bénéficier du modelage
- Les caractéristiques personnelles du modèle
- Plus de probabilité de porter attention si le modèle nous ressemble, si c’est quelqu’un qu’on respecte ou qui est reconnu comme une sommité