Cours 7 : PLANS DE RENFORCEMENT et NOTIONS DE RENFORCATEUR Flashcards
Quels sont les 2 types de plans de renforcement?
Simple et complexe
Quels sont les 2 types de plans de renforcement simples?
– Plans de renforcement à ratio
– Plans de renforcement à intervalle
Qu’est-ce qu’un plan de renforcement complexe?
2 règles ou plus (combinaison de renforcements simples)
Qu’est-ce que le renforcement continu?
chaque réponse appropriée est suivi d’un renforcement
Quels sont les avantages du renforcement continu?
- Apprentissage rapide: on récompense chaque réponse et chaque réponse a pour effet d’augmenter le comportement, la loi de l’effet s’applique à tous les pairages.
Quels sont les désavantages du renforcement continu?
- Problème: le renforcement continu n’est pas très résistant à l’extinction.
Dès que le levier ne donne plus de bouffe, le rat s’en rend compte, perçoit que les choses ont changé. On passe du blanc au noir!!!
Le renforcement continu est il préférable pour des conditions expérimentales ou cliniques?
- Pour des fins expérimentales: 90% du temps = renforcements continu et façonnement. (ça sert à rien de résister à l’extinction)
- Fins cliniques: le renforcement continu n’est pas la meilleure façon de préparer à l’environnement naturel. On ne veut pas de choc à la sortie.
Qu’est-ce que le renforcement partiel?
chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement
Quels sont les avantages du renforcement partiel?
Le rat a déjà vécu des fois où ça n’a pas marché: + résistant à l’extinction.
La récompense n’arrive pas: pas un signal d’extinction mais juste que ça a pas marché cette fois-ci.
Montrer un exemple de renforcement partiel indésiré possible (avec nouveaux parents qui se font dire que le bébé doit faire ses nuits et qu’ils doivent arrêter de s’occuper du bébé s’il pleure pendant la nuit.)
Si les parents craquent après 15 min de pleurs, cela indique au bébé qu’il doit pleurer un peu plus avant d’avoir sa récompense. Forme de renforcement partiel (passer de pleurer 3-4 min à 15 min)
(si le réconfort n’arrive pas toute de suite: pas un signal d’extinction mais juste que ça a pas encore marché cette fois ci)
Quelle est la meilleure façon de se débarasser d’un comportement renforcé partiellement?
La meilleure façon de se débarrasser d’un comportement est D’ABORD de retourner en renforcement continu.
Toujours dans le contexte de renforcement partiel, quelle est la signification de l’échec?
En renforcement partiel, l’échec signifie que ça va marcher après (éventuellement). Échouer est un signal possible du succès qui s’en vient.
Quelqu’un qui a toujours réussi n’a aucune expérience de l’échec. Avoir un échec est important pour apprendre que c’est pas la fin du monde.
Quel est l’effet du renforcement partiel sur la courbe d’apprentissage et l’extinction?
– ralentissement de la courbe d’apprentissage
– résistance à l’extinction
Nommer 2 types de plans de renforcement simples (ceux vus en classe)
Plan à ratio et plan à intervalles.
Qu’est-ce qu’un plan à ratio?
l’obtention du renforcement est conditionnel à la production d’un nombre de réponses répétitives
(il est basé sur le nombre de réponses)
Qu’est-ce qu’un plan à intervalles?
il est basé sur le délai depuis le dernier renforcement (dépend du moment où on fait le renforcement)
Quels sont les 2 types de plans à ratio?
– ratio fixe (FR)
– ratio variable (VR)
Quels sont les 2 types de plans à intervalles?
– intervalle fixe (FI)
– intervalle variable (VI)
Quel serait le “ratio fixe” d’un renforcement continu?
1:1
Qu’est-ce qu’un plan à ratio fixe?
l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives (toujours le même)
Donner un exemple de plan à ratio fixe
ex: un rat pèse 6x sur un levier, il a de la bouffe à la 3e fois et 6e fois.
Quel est le comportement observé et la courbe décrite par un plan de renforcement à ratio fixe?
Comportement observé : réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés (fatigue ou consommation)
Courbe de performance cumulative: escalier de moyenne pente (pente moins élevée que ratio variable)
Comment décrire la performance sous un plan de renforcement à ratio fixe? Donner un exemple de la vraie vie de plan de renforcement à ratio fixe.
La performance créée par un plan à ratio fixe (basé sur le nombre de réponse) est TRÈS élevée.
Quantité astronomique de réponses produites. MAIS possible détérioration de la qualité.
- il faut donc convaincre la personne que quelque part, la qualité est vérifiée.
Exemple : le travail payé à l’unité produite ou travail à la commission. (incite les vendeurs à plus aller voir les gens)