Cours 7 Flashcards
Loi de l’effet : rappel
- Toute situation suivie d’une conséquence agréable : comportement augmente
- Toute situation suivie d’une conséquence désagréable : comportement diminue
Pour Skinner : Dès qu’un comportement augmente : renforcement
Dès qu’un comportement diminue : punition
Renforcement continu
chaque réponse appropriée est suivie d’un renforcement (garantie renforcement à chaque réponse → apprentissage rapide)
Très utile lorsqu’un comportement est façonné ou renforcé pour la première fois
Renforcement partiel
chaque réponse appropriée n’est pas nécessairement suivie d’un renforcement
-le comportement entraîne parfois le renforcement, et parfois non
Effets du renforcement partiel
- ralentissement de la courbe d’apprentissage
- résistance à l’extinction (puisque plus long)
Plan de renforcement simple
1) Plan à ratio
2) Plan à intervalle
Plan à ratio
Basé sur le nombre de réponse
1- ratio fixe
2- ratio variable
Plan à intervalle
basé sur le délai depuis le dernier renforcement
1- intervalle fixe
2- intervalle variable
Plan à ratio fixe
Ratio : l’obtention du renforcement est conditionnelle à la production d’un nombre déterminé de réponses répétitives
Fixe : le nombre de réponses nécessaires ne change pas
Exemple : le travail payé à l’unité produite
Comportement observé : réponse à haute fréquence, mais suivie d’une pause « post-renforcement » pour les ratios élevés (fatigue ou consommation) (fatigue = fatigue musculaire, fatigue de l’individu, les plans à ratio sont épuisants) (consommation = travailler dur un moment donné, puis longue période de vacances : accumulé assez de la récompense : pause de la récompense)
Lorsqu’un individu est sur le plan ratio, c’est lui qui contrôle les récompenses.
« Tant de fois à faire cela pour avoir récompense » → amène une motivation à répéter beaucoup la réponse.
Ratio de 1/1000 ne fonctionnerait pas, ratio de 1/5 oui.
On peut augmenter graduellement les ratios, jusqu’à très loin. Le fait de le faire graduellement empêche l’extinction.
Plan à ratio variable
Ratio : l’obtention du renforcement est conditionnelle à la production d’un nombre déterminé de réponses répétitives
Variable : le nombre de réponses nécessaires varie d’un renforcement à l’autre
Exemple : Une machine à sous de Loto-Québec
Comportement observé : effort élevé et constant
Les gens ne « peuvent » pas arrêter puisqu’ils ne savent pas quand la récompense peut arriver (peut-être à la prochaine réponse…)
Beaucoup plus résistant à l’extinction
Plan à intervalle fixe
Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée – une seule réponse est alors suffisante
Fixe : la durée de l’intervalle ne change pas d’un renforcement à un autre
Exemple : vérifier si on a reçu un chèque de bien-être social
Comportement observé : des réponses isolées et espacées dans le temps
L’intervalle débute lorsqu’on est récompensée.
Récompense – ensuite période de temps pendant laquelle la réponse n’entraîne pas la conséquence – Réponse suivie de récompense – ainsi de suite
L’intervalle ne finit pas tant qu’il n’y a pas eu la réponse (si qqchose est disponible après tel période de temps, cette chose va le rester jusqu’à ce que la réponse soit émise)
Plan à intervalle variable
Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée – une seule réponse est alors suffisante
Variable : la durée de l’intervalle varie d’un renforcement à un autre
Exemple : recomposer un numéro de téléphone occupé
Comportement observé : rythme de réponses lent, mais assez constant
Dépend de si urgent ou pas : si non → on va attendre + longtemps, si oui → on va le faire tout de suite
Dépend à quelle vitesse ont veut la récompense
Programme de durée fxe
Le comportement doit être fait de manière continue pour une période de temps prédictible. (le rat doit courir pendant 60 secondes pour avoir une pilule de nourriture)
Programme de durée variable
Le comportement doit être fait de manière continue pour une période de temps indéterminé
Quelle est la différence entre horaire à durée fixe/variable et à intervalle fixe/variable?
Les horaires à durée fixe/variable sont beaucoup plus flou qu’à intervalle. Le comportement fait « de manière continu » peut varier de beaucoup. Dans les pans à intervalle, les rats savent exactement ce qui doit être fait.
Renforcement différentiel des taux élevés
le renforcement est contingent à émettre au moins un certain nombre de réponse dans une certaine période de temps. Le renforcement est émis si la réponse est un taux élevé et non si elle est faite à un taux faible (pour ça que c’est au moins).