Bloc 8 Flashcards
Qu’est-ce que le renforcement partiel?
- Chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement.
- Caractéristiques: 90% d’efficacité.
- Effets: Ralentissement de la courbe d’apprentissage, résistance à l’extinction.
Qu’est ce que le renforcement continu?
- Chaque réponse appropriée est suivi d’un renforcement.
- Caractéristiques: 100% efficace, rapide à apprendre mais facile à oublier.
- Il n’y a pas d’effet de frustration, donc l’émotion n’est pas présente dans ce renforcement.
Pourquoi l’extinction se fait plus difficilement avec le renforcement partiel plutôt que le renforcement continu?
Par le fait que d’autres facteurs psychologiques font effets dans l’apprentissage. Ex: motivations et émotions
Quels sont les conséquences des motivations et des émotions dans le renforcement?
Motivation: variable importante pour le choix et les besoins
Émotion: parfois elle aide, parfois elle n’aide pas. La frustration est une émotion qui complique l’apprentissage.
Expliquer le plan à ratio dans les renforcement simple.
- Basé sur le nombre de réponses.
- Les réponses de l’animal contrôle la conséquence
- Aspect important: le nombre de réponse faites (pas la force, ni la probabilité)
Expliqué le plan à ratio fixe et le plan à ratio variable.
- Plan à ratio fixe: Le nombre de réponse ne change pas. Ex: le rat peses toujours le même nombre de fois pour avoir de la nourriture.
- Plan à ratio variable: le nombre de réponses est variable. (Peut avoir un effet de frustration) ex: le nombre de pesée requise du rat varie à chaque réponse.
Expliquer le plan à intervalle dans le renforcement simple.
- Basé sur le délai depuis le dernier renforcement.
- Une fois qu’il a une récompense, un délai est parti. Ex: 30 seconde, et ensuite le levier se reactive après cette variable de temps, l’animal identifiera le temps et saura quand répondre.
Expliqué le plan à intervalle fixe et le plan à intervalle variable.
Plan à intervalle fixe: toujours le même délai de temps entre les réponses.
Plan à intervalle variable: le délai de temps est variable entre les réponses.
Expliquer les plans à ration fixe.
- Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives.
- Fixe: le nombre de réponses nécessaires ne changent pas.
- Exemple: le travail payé à l’unité profuite
- Comportement observé: réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés.
- Caractéristiques: produit des réponses intenses et rapides, peut amener à vouloir consommer la récompense, se donner des pauses aux réponses (vacances)
Expliquer les plans à ratio variable.
- Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives.
- Variable: le nombre de réponses nécessaires varie d’un renforcement à l’autre.
- Exemple: une machine à sous
- Comportement observé: effort élevé et constant.
Expliquer les plans à intervalle fixe.
- Intervalle: le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alord suffisante
- Fixe: la durée de l’intervalle ne change pas d’un renforcement à un autre.
- Exemple: vérifier si le courrier est passé
- Comportement observé: des réponses isolées et espacées dand le temps.
- Résumé: lorsqu’on à eu une récompense, pendant une période de temps X, cette récompense ne sera plus disponible peu importe ce qu’on fait. (Période réfractaire) cette période sera toujours de la même longueur. Ex: le salaire aux deux semaines.
Expliquer les plans à intervalle variable.
- Intervalle: le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante.
- Variable: la durée de l’intervalle varie d’un renforcement à un autre.
- Exemple: recomposer un numéro de téléphone occupé.
- Comportement observé: rythme de réponses lent, mais constant
- Résumé: Faire la réponse après un certain temps qui est variable. L’essai de réponse varie aussi selon le temps que le sujet est prêt à estimer.
Expliquer l’expérience de Hammond sur la contiguïté vs la contingence.
- Phase 1: le rat presse des leviers et, à un certain moment, il y a une réponse. (Ratio variable) Le rat travail intensément.
- Phase 2: la machine est programmé pour distribuer la même quantité de nourriture, même sans la réponse du sujet.
- Phase 3: reviens à la phase 1
- Phase 4: reviens à la phase 2
Quels sont les hypothèses de l’expérience d’Hammond?
Le rat ajuste son comportement par rapport à son entourage et, une fois que c’est mis en place, les réponses se font instinctivement.
Qu’est-ce que la notion de renforçateur pour chaque chercheur?
- Pavlov: “Les renforçateurs sont des SI qui sont pairés avec des SC”
- Thorndike: “Les renforçateurs fournissent de la satisfaction et ceci établit des connections entre les stimuli”
- Skinner: “Un renforçateur est tout stimulus qui augmente la réponse qui le précède”
- Toutes les théories à date: le stimulus inconditionnel est renforçateur du stimulus conditionné. Tout stimulus qui augmente la réponse est un renforçateur. S’il la diminue, c’est un punisseur.