cours 7 Flashcards
Quelle est la différence entre le renforcement continu vs le renforcement partiel ( son effet)
renforcement continu : chaque réponse approprié est suivi d’un renforcement
renforcement partiel : chaque réponse approprié n’est pas nécessairement suivi d’un renforcement
l’effet du renforcement partiel
- ralentissement de la courbe d’apprentissage
- résistance à l’extinction
explications
- discrimination difficile
- frustration
explique les plans de renforcement simple
plan a ratio : il est basé sur le nombre de réponses
- ratio fixe (FR)
- ratio variable (VR)
plan a intervalle : il est basé sur le délai depuis le dernier renforcement
- intervalle fixe (FI)
- intervalle variable (VI)
chaque type de plan produit une courbe de réponses caractéristique
explique le plan a ratio fixe
ratio = l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives
fixe : le nombre de réponses nécessaires ne change pas
exemple : le travail payé a l’unité produite
comportement observé : réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés (fatigue ou consommation)
explique le plan a ratio variable
ratio : l’obtention du renforcement est conditionnel a la production d’un nombre déterminé de réponses répétitives
variable : le nombre de réponses nécessaires varie d’un renforcement à l’autre
exemple : une machine a sous , VLT de Loto-Québec
comportement observé : efforts élevé et constant
explique le plan a intervalle fixe
intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée- une seule réponse est alors suffisante
fixe : la durée de l’intervalle ne change pas d’un renforcement à un autre
exemple : vérifier si on a reçu un chèque de bien-être social
comportement observé : des réponses isolées er espacées dans le temps
explique le plan a intervalle variable
intervalle = le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
variable : la durée de l’intervalle varie d’un renforcement a un autre
exemple : récompenser un numéro de téléphone occupé
comportement observé : rythme de réponses lent mais assez constant
Mais qu’est ce qui est associé ? (S-R ou R-C ?)
la loi de l’effet de Thorndike : “suivi” donc serait-il cas de l’apprentissage par la contiguité ?
skinner n’est pas d’accord car cela contredit la notion de contingence comme cause du conditionnement
or , en 1928 , Tinklepaugh démontre que les organismes apprennent à s’attendre a recevoir des renforçateurs particuliers : des singes a qui on donne une feuille de salade se montrèrent déçus quand ils “s’attendaient” a un morceau de bananes
on ne sait pas (a date)
explique l’expérience d’Hammond
l’expérience de contingence d’Hammond est apparenté au concept “go-no go”
phase 1 : renforcement de 5% des réponses
- résultat : 3000 pression de levier par heure
phase 2 : continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas ou aucune pression n’a été faite
- résultat : le taux de réponse diminue graduellement presque à zéro
phase 3 & 4 répétition de 1 & 2 (design ABAB)
explique la notion de renforçateur pour pavlov , thorndike et skinner
pavlov = les renforçateurs sont des SI qui sont associés avec des SC
Thorndike = les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli
Skinner = un renforçateur est tout stimulus qui augmente la réponse qui le précède