Plans de renforcement, renforçateurs - cours 7 Flashcards
qu’est ce qu’un renforcement continu vs un renforcement partiel ?
Continu : 100% de chance d’avoir une conséquence
Partiel : réponse pas toujours suivi de conséquence (infinité de modèles)
Lequel entre continu et partiel est le plus efficace ?
Le renforcement continu : courbe monte vite mais descend vite aussi
Quels sont les deux types de plans de renforcement simple ?
- Plan de renforcement à ratio
- Plan de renforcement à intervalle
Quel est l’intérêt du renforcement partiel ?
Apprentissage + lent MAIS courbe d’extinction plus lente aussi (résiste à l’extinction). + validité écologique
Pourquoi l’extinction est plus lente dans les plans de renforcement partiels ?
- Discrimination difficile (conséquence peut être associée à la mauvaise chose)
- frustration (tendance à interrompre le comportement/la recanaliser dans un contre-conditionnement = persister) –> exemple loteries
Qu’est ce que la théorie de la frustration ?
Exemple avec bébé qui ne fait pas ses nuits
Vrai ou faux : le plan à ratio est un plan de renforcement simple
Vrai
En quoi consiste le plan à ratio ?
obtention du renforcement est conditionnel à la production d’un certain nombre de répétitions (ex : appuyer trois fois pour avoir une friandise)
Quels sont les types de plans à ratios ?
Ratio fixes (nombre nécessaire est tjrs le même) et ratios variables (nombres changent)
Différence entre plans à ratio fixe/ratio variable
fixe : toujours le mm nombre de réponses nécessaires
variable : nombre de réponses nécessaires varie d’un renforcement à l’autre.
Comment se traduisent les courbes de performance des plans à ratios fixes ?
réponse à haute fréquence mais avec pause “post renforcement” lié à fatigue ou consommation
Comment se traduisent les courbes de performance des plans à ratios variables ?
pas de pause (ex: machines à sous)
effort élevé et constant
Définition plan à intervalle fixe
Renforcement est disponible seulement après une période de temps déterminée (ensuite 1 seule réponse est suffisante)
ex: Duolingo
Définition plan à intervalle variable
renforcement est disponible après une période de temps indéterminée (exemple de la tante Gertrude toujours au téléphone)
quels sont les comportements observés dans un plan à intervalle fixe ?
Réponses isolées et espacées dans le temps
quels sont les comportements observés dans un plan à intervalle variable ?
Rythme de réponses lent mais assez constant
Qu’a démontré Tinklepaugh en 1928 ?
Que les organismes apprennent à s’attendre à un renforçateur particulier (singes déçus devant feuille de salade)
= il y a de meilleurs renforçateurs que d’autres
Donc modification de la “loi de l’effet”
Quelle était la proposition de Colwill et Rescola dans leur modèle de la contingence ?
Stimulus –> Réponse –> Conséquence
En quoi consiste l’expérience de contingence d’Hammond en 1980, et à quoi celle-ci est apparentée ?
Phase 0 : apprentissage/conditionnement pré-expérimental
Phase 1 : renforcement de 5% des réponses. résultat : 3000 pressions/h
Phase 2 : continue renforcement phase 1 avec ajout de récompense dans 5% des cas où levier n’a pas été pressé.
(apparenté au principe de GO-NOGO)
Phase 3&4 = phases 1&2 (plan ABAB)
Quels sont les résultats de l’expériences d’Hammond ?
Nombre de réponses diminue graduellement presque à 0, puis revient au comportement précédent en phase 3.
Que peut on conclure de l’expérience d’Hammond ?
Montre qu’il n’y a pas d’extinction car retour au comportement = apprentissage de deux “différents chemins”.
Pour Rescola il n’y avait qu’une contingence par situation, or Hammond nous montre qu’il peut y en avoir deux
Quelles sont les différentes description de la notion de renforçateur selon Pavlov, Thorndike et Skinner ?
Pavolv : renforçateur = SI associés avec SC
Thorndike : renforçateur = fournis satisfaction ce qui établie des connections entre stimuli
Skinner : renforçateur = tout stimulus qui augmente la réponse qui le précède