Cours 7 : Programmes de renforcement/extinction Flashcards
Programme de renforcement
La demande de réponse à satisfaire pour obtenir un renforcement
Densité du programme (e nombre de fois qu’un renforcement est obtenu par l’organisme)
Simple v. Complexe (combinaison de 2 programmes ou plus)
Programme de renforcement simple
Programme de renforcement intermittent (ou partiel): certaines réponses sont renforcées
Programme de renforcement non-contingent: le renforçateur apparaît indépendamment de toute réponse
Programme à proportion fixe (PF): le renforcement est fonction d’un nombre de réponses prévisible et fixe.
Programme à proportion variable (PV): renforcement est fonction d’un nombre de réponses imprévisible et varié.
Exemples de programmes à proportion fixe
Recevoir un dollars pour chaque devoir terminé (PF1- continu)
Un enfant qui fait 10 tableaux de multiplication est récompensé avec du temps libre (PF10)
Exemples de programmes à proportion variable
Un rat est en moyenne récompensé après 10 appuis d’un levier (PV10) avec possibilité d’appuyer jusqu’à 20 fois.
Un écureuil en moyenne déterre 30 noix (PV30) avec la possibilité de déterrer 60 trous.
Programmes à intervalle
Programme à intervalle fixe (IF): le renforcement est une fonction de la première réponse donnée après une période de temps prévisible et fixe.
Programme à intervalle variable (IV): le renforcement est une fonction de la première réponse suivie d’une période de temps imprévisible et variée.
***Tout comportement accompli durant l’intervalle est inutile pour l’obtention du renforcement.
Exemples de programmes à intervalle
Programme fixe:
Appeler sa banque et se faire dire d’attendre 10 minutes pour qu’un employé prenne son appelle (IF 10 min.)
Programme variable:
Appeler sa banque et se faire dire d’attendre pour qu’un employé prenne son appelle et qu’en moyenne on attend 30 minutes (IV 30 min)
Autres programmes de renforcement simple
Programme à durée: le renforcement est fonction de l’exécution d’un comportement étalée tout au long d’une certaine période de temps.
Programme de débit de réponse: le renforcement est directement fonction du débit de réponse du sujet.
Programme de renforcement non-contingent: le renforçateur apparaît indépendamment de toute réponse
Pas nécessaire de produire une réponse quelconque
Programmes à durée
Programmes à durée fixe (DF): le comportement doit être exécuté en continu pendant une période de temps prévisible et fixe.
Programmes à durée variable (DV): le comportement doit être exécuté en continu pendant une période de temps imprévisible et variée.
Problèmes avec les programmes à durée
Programme imprécis puisque «l’exécution continue d’un comportement» pour obtenir le renforcement peut varier.
Le comportement renforcé est indépendant du comportement de l’organisme
Potentiel de miner la motivation intrinsèque envers une activité si le renforcement ne reflète pas l’effort mis dans le comportement.
Programmes de débit de réponse
Renforcement différentiel du débit rapide (RDDR): le renforcement est une fonction de la production d’au moins un certain nombre de réponses en une certaine période de temps.
Renforcement différentiel du débit lent (RDDL): une période de temps minimale doit s’écouler entre deux réponses avant l’apparition du renforçateur.
Renforcement différentiel de réponses rythmées (RDRR): le renforcement est fonction de la production d’une suite de réponses selon un débit préétabli.
Les programmes non contingents
Programme à temps fixe (TF): le renforçateur apparaît après une période de temps prévisible et fixe, quelque soit le comportement du sujet.
Programme à temps variable (TV): le renforçateur apparaît après une période de temps imprévisible et variée, quelque soit le comportement du sujet.
Expérience des trois leviers (programmes non contingents)
Des étudiants sont placés dans des cubicules contenant trois leviers et un compteur
Les étudiants sont ensuite avisés que s’ils font quelque chose, ils auront plus de points ajoutés à leur compteur
Demander d’accumuler le plus grand nombre de points possible
En réalité, les comportements des participants n’avaient aucun effet sur leur pointage (participants divisés soit dans un programme TF ou TV)
Résultats: les participants ont adopté des comportements pour activer les leviers
Les programmes non contingents et la superstition
Comportements superstitieux en tant qu’effets secondaires du renforcement contingent d’un autre comportement
Bénéfices d’un programme non contingent
Pour réduire certaines situations ou comportements non-désirés
Un programme non contingent assure une source d’attention continue qui évite le développement de comportements mal adaptés.
Implications théoriques
Confirmation empirique de l’estime inconditionnelle (Rogers, 1959)
- L’amour, le respect et l’acceptation nécessaires pour le développement d’une personnalité saine.
Confirmation empirique des théories de Maslow (1971) sur l’éducation d’un enfant