cours 8 Flashcards
décrire les différents programmes de renforcement
Programme de renforcement: désigne la réponse nécessaire pour obtenir un renforcement.
Programme de renforcement continu: chaque réponse spécifique est renforcée.
Programme de renforcement intermittent: seules certaines réponses sont renforcées.
nommez les 4 types de programmes intermittent de base
voir p.1
les programmes à proportions engendrent un débit de réponse ___ que celuis des programmes à ___
plus rapide
intervalles
le programmes à composante fixe engendrent des ___ après avoir eu le ___ contrairement au programmes à composantes ___
pause
renforcement
variables
voir p. 3
tableau comparaison p.3
doc word
programme à composante variable : le fait que le r peutêtre présent presque ___ , donc avoir eu r incite à répondre ___ après avoir eu r
immédiat
immédiatement
la réponse du PCV =
stable
programme a composante fixe : conséquence obtention d’un r est qu’un __ va précéder le prochain r
délai
dans le PCF ,il y a des ___
pauses
définir différence entre PF vs IF
Dans le programme PF: il y a une brève pause qui suit l’obtention du renforcement, avant la production d’un autre ensemble de réponses.
Dans programme IF: la pause après avoir obtenu le renforcement est suivie d’un débit de réponse de + en + rapide, à mesure que l’intervalle tire à sa fin et que l’apparition du renforçateur devient imminente.
définir le programme à durée, fixe vs variable
les programmes à durée : le renforcement est selon l’exécution d’un comportement étalée d’une certaine période de temps.
- durée fixe : comp exécuté en continu pendant une période de temps prévisible et fixe de n secondes, minutes ou heures. Ex ; appuyer pendant 10 sec
- durée variable : le comportement exécuté en continu pendant une période de temps imprévisible et variée d’en moyenne n secondes, minutes ou heures. Ex ; pas toujours même durée ; parfois 30 min,10 min
programmes DF vs DV
DF et DV: sont assez imprécis. Elle fait bien comportement ?
• PF: on sait précisément ce qui a été fait pour obtenir un renforçateur, soit un certain nombre de réponses.
• DF: ce qui constitue « l’exécution continue d’un comportement » durant l’intervalle varie fortement.
• Conditions qui nuisent a M.I si on renforce par M.E = risque programme à durée
définir le programme à débit , différentiel rapide vs différentiel lent, différentiel réponses rythmées
- Renforcement différentiel du débit rapide (RDDR) : Le renforcement est fonction de la production d’au moins un certain nombre de réponses en une certaine période de temps. Ex; faire 10 travaux pour être admis
- Renforcement différentiel du débit lent (RDDL) : Une période de temps minimale doit s’écouler entre deux réponses avant l’apparition du renforçateur
- Renforcement différentiel de réponses rythmées (RDRR) : Le renforcement dépend de produire une suite de réponses débit préétabli.
dans le RDDL, il faut attendre ___ avant la prochaine fois
10 sec
RDDL : la différence avec le IF 10 sec ?
Si on appuie durant 10 sec, ca change rien, alors que si on attend pas 10 sec ici = on retarde le 10 sec
donner un exemple de RDRR
Ex ; recevoir 10 morceaux de nourriture si il attend 1,5 sec entre appuie
décrire les programmes non contingents, à temps fixe, temps variable
Le renforçateur apparaît indépendamment de toute réponse.
2 types de programmes non contingents
1. Programme à temps fixe (TF) : le renforçateur apparaît après une période de temps prévisible et fixe, quel que soit le comportement du sujet.
2. Programme à temps variable (TV) : le renforçateur apparaît après une période de temps imprévisible et variée, quel que soit le comportement du sujet.
le renforcement contingent explique les comportement superstitieux ? inmé?
Étude Ono (1987)
« si vous faites quelque chose, des points peuvent s’ajouter au compteur »
Les joueurs et les athlètes professionnels sont très enclins à adopter des comportements superstitieux
Comportement superstitieux: une tentative de rendre plus prévisible une situation à priori imprévisible.
il arrive quoi si comportement non contingent d’ajoute à contingent
Ex; appuyer 5 fois pour obtenir nourriture, mais de temps en temps nourriture gratuite sans action, on remarque un déclin marqué, si peu importe ce que je fais je recois récompense ; déclin, si je suis sous condition ; + perfo
les effet sbénéfiques du renforcement non contingent selon rogers
Carl Rogers (1959): L’estime inconditionnelle.
Rogers a supposé que cette estime serait nécessaire au développement d’une personnalité saine.
L’estime inconditionnelle peut être considérée comme une forme de renforcement social non contingent procurant à l’enfant une base solide lui permettant d’explorer le monde et de prendre des risques
limite les comportements qui visent à attirer l’attention du parent.
définir et décrire les porgramme de renforcements complexes
Programme complexe: consiste en une combinaison d’au moins 2 programmes simples.
A. Un programme conjonctif: un type de programme complexe, dans lequel les exigences propres à au moins 2 programmes simples doivent être satisfaites avant la présentation d’un renforçateur.
Ex. IF 2mn(app au moins 1 fois après 2 min) et PF100 (app 100x levier)
B. Un programme ajustable: la demande de réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent.
Ex. PF100 PF110 etc, demande augmente selon perfo de la personne
Le processus de façonnement relève d’un programme ajustable car le critère à satisfaire pour obtenir un renforcement devient plus exigeant, selon la performance du sujet.
C. Un programme en chaîne: Consiste en une suite d’au moins 2 programmes simples,
• dans laquelle chacun a son propre SD (annoncer si tu émet comp, ca mène au renforcement), répondre a un mène a l’autre
• et dont le dernier produit un renforçateur terminal.
**L’individu doit compléter une suite de programmes pour obtenir le renforçateur convoité.
p. 7 ***
quelle est la différence entre les programmes conjonctifs vs en chaine ?
Différence entre ce programme et un programme conjonctif: les 2 programmes simples à termes doivent être menés dans un ordre précis, alors que l’autre IF2 peut être fait avant IF100 ou viceversa
les renforcateur secondaire (p.7) sont moins associé aux ___
récompenses
qu’est-ce qu l’effet de gradient du but ?
La différence de force de la réponse entre les premiers et les derniers maillons d’une chaîne
différence de force entre 1er et dernier maillon, + on se rapproche de récompense, + réponse = forte)
l’effet de gradient est aussi un ___ référant à la ____de la force ou de l’efficacité de la réponse qui se produit à mesure qu’on se ____
principe béhavio
hausse
rapproche de l’objectif à atteindre.
définir un enchainement à rebours
: bon moyen d’établir une réponse dans un programme en chaine
Barrière : escalader la barrière tunnel : courir dans le tunnel nourriture
Sd R Sr/Sd R Sr
l’enchainement et le ____ forment des moyens ____ permettant d’entrainer des animaux de cirsque et marins pour réaliser perfo
faconnement
essentiels
Par exemple suivre une cours est une très longue ___ car le R est ___
chaine
éloigné
les maillons sont comme des ___
renforcateurs visibles
décrire la théorie de renforcement
Formulée par Clark Hull (1943)
Selon cette théorie: un événement est renforçant s’il est associé à la réduction d’un type quelconque de pulsion physiologique.
Ex. aller au restaurant parce qu’on a faim
quel est le problème de la théorie de renforcement
Motivation incitatrice
Ex. le choix d’un restaurant en particulier, plutôt qu’un autre (offrent des plats épicés)
Ca ne répond pas à ce qu’il a proposé ; ca peut être psychologique
Définir le principe de Premack
Offre un moyen plus objectif de déterminer si quelque chose peut faire office de renforçateur.
Déf: est fondé sur la notion selon laquelle un renforçateur peut souvent être envisagé comme un comportement (ou réponse) plutôt que comme un stimulus.
le principe de Premack se réfère à la prob d’____
apparition d’un comportement
Ex ; rat appuie sur levier pour nourriture, appuyer sur levier = renforcer par acte de manger (renforcer par comportement plutôt que S)
selon le principe de Premack un comportement ___ peut servir à renforcer un comportement ___
très prob
peu prob
p.9**
PPremack met l’accent sur les ____ de certains comportements.
prob relatives/fréquences
Loi de grand-maman: « travailler d’abord (comportement peu probable), jouer ensuite (comportement très probable) »
Que faire si nous avons uniquement l’information de la probabilité pour un seul des comportements?
Comment savoir si ce comportement peut être utilisé comme renforçateur, avant de tenter de s’en servir?
hypothèse déprivation réponse
l’hyp dép. réponse postule qu’un comp peut servir de R si il a ___ à ce comportement __, si la ___ du comp est sous son ___
accès
restreint
fréquence
niveau préférentiel
définir le niveau préférentiel
correspond à un niveau de référence lorsque l’individu peut librement pratiquer cette activité. Donner seulement 15min sur la roue par jour donc rat va travailler plus pour avoir plus d’accès à la roue
EX ; p.10**
différence entre premack et hyp déprivation réponse
Se demander si la question centrale porte
sur la fréquence d’un comportement par rapport à celle d’un autre?
appliquer le principe de Premack
OU
sur la fréquence d’un comportement par rapport à son niveau de référence ou préférentiel
appliquer l’hypothèse de la déprivation de la réponse
Ne pas prendre pour acquis ce qui est renforçant ou pas ** différent pour chacun
décrire l’approche comportementale axée sur le point de satiété
Selon l’approche comportementale axée sur le point de satiété, un individu ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global.
p.11***
VS
L’hypothèse de la déprivation de réponse postule l’existence d’un seul niveau optimal de comportement qu’un individu s’efforce de maintenir.
Ce postulat peut s’appliquer à la manière dont un individu répartit son comportement entre plusieurs activités.
selon l’approche comp axée sur PS, les personnes répartissent leur comportement pour optimiser ____ le R. IL faut un mode de comp___ assumé par l’approche. Par contre les personnes ne sont pas si ___ et divers processus les éloigneront de cette ___
globalement
rationnel
rationnel
maximisation