8. cdtnmt opérant suite Flashcards
quels sont les 2 types de renforcement au niveau temporel
renforcemt continu
chaq réact° correcte est renforcée
renforcemt intermittent plus résistants à l’extinct°
- programme à proport° = récompenses liées au nbr de réponses émises
- programme à intervalle = n’apparaissent qu’après laps de tps
expliquez le principe des réact° cumulatives
conditionnemt + efficace si bcp de réact° avec peu de latence => pente raide
quels sont les 4 programmes de renforcement qu’a étudié Skinner
progr à proport° fixe (FR)
réact° rapides ms pas durables (rendemt product° usine)
à proport° variable (VR)
proport° par moyenne -> réact° rapides et durables (machines à sous addict° diff à traiter - on sait pas qd on gagne)
à intervalle fixe (FI)
slmt à la fin d’un intervalle -> peu durable (examen uni date prévue => travail slmt avt - scalloping)
à intervalle variable (VI)
en moyenne j’attend x sec -> difficile à apprendre ms très efficace pour perf constante et durable (surfer qui attend vague)
donnez des exemples de notations de programmes de renforcement
quelle combinaison de programmes de renforcement est plus efficace
on peut combiner => à proport° fixe pour acquisit° rapide puis à intervalle var pour maintenir
expliquez la notion de contingences ds le CO et à quoi cela conduit-il
relat° entre un comportemt (R) et une consqc (Sr) ds une certaine situat°
=> comportemt superstitieux = nourriture à intervalle régulier ss rapport avec comportemt => chaq pigeon dév réponse idiosyncrasiq (Skinner 1948)
expliquez le principe de Premack (1965)
les renforçateurs peuvent ê intérieurs (comportemt) au lieu d’externes => observe actions exécutées spontanémt par indiv
- celles exécutées souvent = renforçateur
- d’abord piano et aps TV*
- celles exécutées raremt = punition
- si trop tard à table alors pas de dessert*
le shaping
modif progressive comportemt spécifiq pour produire nvll réponse en renforçant comportemt approximatif = dressage
tigre saute, à travers cercle, puis feu
le chaining
mise en place d’une séquence de réponses ds un orde temporel
regard levier, va vers levier, presse levier
apprentissage discriminatif (Skinner 1938, 1953)
stimulus discriminatif (Sd) signale présence de contingences particulières de renforcemt et punit° conditionnemt classiq est nécessaire pour associer une contingence
token economy
= renforçateurs secondaires
points de fidélité ou cigarettes en prison
l’apprentissage à 2 processus (Mowrer 1939)
explicat° pour apprentissage d’évitemt qui est un phénomène de l’apprentissage discriminatif (puzzle box échappement et évitemt)
- cdtnmt classiq (sign learning) assoc d’un SC (son) avec un Sl (choc)
- cdtnmt instrumental (solution learning) learn qu’un comportemt spéc va terminer stimulat° aversive = renforcement négatif
=> suite à CC, un SC+ signale consqc aversive SI, ou SC- signale qu’il n’y a pas de consqc
vécus émotionnels ^c renforçateur / punit° (Mowrer 1960)
généralisat° de la théo -> émot° st les guides primaires du comportemt
shéma des consqc émotionnelles du CC