Les programmes de renforcement - examen intra Flashcards
Quelle est la définition d’un programme de renforcement?
La demande de réponse à satisfaire pour obtenir un renforcement. Ce qui doit être fait pour s’assurer d’obtenir un renforcateur
Qu’est-ce qu’un programme de renforcement continu?
Un programme où chaque réponses est renforcée. Très efficace, facile à comprendre, utile pour faire apprendre qqch à quelqu’un.
Qu’est-ce qu’un programme de renforcement intermittent/partiel?
Programme où seules certaines réponses sont renforcées. Le plus courant dans la vie.
ex. faire 20 push-ups pour pouvoir boire de l’eau
Nommer les 4 types de programmes intermittent de base.
- Programme à proportion fixe
- Programme à proportion variable
- Programme à intervalle fixe
- Programme à intervalle variable
Quelle est la définition d’un programme à proportion fixe?
Programme intermittent où le renforcement est fonction d’un nombre prévisible et fixe
- ex. donner 3 coups de bec pr avoir morceau de fruit. = PF3
- Notés PFXX en fct du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
P/r au débit de réponse et aux pauses comment ils se manifestent dans un programme à proportion fixe?
- Débit de réponse rapide
- Courte pause après l’obtention de chaque renforçateur
- Retour rapide des réponses après la pause
Quelle est la relation entre la taille de la PF et la durée de la pause?
Positive: plus le PF est grand, plus la pause sera longue
ex. pause pour PF25 < pause pour PF100
Comment considère-t-on un programme PF à bas ratio vs à haut ratio?
Ratio = nb de comport./renforçateur
Bas ratio: renforçateur facile à obtenir = dense/riche
Haut ratio: renforçateur est difficile à obtenir = frugal
Quel est le problème avec les programmes denses? La solution?
Souvent très couteux.
Solution: passer vers des programmes + frugaux = étirement de la proportion
Quel problème peut engendrer l’étirement de proportion?
Si étire trop peut engendrer dégradation dans le comportement = tension de ratio
Qu’est-ce que la tension de ratio?
Perturbation de la réponse causée par une demande trop exigeante, donc pu envie de produire le comportement pour obtenir le renforçateur.
Donne la définition d’un programme à proportion variable.
Programme où la réponse est en fonction d’un nombre de réponses imprévisible et varié
- Ex. donner en moyenne 3 coups de bec pour obtenir un morceau de fruit = PV3
- Noté PVXX en fct du nb moyen de réponses qui doivent être effectuées pour obtenir le renforçateur
Quel est le problème des programmes à proportion variable ?
Ne tient pas compte de la variance.
Ex. renforçateur obtenu en moyenne après 10x –> réponse faite entre 1-20x vs entre 8-12x (le 1er a plus de variance mais moyenne est la même)
Quelles sont la caractéristiques de la vitesse de la réponse/longueur de la pause dans les programmes à proportion variable?
- Débit de réponse rapide et stable
- Peu de pause: car chaque bon coups pourrait être le prochain
Comment varie le temps de pause en fonction de la variance?
Peut aller jusqu’à aucune pause si nombre minimum de réponses est très bas.
Ex. pause PV10, 8-12x > pause PV, 1-20x