Les programmes de renforcement - examen intra Flashcards
Quelle est la définition d’un programme de renforcement?
La demande de réponse à satisfaire pour obtenir un renforcement. Ce qui doit être fait pour s’assurer d’obtenir un renforcateur
Qu’est-ce qu’un programme de renforcement continu?
Un programme où chaque réponses est renforcée. Très efficace, facile à comprendre, utile pour faire apprendre qqch à quelqu’un.
Qu’est-ce qu’un programme de renforcement intermittent/partiel?
Programme où seules certaines réponses sont renforcées. Le plus courant dans la vie.
ex. faire 20 push-ups pour pouvoir boire de l’eau
Nommer les 4 types de programmes intermittent de base.
- Programme à proportion fixe
- Programme à proportion variable
- Programme à intervalle fixe
- Programme à intervalle variable
Quelle est la définition d’un programme à proportion fixe?
Programme intermittent où le renforcement est fonction d’un nombre prévisible et fixe
- ex. donner 3 coups de bec pr avoir morceau de fruit. = PF3
- Notés PFXX en fct du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
P/r au débit de réponse et aux pauses comment ils se manifestent dans un programme à proportion fixe?
- Débit de réponse rapide
- Courte pause après l’obtention de chaque renforçateur
- Retour rapide des réponses après la pause
Quelle est la relation entre la taille de la PF et la durée de la pause?
Positive: plus le PF est grand, plus la pause sera longue
ex. pause pour PF25 < pause pour PF100
Comment considère-t-on un programme PF à bas ratio vs à haut ratio?
Ratio = nb de comport./renforçateur
Bas ratio: renforçateur facile à obtenir = dense/riche
Haut ratio: renforçateur est difficile à obtenir = frugal
Quel est le problème avec les programmes denses? La solution?
Souvent très couteux.
Solution: passer vers des programmes + frugaux = étirement de la proportion
Quel problème peut engendrer l’étirement de proportion?
Si étire trop peut engendrer dégradation dans le comportement = tension de ratio
Qu’est-ce que la tension de ratio?
Perturbation de la réponse causée par une demande trop exigeante, donc pu envie de produire le comportement pour obtenir le renforçateur.
Donne la définition d’un programme à proportion variable.
Programme où la réponse est en fonction d’un nombre de réponses imprévisible et varié
- Ex. donner en moyenne 3 coups de bec pour obtenir un morceau de fruit = PV3
- Noté PVXX en fct du nb moyen de réponses qui doivent être effectuées pour obtenir le renforçateur
Quel est le problème des programmes à proportion variable ?
Ne tient pas compte de la variance.
Ex. renforçateur obtenu en moyenne après 10x –> réponse faite entre 1-20x vs entre 8-12x (le 1er a plus de variance mais moyenne est la même)
Quelles sont la caractéristiques de la vitesse de la réponse/longueur de la pause dans les programmes à proportion variable?
- Débit de réponse rapide et stable
- Peu de pause: car chaque bon coups pourrait être le prochain
Comment varie le temps de pause en fonction de la variance?
Peut aller jusqu’à aucune pause si nombre minimum de réponses est très bas.
Ex. pause PV10, 8-12x > pause PV, 1-20x
Quels types de comportement mal adaptés de la vie de tout les jours peuvent découler d’un programme à proportion variable?
Jeu compulsif, LA crise de bacon qui fonctionne
Donner la définition d’un programme à intervalle variable.
Programme où le renforcement est fonction de la première réponse produite après une période de temps prévisible et fixe.
- Ex. attendre 30 secondes pour tirer corde et avoir nourriture = IF30 sec
- Noté IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
Quelles sont la caractéristiques de la vitesse de la réponse/longueur de la pause dans les programmes à intervalle fixe?
- Un mode de réponse ondulatoire
- Pause après l’obtention d’un renforçateur
- Après pause, débit de réponse de + en + rapide à mesure que l’intervalle s’écoule (car sait que renfor. sera bientôt disponible)
Dans les programmes à intervalle fixe, le temps devient quel type de stimulus?
Un stimulus discriminatif qui devrait indiquer à l’organisme quand le renforçateur devient disponible.
Donner la définition d’une programme à intervalle variable.
Programme où le renforcement est fonction de le première réponse produite après une période de temps imprévisible et variable
- Ex. attendre en moyenne 30 sec avant de tirer sur corde pour avoir nourriture = IV30 secondes
- Noté IVXX du temps qui doit s’écouler en moyenne avant que le comportement puisse donner accès au renforçateur
Quel est le problème dans les programmes à intervalle variable?
Ne tient pas compte de la variance.
Quelles sont la caractéristiques de la vitesse de la réponse/longueur de la pause dans les programmes à intervalle variable?
- Débit de réponse stable et modéré (pas besoin en faire beaucoup, juste le faire de manière constante)
- Peu de pauses après l’obtention de chaque renforçateur
- Peut aller à aucune pause si intervalle minimum très court: chaque prochain coup (IV10, 1-20 secondes) aurait plus de chance d’être le bon que si moins de variance (IV10, 8-12 secondes)
Quel programme permet de produire des comportements réguliers sans avoir besoin d’utiliser beaucoup de renforçateur?
Programme à intervalle variable. Puisqu’il s’agit de temps, le comportement devient très régulier