Chapitre 7 (Cours 10) Flashcards
C’est quoi un plan de renforcement continue (CRF) ?
Le renforcement suit le comportement à chaque fois qu’il est produit
- Typiquement l’apprentissage le plus rapide
- Arrive rarement dans la nature
C’est quoi un plan à ratio fice (FR) ?
Le renforcement suit le comportement à chaque X fois qu’il est produit
C’est quoi une pause post-renforcement ?
Dans les plans à ratio fixes, les animaux prennent une pause après avoir reçu le renforcement, ce n’est pas nécessairement dû à la fatigue
C’est quoi un plan à ratio variable (VR) ?
Le renforcement suit le comportement à chaque X fois qu’il est produit en moyenne mais ca peut être plus ou moins que X
- Moins de pauses post-renforcement que dans un ratio fixe, la duré des pauses est souvent lié X le plus bas possible
- Produit plus de comportement qu’un ratio fixe avec la même moyenne
C’est quoi un plan à intervalles fixes (FI) ?
Le renforcement suit le comportement mais après il y a un délai avant que le comportement reçoive à nouveau un renforcement.
Plus on se rapproche de la fin du délai, plus on fait le comportement souvent
- Ex: Regarder quand le bus arrive, vérifier si la pizza est cuite, étudier pour un exam
C’est quoi un plan à intervalles variables (VI) ?
Le renforcement suit le comportement à chaque X temps, le X étant variable.
C’est quoi l’extinction burst ?
Juste après que l’extinction commence (que le comportement ne soit plus récompensé), il y a augmentation du comportement
Que se passe-t-il lors de l’extinction ?
Extinction burst
Augmentation du nombre de comportement différents
Résurgence
Agressivité
C’est quoi la résurgence ?
Durant l’extinction d’un comportement, il y a une augmentation de comportement qui ont déjà été extinct
C’est quoi le break point ?
Quand le comportement s’arrête drastiquement (la récompense est trop petite ou l’effort trop grand)
C’est quoi stretching the ratio ?
Quand on augmente graduellement le nombre de comportement que ca prend pour avoir la réponse
C’est quoi l’effet de renforcement partiel ?
Les comportements renforcés dans des plans intermittents sont plus résistants à l’extinction que ceux renforcés dans les plans continus.
C’est quoi l’hypothèse de la discrimination dans l’extinction ?
La discrimination entre l’extinction et un plan intermittent est plus difficile que la discrimination entre l’extinction et un plan continu
Donc l’extinction d’un plan intermittent est plus lente
C’est quoi l’hypothèse de la frustration dans l’extinction ?
Dans un modèle continu, après chaque comportement qui n’est pas suivi de renforcement, la frustration augmente. Dans un plan intermittent, on peut recevoir un renforcement lorsque l’on est frustré donc la frustration dérange moins ce qui ralentit l’extinction
C’est quoi l’hypothèse séquentiel dans l’extinction ?
Dans un plan continue, chaque comportement est suivi du renforcement. Le renforcement est donc un signal pour faire le comportement. Dans l’extinction, comme il n’y a plus de renforcement, il n’y a plus de signal pour effectuer le comportement.
Dans un plan intermittent, beaucoup de comportement sans renforcement sont un signal que le renforcement arrive bientôt donc ca créer une résistance à l’extinction