Cours 2&3 Flashcards
Le conditionnement instrumental utilise quel méthode?
La méthode expérimentale
Conditionnement instrumental
modification de la probabilité d’apparition d’un comportement due à l’apparition ou au retrait d’une conséquence (renforçateur). Le renforçateur peut diminuer (punition) ou augmenter (renforcement) l’occurrence d’un comportement
Apprentissage associatif
un comportement est associé une conséquence (un stimulus, une réponse, l’environnement, etc.)
la situation opérante libre
Skinner a développé une nouvelle procédure de sorte que le comportement est émis chaque fois que l’animal le souhaite.
On mesure la fréquence du comportement par unité de temps. Le début et la fin d’un essaie n’est pas clairement identifiable.
On mesure le nombre de fois que l’animal fait le comportement par minute.
Les composantes du CO
Stimulus - Réponse - Conséquence
Stimulus discriminatif
il indique si le comportement sera suivi d’une conséquence. Ex: l’auto de police
la présence de SD diminue l’efficacité de la punition, car le comportement qui n’a pas été puni a tendance à réapparaître lorsqu’il n’a pas de risque d’être puni
La généralisation
l’apprentissage de l’association entre le stimulus discriminatif et le comportement peut être généralisé à d’autres stimuli. Ex: lumière jaune = toute lumière.
Le gradient de généralisation
Plus la couleur lors du test est similaire à la couleur lors de l’entrainement (SD) plus il y de réponse au moment du test
Entrainement a la discrimination
l’animal peut discriminer les sons s’il est entraîner a la discrimination, avec la technique du modelage
Modelage
procédure qui permet de guider les comportements vers un comportement cible à l’aide d’approximation. Augmente toujours la difficulté pour réussir des taches complexes
Les programmes de renforcement
Conditionnement continu
Renforcement partiel : rapport fixe, variable - intervalle fixe, variable
Conditionnement continu
comportement est renforcé a chaque fois qu’il est émis. L’apprentissage est très rapide mais l’extinction aussi.
Renforcement partiel (intermittent)
Comportement n’est renforcé chaque fois qu’il est émis. Apprentissage plus long mais plus résistant. Ex: jeu de hasard.
Deux types: fixe et variable
Rapport fixe
Renforcement après un nombre fixe de comportement. Chaque renforcement est suivi d’une pause, plus le rapport est élever plus les pauses sont longues. Une fois que le comportement a repris les pauses sont plus rares.
Rapport variable
Renforcement a un nombre moyen de comportement. Ex: machine a sous. Comme le sujet ne sais pas quand il sera renforcer, le nombre de comportement augmente de façon continue, sans pause.
Intervalle fixe
Le renforcement est donné au 1er comportement émis après un intervalle fixe de temps se soit écoulé depuis le dernier renforcement, la fréquence du comportement augmente.
Intervalle variable
Le renforcement est reçu après un intervalle de temps moyen qui varie d’une fois à l’autre. Ex: courriel électronique
Plusieurs facteurs modulent l’efficacité du renforcement positif
- l’identité du renforcement
- Le délai entre le comportement et le renforcement
- Le nombre de comportement à émettre avant d’atteindre le but
l’identité du renforcement
le renforcement doit être autant appétitif que le renforcement précédant sinon le comportement va diminuer (effet de contraste négatif)
Délai entre le comportement et le renforcement
si le délai entre les deux est long il peut avoir de l’interférence. Plusieurs comportements ont le temps d’être émis entre le comportement cible et la conséquence. La conséquence va être associé au comportement qui le précède.
Les comportements superstitieux
Forme d’interférence. Lorsque la conséquence est associé a un comportement précédant de façon aléatoire.
Le nombre de comportement à émettre avant d’atteindre le but
moins il reste de comportement à émettre avant d’obtenir le renforcement, plus il semble atteignable, plus le comportement sera émis souvent
Renforcement négatif
augmente la probabilité du comportement en supprimant un événement aversif.
- Échappement
- Évitement
- Échappement
événement aversif présent et la réponse l’élimine. ex: aspirine