Cours 2&3 Flashcards
Le conditionnement instrumental utilise quel méthode?
La méthode expérimentale
Conditionnement instrumental
modification de la probabilité d’apparition d’un comportement due à l’apparition ou au retrait d’une conséquence (renforçateur). Le renforçateur peut diminuer (punition) ou augmenter (renforcement) l’occurrence d’un comportement
Apprentissage associatif
un comportement est associé une conséquence (un stimulus, une réponse, l’environnement, etc.)
la situation opérante libre
Skinner a développé une nouvelle procédure de sorte que le comportement est émis chaque fois que l’animal le souhaite.
On mesure la fréquence du comportement par unité de temps. Le début et la fin d’un essaie n’est pas clairement identifiable.
On mesure le nombre de fois que l’animal fait le comportement par minute.
Les composantes du CO
Stimulus - Réponse - Conséquence
Stimulus discriminatif
il indique si le comportement sera suivi d’une conséquence. Ex: l’auto de police
la présence de SD diminue l’efficacité de la punition, car le comportement qui n’a pas été puni a tendance à réapparaître lorsqu’il n’a pas de risque d’être puni
La généralisation
l’apprentissage de l’association entre le stimulus discriminatif et le comportement peut être généralisé à d’autres stimuli. Ex: lumière jaune = toute lumière.
Le gradient de généralisation
Plus la couleur lors du test est similaire à la couleur lors de l’entrainement (SD) plus il y de réponse au moment du test
Entrainement a la discrimination
l’animal peut discriminer les sons s’il est entraîner a la discrimination, avec la technique du modelage
Modelage
procédure qui permet de guider les comportements vers un comportement cible à l’aide d’approximation. Augmente toujours la difficulté pour réussir des taches complexes
Les programmes de renforcement
Conditionnement continu
Renforcement partiel : rapport fixe, variable - intervalle fixe, variable
Conditionnement continu
comportement est renforcé a chaque fois qu’il est émis. L’apprentissage est très rapide mais l’extinction aussi.
Renforcement partiel (intermittent)
Comportement n’est renforcé chaque fois qu’il est émis. Apprentissage plus long mais plus résistant. Ex: jeu de hasard.
Deux types: fixe et variable
Rapport fixe
Renforcement après un nombre fixe de comportement. Chaque renforcement est suivi d’une pause, plus le rapport est élever plus les pauses sont longues. Une fois que le comportement a repris les pauses sont plus rares.
Rapport variable
Renforcement a un nombre moyen de comportement. Ex: machine a sous. Comme le sujet ne sais pas quand il sera renforcer, le nombre de comportement augmente de façon continue, sans pause.
Intervalle fixe
Le renforcement est donné au 1er comportement émis après un intervalle fixe de temps se soit écoulé depuis le dernier renforcement, la fréquence du comportement augmente.