Cours 3 : conditionnement opérant Flashcards
Conditionnement opérant
Stimulus + réponse + conséquence -> renforcement
Apprentissage par conditionnement classique ou par conditionnement opérant ?
A) rétroaction biologique : C.O. = SNA
B) autofaçonnement : C.C. = SNC
Comportement façonné par des contingences
Conditionnement classique
Conditionnement opérant
Renforcement et renforçateur : renforçateur = stimulus de renforcement (SR) et renforcement = procédé de donner ou retirer le stimulus
Renforcement négatif
Procédé par retrait d’une conséquence aversive
A) comportement d’échappement si le comportement entraîne le retrait de la conséquence
B) comportement d’évitement si le comportement permet d’éviter la présence de la conséquence (condition : présence d’un SD)
Nature des stimuli de renforcement
- Primaire (SR), secondaire (Sr),
- d’appui (ex. jetons)
- Artificiel, naturel
- Matériel, social
- Activité plaisante (haute probabilité d’apparition)
- Automatique et proprioceptif
- Intinsèque, extinsèque
Programmes de renforcement
Relation quantitative et temporelle entre un comportement opérant et ses conséquences
Programme continu : R-SR R-SR R-SR
Programmes intermittents : seules certaines R sont renforçées
Programmes différentiels : le temps
Programmes complexes : plusieurs programmes
Programmes intermittents
1) à proportion fixe : quantité égale (PF 5 ou PF 10) : courbe d’apprentissage en escalier (débit rapide et constant - pause)
2) à proportion variable : quantité aléatoire autour d’une moyenne (PV 5 ou PV 10) : courbe d’apprentissage : accélération stable sans pause (débit rapide)
3) à intervalle fixe : temps égal (IF 2 min. ou IF 4 min) : courbe d’apprentissage en paliers positivement accélérée (angl. scalloping)
4) à intervalle variable : temps aléatoire (IV 2 min. ou IV 4 min): courbe d’apprentissage : accélération stable
Programmes différentiels du débit
1) Différentiel du débit lent (DDL 10 ou DDL 20 sec) : le sujet est pénalisé (manque des occasions de renforcement) s’il va trop vite
2) Différentiel du débit rapide (DDR 10 sec ou DDR 20 sec) : le sujet est pénalisé s’il va trop lentement
Programmes complexes
1) En chaîne : R1 - R2 - R3 - SR
2) Multiple : si R monte dans un, baisse dans l’autre puis rétablissement
3) Mixte : tantôt R - SR1 même comportement (pas de SD), tantôt R - SR2, sans SD
4) Concurrent : R1 = SR1 / R2 = SR2
Loi de l’effet (Thorndike)
Conséquence plaisante ou déplaisante
Subjectif
Loi de l’effet empirique (Skinner)
a) le comportement opérant est défini en fonction de ses conséquences empiriques;
b) et le renforcement (ou la punition) est défini en fonction de ses effets empiriques
Conception skinnérienne
Sélection par les contingences de renforcement et sélection naturelle
- Les mécanismes de sélection darwinienne ont un effet sur le développement phylogénétique
- Le renforcement explique l’acquisition et le maintien de comportements appris et a donc un effet sur le développement ontogénétique
L’hypothèse de la probabilité différentielle (Premack)
La relation réponse conséquence (R-C) est remplacée par la relation R –R (deux réponses dont la probabilité d’apparition est différente)
Réponse à Haute probabilité = réponse contingence
Réponse à faible probabilité = réponse instrumentale (opérant)
La loi de l’appariement
B1/B2 = R1/R2
Les comportements régis par des règles
L’ensemble des réponses ou des actions humaines déclenchées ou maintenues par des règles (des directives, des instructions écrites, des exhortations, des invitations, des recommandations explicites ou implicites).
Ces règles sont analysées comme des stimuli discriminatifs ou directifs, c’est-à-dire des stimuli antécédents.