Conditionnement opérant Flashcards
Qu’est ce qui caractérise le conditionnement opérant?
Il se caractérise par la contingence
entre un comportement volontaire
(appelé « réponse » ici) et ses
conséquences (renforcement). Le conditionnement opérant correspond donc à ce que l’homme avait découvert sous le nom de dressage.
Comment fonctionne le conditionnement opérant?
Il s’agit pour le sujet d’apprendre à effectuer volontairement une action pour obtenir un renforcement.
Établissement d ’ un lien entre stimulus discriminatif (le levier) et réponse opérante (la pression sur le levier) grâce à un agent de renforcement (la nourriture).
La conduite est acquise lorsque le lien stimulus- réponse devient autonome
Citer un précurseur du conditionnement opérant et le procédé mis en place.
Le psychologue américain Thorndike (1874-1949) a conçu une « boîte-problème » dans laquelle il enfermait un chat (affamé). L’animal cherche par tâtonnement à sortir,
essayant pour cela divers moyens. Au début, le chat parvient à ouvrir la porte en actionnant au hasard le morceau de bois. En multipliant les essais, il apprend à sélectionner la bonne solution. L’animal effectue donc, selon Thorndike, un apprentissage par « essais et erreurs ».
Qu’est-ce qu’une réponse opérante?
Une réponse opérante correspond à une action ou une séquence d’actions qui possède une forme distincte et qui produit un effet déterminé sur l’environnement. Elle est volontairement émise par le sujet et donc, elle est la condition du renforcement.
Qu’est ce que le renforcement?
Conséquence d’un comportement qui rend
plus probable que le comportement soit reproduit de nouveau.
Quels sont les 3 catégories de renforcements?
1 - Renforcements primaires : correspondent aux besoins biologiques ou à des reflexes;
2 - Renforcements secondaires : correspondent aux renforçateurs dont l’efficacité est due à un apprentissage.
3 - Renforcement affectifs, cognitifs et sociaux : renforcements qui ne sont pas appétitifs ou aversifs mais qui semblent néanmoins primaires
Comment fonctionne la “boite de Skinner”
On place un animal motivé dans la boite de Skinner. Motivé, signifie affamé, ce qui le rend plus curieux et susceptible d’explorer son environnement. Dans cet environnement, on place une barre qui déclenche la récompense (= stimulus discriminatif). Parmi différentes actions de son répertoire comportemental, il arrivera qu’il appuie sur la barre (= réponse opérante),
déclenchant ainsi une récompense alimentaire, que Skinner dénomme, d’une façon générale, un renforcement.
il faut de nombreux essais et renforcements
pour qu’il y ait association entre l’appui sur la barre (Réponse Opérante) et la récompense alimentaire (Renforcement).
Qu’est ce qu’un stimulus discriminatif?
C’est un stimulus en présence duquel la probabilité ou la fréquence d’un comportement est modifiée.
Expliquez le renforcement positif et donnez un exemple.
Renforcement = Augmentation de la
fréquence du comportement…
Positif (+) = …par ajout d’un
stimulus
Exemple:
Le rat est dans la boîte de Skinner.
Le levier = stimulus discriminatif (SD)
Il pèse sur le levier = réponse opérante (RO)
Il reçoit de la nourriture = renforcement positif (R+)
Il augmentera la fréquence de son comportement
Expliquez le renforcement négatif et donnez un exemple.
Renforcement = Augmentation de la fréquence du comportement…
Négatif (-) = …par retrait d’un
stimulus
Exemple:
Le rat est dans la boîte de Skinner et il
reçoit de chocs électriques venant du plancher.
Le levier = stimulus discriminatif (SD)
Il pèse sur le levier = réponse opérante (RO)
Les chocs s’arrêtent = renforcement négatif (R-)
Il augmentera la fréquence de son comportement
Expliquez les punitions positives et donnez un exemple.
Punition = diminution de la fréquence du
comportement…
Positive (+) = …par ajout d’un stimulus
Le rat est dans la boîte de Skinner.
Le levier = stimulus discriminatif (SD)
Il pèse sur le levier = Réponse opérante (RO)
Il reçoit une décharge électrique = Punition positive (P+)
Il diminuera la fréquence de son comportement
Expliquez les punitions négatives et donnez un exemple.
Punition = diminution de la fréquence du
comportement…
Négatif (-) = …par retrait d’un
stimulus
Le rat est dans la boîte de Skinner
Le levier = stimulus discriminatif (SD).
Il pèse sur le levier = réponse opérante (RO)
Sa nourriture disparaît = punition négative (P-)
Il diminuera la fréquence de son comportement
Que signifie “punition” dans la philosophie du renforcement conditionné?
Dans la philosophie du renforcement conditionné, la punition signifie strictement « réduction de l’existence d’un comportement ». C’est la conséquence d’un comportement qui rend moins probable que le comportement soit reproduit de nouveau.
Qu’elle est la différence entre “renforçateur” et “renforcement”?
- RENFORÇATEUR (quelque chose que l’animal ou que l’homme aime ou déteste)
- RENFORCEMENT (l’ajout (+) ou le retrait (-)
d’un stimulus qui accroît l’existence d’un
comportement.-
Qu’est ce que l’apprentissage skinnerien?
L’apprentissage skinnerien = conditionnement opérant