TD1 : Apprentissage en cage de Skinner Flashcards
Décrire la boîte de Skinner.
C’est un cage transparente avec un levier (partie externe et interne), un tuyau et des électrovannes pour amener de l’eau. L’appareillage électronique des vannes a :
-à gauche, le N=1 pour programme de raison fixe 1 (1 appui=1 arrivée d’eau, sauf si il y a déjà de l’eau dans la cuve). Il peut aussi y avoir un N aléatoire ou variable (plusieurs appuis aléatoirement)
-à droite, il y a le système A-R avec A le compteur d’appuis totaux (appui renforcés+non suivis d’arrivée d’eau+effectués par l’expérimentateur) et R le compteur des appuis renforcés (appuis suivis d’arrivée d’eau et plus rigoureusement bu par le rat). Il y a aussi une molette pour régler le délai de vidange de l’eau (long au début, cours ensuite).
_des boutons de remises à zéro des compteurs (toutes les 5 minutes) et des boutons de vidange pour contrôler la cage
Quelle est la condition préalable du rat pour cette expérience ?
Le rat doit être préalablement assoiffé 48h avant le début de l’expérience.
Que faut-il définir ?
L’expérimentateur définit 2 critères arbitrairement :
- un critère d’apprentissage (3 appuis successifs sur le levier et l’eau et bu). Il correspond au début de l’apprentissage et le véritable apprentissage correspond au plateau (quand les courbes A et E fusionnent)
- un critère d’arrêt (3 périodes de 5 minutes successives sans appuis). Il correspond à la satiété du rat.
Décrire et interpréter la courbe.
- Le redressement est corrélé négativement au nombre d’appui (explication de l’irrégularité des courbes).
- Pendant les 2 premiers blocs, il n’y a pas d’appuis : l’apprentissage n’est pas acquis (cpt d’exploration, de toilettage, stress, activité du rat la nuit)
- Pendant les blocs 3-4, il y a beaucoup de A mais peu de R : c’est le modelage (le critère d’arrêt du modelage est le critère d’apprentissage).
- Au bloc 5 =, on atteint le critère d’apprentissage.
- Puis il y a une phase d’augmentation rapide d’appuis sur le levier mais A et R sont différents. Le rat a encore des appuis inutiles : il a appris le lien entre appui sur le levier et arrivée d’eau.
- Après, il y a un plateau et A=R : le rat a optimisé son comportement et prend en compte le délai de vidange de la cuve.
- Il y a une chute rapide du nombre d’appui renforcé qui souligne la satiété du rat.
- Enfin, on atteint le critère d’arrêt de la manipulation.
Qu’est-ce que le modelage ?
Le modelage est la procédure de renforcement des comportements approximatifs d’approche afin d’observer le comportement cible. Il accélère l’apprentissage.
Quel est le but de cette expérience ?
Le but de cette expérience est de montrer le conditionnement opérant, instrumental, de type 2 ou skinnerien (=les conséquences du rat on des conséquences sur son environnement). On montre aussi la loi de l’effet (tout comportement est fonction de ses conséquences : si un comportement est bénéfique pour l’organisme, il y a une grande probabilité d’être reproduit.
Comment fait-on pour réaliser cet apprentissage ?
On utilise du renforcement positif (=procédure qi tend à faire augmenter la fréquence d’apparition d’un comportement suite à la présentation d’un agent renforçateur). L’agent renforçateur est la présence de l’eau (en général, c’est la présentation d’un stimulus appétitif ou le retrait d’un stimulus aversif). Le stimulus appétitif primaire est l’eau. Le bruit d levier est d’abord un stimulus aversif puis devient un stimulus appétitif secondaire annonciateur de l’eau.
Ici, l’apprentissage est rapide, condensé, massé dans le temps (en 4h). On peut aussi faire un apprentissage échelonné ou distribué dans le temps.
Pourquoi faut-il toujours vérifier qu’il y a suffisamment d’eau ?
S’il n’y a plus d’eau, alors la chute brutale du nombre d’appuis correspond à une extinction (=procédure qui tend à faire disparaître progressivement un comportement suite au retrait de l’agent renforçateur).
Comment faire pour que la manipulation dure plus longtemps ?
Pour faire durer la manipulation, on joue sur la raison N qui peut être fixe grande ou aléatoire. (Mais l’extinction sera alors plus longue)