Apprentissage Et Mémoire Flashcards
Chapitre 3 partie 1
Le conditionnement classique
Forme d’apprentissage par association où un stimulus jumelé à un autre à répétition fini par provoqué la même réponse que le stimulus initial
Stimulus neutre à un stimulus conditionnel
Pour transformer un stimulus neutre à un stimulus conditionnel on doit conditionner le sujet à répondre au stimulus neutre.
Stimulus inconditionnel
Il provoque ordinairement la même réaction ou réflexe chez le sujet peu importe la situation. Le fait de saliver devant la nourriture ne devrait pas changer chez un chien.
La réponse invariable du sujet
La réponse inconditionnel
Une réponse conditionnelle
Le nouveau comportement créé plus ou moins artificiellement par la présentation simultanée des stimuli conditionnels et inconditionnels
Phase d’acquisition
Le sujet apprend l’effet que produit la présentation du stimulus conditionnel. Le SC à lui seule peut provoqué une RC (surtout après plusieurs associations de SI et SC)
L’extinction
Disparition graduelle de la RC du à l’absence d’un renforcement
Comment empêcher l’extinction
Il faut l’encourager de temps à autres en introduisant de nouveau un renforcement
Phase de généralisation de la RC
Tendance à donner la réponse conditionnelle en présence de stimulus similaire au stimulus conditionnelle initial
L’étude de cas fameuse pour la généralisation
Dans Le cas du Petit Albert, son peur s’est généraliser d’un peur des rats blancs à un peur d’un lapin blanc, un chien blanc, un col de fourrur blanc, un masque du père noël et aux cheveux blancs de Watson
Discrimination de la RC
Avec plusieurs tentatives, le sujet apprend à différencier entre l’objet qui à lui seul lui causé de l’anxiété et ceux qui lui ressemble
Corrélation entre les associations SI-SC qui sont logiques et le succès
Plus les associations SI-SC sont logiques, plus le conditionnement sera un succès
Pourquoi un oiseau est plus capable d’identifier sa nourriture qu’il aime en la voyant plutôt qu’en la goûtant
Certains animaux sont prédisposés biologiquement pour apprendre certaines connaissances de certains manières
Dans Le cas de Pavlov et ses chiens:
Avant le conditionnement, la nourriture est un stimulus _ et il apporte une réponse _ la cloche est un stimulus _ et il apporte une réponse _
Durant le conditionnement la cloche est un stimulus _ et la nourriture est un stimulus _ et ils apportent une réponse _
Après le conditionnement la cloche est un stimulus _ et il apporte une réponse _
Avant: nourriture=inconditionnel réponse=inconditionnelle cloche=neutre réponse=aucun
Durant: nourriture=inconditionnel cloche=conditionnel réponse=inconditionnel
Après: cloche=conditionnel réponse=conditionnel
Conditionnement opérant
L’organisme agit (ou opère) sur son environnement pour voir ce qui en sera le résultat (effets agréables ou désagréables)
Suggestions de Thorndike sur l’apprentissage des animaux
Les animaux apprennent par essaie et erreurs (non par l’intelligence)
La loi de l’effet
Les animaux agissent sur leur milieu pour ensuite observer l’effet. De cette façon, l’organisme va s’apercevoir si oui ou non son comportement est bien adapté à son milieu
On peu comparer cette loi au loi de survie du plus apte de Charles Darwin
Selon Thorndike par rapport à son expérience des chats affamés qui sortent d’une cage, s’agit-it d’un raisonnementpour expliquer l’apprentissage?
Non. Selon lui c’est “inutile d’évoquer le raisonnement” pour expliquer comment survenait ce type d’apprentissage: le chat se contentait de répéter le comportement qui produisait l’effet souhaité.
Renforcement et punition
Renforcement est pour créer un comportement.
Punition est pour faire disparaître un comportement
Renforcement positif
Tout stimulus qui va augmenter la probabilité que le comportement se répète par sa présence (qui est agréable)
Renforcement négatif
Tout stimulus qui va augmenter la chance que le comportement se répète par son absence.
Un comportement influencé par un renforcement négatif est suivi de:
Un retrait d’un stimulus désagréable
Le façonnement (l’apprentissage de comportements complexes)
Consiste à renforcer des approximations successifs qui se rapprochent du comportement désiré, guidant ainsi graduellement les réponses vers le but.
Punition
Tout stimulus qui va diminuer la chance que le comportement se répète par sa présence
Pourquoi la punition est moins efficace pour apprendre
Le punition n’indique pas quel comportement d’effectuer, seulement lequel on doit éviter
La punition encourage
Souvent de la haine, des ressentiments ou de la crainte de celui qui inflige la punition
Comment rendre une punition plus efficace
1) donner la punition durant ou le plus tôt après le comportement indésirable
2) choisir la punition la plus légère susceptible d’avoir l’effet désiré sur le comportement
3) la punition doit être constante
Renforçateur primaire
Renforce des comportements de base d’habitude reliées à des besoins biologiques (ex. Nourriture)
Renforçateur secondaire
Ne renforce pas immédiatement des besoins biologiques, mais ce type de renforçateur pourra être utilisé plus tard pour satisfaire ces besoins (ex. Argent pour la nourriture)
Renforcement continu
Chaque comportement correct est suivi d’un renforcement
Renforcement partiel (intermittent)
Pas tous les comportements voulus sont renforcés, mais ils seront renforcés de temps en temps. Ceci est plus efficace pour encourager un comportement appris.
Renforcement partiel à intervalles fixes
Le renforcement est obtenu uniquement après qu’un certain temps s’est écoulé. Toujours le même montant de temps.
Renforcement à intervalles variables
Renforcement obtenu après des intervalles de temps qui n’est pas toujours la même.
Programme de renforcement proportionnel (ratio) fixe
Le renforcement n’est pas fait en fonction de temps mais en fonction de nombres de tâches exécutés
Ex. Ménuisier payer par pièce et le treeplanting
Programme de renforcement proportionnel (ratio) variable
Le renforcement est fait en fonction de tâches exécutés, mais le nombre de tâches à exécuter varie de façon irrégulière
Pourquoi les machines à sous sont développé en utilisant un programme de renforcement à ratio (proportionnel) variable
- Elle a la fréquence de réponse la plus élevée
- A la performance régulière
- Elle est très résistant à l’extinction (La prochaine fois est peut-être la bonne)