Examen 2 - Apprentissage Flashcards
Que vise le conditionnement opérant ?
Le conditionnement opérant ou instrumental vise à contrôler le comportement par ses conséquences, c’est-à-dire par ce qui suit le comportement dans le temps.
Définissez le conditionnement instrumental :
L’apprentissage instrumental est une modification de la probabilité de la réapparition d’une réponse, modification entraînée par l’apparition ou le retrait d’un événement particulier, le renforçateur, de façon contingente à la réponse.
Expliquez pourquoi on dit de l’apprentissage qu’il est instrumental :
On dit de l’apprentissage est instrumental, parce que l’effet est obtenu à partir du comportement, soit l’instrument.
Parler de la procédure utilisé concernant “la cage de Thorndike” :
Quel est le but de ces procédures ?
- Enfermer un chat affamé dans une cage (boîte à problème)
- Placer de la nourriture à proximité
- Observer les comportements du chat et le temps qu’il utilise pour trouver la solution et sortir de la cage
- Ces observations permettent de comprendre comment s’opère l’apprentissage
Parlez des observations faites en rapport à la cage de Thorndike :
1- Apprentissage par essais et erreurs
2- La solution est trouvé par hasard
3- D’un essai à l’autre, diminution progressive des réactions inutiles
4- En fin d’apprentissage, le chat ouvre immédiatement le loquet
- Le temps utilisé pour trouver la solution diminue d’un essaie à l’autre
- Il obtient le même résultat (la même courbe d’apprentissage) d’un animal à l’autre.
- Le temps diminue - le temps augmente - puis le temps diminue à nouveau et se stabilise
Parlez de la loi des effets de Thorndike :
- Un comportement qui produit une conséquence agréable ou qui élimine ou prévient une conséquence désagréable aura tendance à se répéter
- Un comportement qui produit une conséquence désagréable ou qui prévient (élimine) une conséquence agréable aura tendance à disparaître
- Éléments de base : Stimulus : Réponse –» conséquence
- Les comportements sont acquis en fonction de leur effet dans l’environnement.
» Pour Thorndike, l’apprentissage est un processus associatif caractérisé par la formation de connexions entre deux éléments en contiguïté spatiale
- Ces connexions sont fixées, renforcées par la répétition (ou affaiblies si les essais sont supprimés)
- Ces connexions sont renforcées ou affaiblies par l’effet des conséquences (positives ou négatives)
Décrivez le renforçateur :
- Un renforçateur est un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action
- Le renforçateur peut être de nature appétitive ou aversive
- Le renforçateur est un type particulier de contingence
Décrivez la contingence :
- La contingence renvoie à la relation séquentielle de dépendance entre deux événements
Décrivez la contingence en rapport au conditionnement opérant :
- Dans le cas du conditionnement opérant, la contingence spécifie les conditions sous lesquelles un comportement entraîne une conséquence donnée.
- Association en contingence d’un comportement et d’un stimulus qui entraîne une modification du comportement
- Un comportement est suivi d’un événement
Parlez des différents types de d’apprentissage instrumental ou de contingence
» Le renforcement : vise à augmenter ou à maintenir élevée la probabilité qu’un comportement apparaisse de nouveau en des circonstances similaires
- Récompense (renforcement positif) : le comportement est suivi de l’addition d’un stimulus appétitif
- Échappement/Évitement (renforcement négatif) : le comportement est suivie de la soustraction d’un stimulus aversif
» La punition : vise à diminuer ou à maintenir basse la probabilité qu’un comportement apparaisse de nouveau en des circonstances similaires
- Punition (punition positive) : le comportement est suivi de l’addition d’un stimulus aversif
- Omission (punition négative) : le comportement est suivi de la soustraction d’un stimulus appétitif
Analysez les quatre types d’apprentissage instrumental selon 3 points de vue :
» Types d’entraînement :
- Récompense
- Échappement/évitement
- Punition
- Omission
» Nature de la contingence :
- Renforcement positif
- Renforcement négatif
- Punition positive
- Punition négative
»Effets comportementaux :
- Augmentation
- Diminution
Quelles sont les questions à se poser pour déterminer la nature de l’apprentissage instrumental ?
- Quel est le comportement cible ?
- Quel est l’effet attendu sur la probabilité de réapparition de la réponse ?
- La réponse provoque-t-elle la présence ou l’absence de l’événement conséquence ?
- L’événement conséquence est-il aversif ou apétitif ?
Comparez l’apprentissage instrumental et le conditionnement classique :
- En conditionnement classique, la relation s’établit entre SN et SI. Le comportement du sujet n’a aucun effet sur l’apparition des stimuli
- En apprentissage instrumentale, la relation s’établit entre la réponse et sa conséquence. Le comportement détermine une conséquence, c’est-à-dire l’apparition ou la disparition du renforçateur
Décrivez les situations à essais discrets et les situations à essais continus :
» Situations à essais discrets (Labyrinthes, boîtes d’évitement, ect.)
- Le début et la fin des essais sont faciles à identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance.
» Situations à essais continus
- Situations opérantes libres (boîte de Skinner)
- Le début et la fin des essais ne sont pas clairement identifiés.
Qu’est-ce que le façonnement et dans quelles situations est-il généralement utilisé ?
- Cette procédure consiste à renforcer des approximations successives du comportement. À la toute fin, seul le comportement désiré sera renforcé. Ex. Entraînement à la continence.
- Le façonnement consiste à renforcer, de façon différentielles et successives, les comportements se rapprochant de plus en plus du comportement
- Le façonnement est généralement utilisé lorsque des réponses complexes doivent être apprises ou lorsque les réponses ne font pas partie du répertoire comportemental de l’organisme.
- Le façonnement par approximations successives est une méthode pour acquérir un comportement peu présent d’un organisme.
La technique du façonnement vise à programmer une série d’étapes entre le comportement de base, tel qu’il existe avant tout apprentissage, et la réponse terminale qu’on cherche à faire émettre à l’organismes.
Il s’agit alors de renforcer progressivement et successivement chacune de ces séquences d’action, jusqu’à amener l’organisme à adopter le comportement désiré.
Ainsi, l’organisme va peu à peu fournir la réponse souhaitée, grâce à une “récompense”, associée à chaque acte allant dans le sens de cette réponse terminal.
Qu’est-ce que le stimulus discriminatif ?
Dans une situation d’apprentissage instrumental, il peut y avoir d’autres stimuli que le stimulus renforçateur.
Le stimulus discriminatif signale à l’animal une occasion de répondre.
La réponse est déclenchée en présence d’un stimulus particulier. Le sujet discrimine, ou fait la différence, entre un stimulus et un autre.
Parlez des types de renforçateur :
» Renforçateurs primaires :
- Ne nécessitent aucun entraînement préalable
- Les renforçateurs biologiquement important : nourriture, eau, sexe, attention, approbation, choc électrique
- Les renforçateurs sensoriels ont une valeur renforçante uniquement à cause de la simple stimulation des organes sensoriels.
» Renforçateurs secondaires :
- Stimuli qui entraîne une satisfaction n’ayant pas de valeur biologique intrinsèque
- Les renforçateurs secondaires acquièrent des propriétés renforçantes à la suite de pairages successifs avec un renforçateur primaire : argent, biens matériels, économie de jetons
- Caractéristiques de renforçateurs secondaires ou conditionnées : la prévisibilité
Qu’est-ce que le principe de Premack ?
Une réponse à forte probabilité naturelle d’apparition peut renforcer une réponse dont la probabilité d’apparition est plus faible.