apprentissage instrumental Flashcards
Définition: Le comportement est suivi d’une ________ de façon à en modifier son niveau ______, soit augmenter ou diminuer sa _______ d’apparition.
conséquence
opérant
fréquence
Les deux types de conséquences qui peuvent être utilisées.
appétitives (plaisantes) ou aversives (déplaisantes)
Le conditionnement opérant vise à …
contrôler le comportement par ses conséquences, c’est-à-dire
par ce qui suit le comportement dans le temps
Pourquoi dit-on de l’apprentissage qu’il est instrumental?
parce que l’effet est obtenu à partir du comportement, soit l’instrument.
Les superstitions résultent d’un renforcement ou d’une
punition qui peut découler d’une simple __________
coincidence (exemple vu en classe: joueurs de baseball)
Vrai ou faux, le renforcateur augmente la réponse.
Faux, c’est le renforcement. Le renforcateur est la conséquence.
Qu’est-ce que l’expérience avec la boîte de Skinner?
Un pigeon ou un rat est mis dans une boîte ou on observe son comportement. Le pigeon doit piquer ou tourner sur lui-même pour obtenir la nourriture (conséquence)
Dans les expériences avec les animaux, le temps pour trouver la solution ______ d’un essai à l’autre.
diminue
Les 4 étapes que fait le chat dans la cage de Thorndike.
- Apprentissage par essais et erreurs
- La solution est trouvée par hasard
- D’un essai à l’autre, diminution progressive des réactions inutiles
- En fin d’apprentissage, le chat ouvre immédiatement le loquet
Vrai ou faux: avec la cage de Thorndike, les mêmes résultats sont obtenus d’un animal à l’autre.
Vrai
Expliquez les deux conclusions/concepts liées à la loi des effets de Thorndike.
Un comportement qui produit une conséquence agréable ou qui
élimine ou prévient une conséquence désagréable aura
tendance à se répéter.
Un comportement qui produit une conséquence désagréable ou
qui prévient (élimine) une conséquence agréable aura tendance
à disparaître.
Pour Thorndike, l’apprentissage est un processus
associatif caractérisé par la formation de connexions
entre deux éléments en ________ ______.
contiguïté spatiale
Définir la notion de renforçateur
Un renforçateur est un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action.
Selon Thorndike, les comportements sont acquis selon
leur _____ dans l’environnement.
EFFET
Il existe combien de type de contingence dans le conditionnement instrumental? Comment sont-ils déterminés?
4 types déterminées par la nature du stimulus-conséquence (appétitif ou aversif) et par l’effet du comportement sur le stimulus-conséquence (apparition ou disparition du stimulusconséquence)
Nommez les 4 types de contingence possibles et leurs effets.
- Récompense (renforcement positif) : ajouter effet positif (augmente le comportement)
- Échappement/évitement (renforcement négatif): retirer effet négatif (augmente le comportement)
- Punition (punition positive) : ajouter effet négatif (diminue le comportement)
- Omission (punition négative): retirer effet positif(diminue le comportement)
La relation de nécessité entre la réponse et la conséquence est
appelée _______. Le renforcement est un type particulier de _______. (deux fois le même mot)
contingence
Définir la punition positive.
La punition positive : le comportement est suivi de l’apparition d’un stimulus aversif
Définir le renforcement positif.
le comportement est suivi de l’apparition addition) d’un stimulus appétitif
Définir le renforcement négatif
le comportement est suivi de la disparition (soustraction) d’un stimulus aversif
Définit la punition négative
le comportement est suivi de la disparition (soustraction) d’un stimulus appétitif
Un exemple de renforcement positif sur un animal.
Un chien reçoit une caresse pour avoir rapporté un bâton
Un exemple de renforcement négatif sur un humain.
éviter une contravention, échapper aux réactions allergiques
Un exemple de punition positive sur un humain.
REMONTRANCES HAHA
Un exemple de punition négative sur un animal.
Un rat sera nourri que s’il s’abstient de sentir le plafond de la cage
Les 3 points de vue selon lesquels on peut analyser les types d’apprentissage instrumental.
Les types d’entraînement
La nature de la contingence
Les effets comportementaux
Différence entre conditionnement classique et opérant,
Classique : la relation s’établit entre un SN et un SI. Le
comportement du sujet n’a aucun effet sur l’apparition des stimuli.
Opérant : la relation s’établit entre une réponse et sa
conséquence. Le comportement détermine une
conséquence, c’est-à-dire l’apparition ou la disparition du renforçateur.
Définir le façonnement.
Cette procédure consiste à renforcer des approximations successives du comportement. À la toute fin, seul le comportement désiré sera renforcé. (Ex: Enfant : entraînement à la continence).
Les deux types de situation d’apprentissage instrumental.
Situation à essais…
- situation à essais discrets: Le début et la fin des essais sont faciles à Identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance.
- situation à essais continus : le début et la fin des essais ne sont pas clairement identifiés
Vrai ou faux: dans le façonnement on continue de récompenser chaque étape du comportement jusqu’à atteindre le comportement voulu.
Faux: lorsqu’une étape est réussi, on ne la récompense plus, on récompense seulement l’étape subséquente
Le façonnement est surtout utilisé dans l’acquisition de _________ comportements.
nouveaux
Exemples de façonnement
éducation d’un enfant, comment se comporter en société, relation de couple
De quel type de renforçateur il s’agit: : Stimulus qui entraîne une satisfaction n’ayant pas de valeur
biologique intrinsèque.
Renforçateur secondaire
De quel type de stimulus il s’agit: il signale à l’animal une occasion de répondre. La réponse est déclenchée en présence d’un stimulus particulier. Le sujet discrimine, ou fait la différence, entre un stimulus et un autre.
stimulus discriminatif (contexte)
De quel type de renforçateur il s’agit: Renforçateur biologiquement important et sensoriels.
renforçateurs primaires
Deux exemples de renforçateurs primaires.
Deux exemples de renforçateurs secondaires.
primaires: eau, nourriture, sexe, attention
secondaires: argent, jetons, cadeaux, bien matériels
La valeur du renforçateur (appétitif ou aversif), et par
conséquent la force du conditionnement, sont reliées à la_______ et à la ________du renforçateur.
quantité
qualité
Expliquez la notion d’effet de contraste.
La valeur d’un renforçateur n’est pas absolue. L’effet
renforçant devient plus prononcé lorsque le renforçateur peut être comparé avec une autre quantité du renforçateur. Le comportement peut être amplifié ou diminué suite à une telle comparaison
Vrai ou faux: plus grande est la récompense plus fort sera le renforcement.
Vrai
Quel concept est défini: consiste à cesser de renforcer une réponse.
extinction
Quel concept est défini : peut mener à une modification du comportement à la hausse ou à la baisse, mais il s’agit d’apprendre une nouvelle contingence qui n’était pas en fonction auparavant
l’acquisition
Selon la contiguïté temporelle: un délai court permet généralement un ______ apprentissage.
meilleur
L’absence de relation de contingence entre le comportement et ses conséquences produit le phénomène de____________ _________.
résignation/impuissance acquise
vrai ou faux: une contingence parfait est requise dans le conditionnement opérant.
Faux: pas nécessaire de renforcer à chaque fois
Expliquez l’impuissance acquise (exemple avec animal et choc)
Si l’animal n’a pas le choix de subir le choc, lorsque par la suite on lui donne le choix de s’échapper, il abandonne. Il n’évite plus le choc.
Nommez les 4 façons de renforcer partiellement un comportement.
intervalles fixes, intervalles variables, à rapport fixe, à rapport variable
Qu’est-ce que le renforcement continu?
Chaque fois que le comportement est adopté. Chaque réponse est renforcée ou punie. Plus rapide.
Qu’est-ce que le renforcement partiel/intermittent?
Le comportement n’est pas renforcé à chaque fois qu’il
apparaît.. Seulement un certain nombre de réponses sont renforcées ou punies. Plus « efficace » et plus résistant à l’extinction.
Différence entre un renforcement partiel à intervalle fixe et variable.
intervalle fixe: on connaît le temps, date, heure
intervalle variable: on ne sait pas
Différence entre un renforcement partiel à rapport fixe et variable.
rapport fixe: on sait le nombre de réponses avant que ça marche
rapport variable: on ne sait pas le nombre de fois (ex. casino)
Distinction entre un renforcement simple et complexe.
simple: une réponse
complexe: plusieurs réponses avant d’être renforcé
Vrai ou faux: le renforcement complexe est plus souvent utilisé que le simple.
vrai
Pour être efficace une punition doit être _____, _____, et _______
intense, immédiate et contingente
Peut-on s’habituer aux punitions?
Oui si les punitions sont peu sévères
Punition + efficace si suivi d’un __________
renforcement
Si on donne une substance sucrée à 32% à un rat et ensuite une substance sucrée à 4%, quand on lui redonne la 32% il aura ___ de lapements, c’est un effet de contraste _______.
plus de lapements
effet de contraste positif
(relire notes: pas sure de mon affaire)