cours 4 CO Flashcards
comment peut on aussi appelé le Conditionnement opérant
apprentissage instrumental
que vise le conditionnement opérant
vise à
contrôler le comportement (la réponse à un stimulus ou à des
stimuli) par ses conséquences, c’est-à-dire par ce qui suit le
comportement (la réponse) dans le temps.
quest ce que le conditionnement opérant
Le comportement est suivi d’une conséquence de façon à en modifier son niveau opérant, soit augmenter ou diminuer sa fréquence d’apparition.
Il est possible de modifier le comportement d’un organisme en
utilisant des conséquences plaisantes (appétitives) ou
déplaisantes (aversives)
L’apprentissage instrumental est une modification de la probabilité
de réapparition d’une réponse, modification entraînée par
l’apparition ou le retrait d’un événement particulier, le
renforçateur, de façon contingente à la réponse
On dit de l’apprentissage qu’il est instrumental, parce que l’effet
est obtenu à partir du comportement, soit l’instrument
pourquoi dit on que les superstitions sont construit du CO
résultent d’un renforcement ou d’une punition qui peut découler d’une simple coïncidence
nomme des exemples de CO
la cage de thorndike
la boite de skinner
quest ce que la cage de Thorndike
- Enfermer un chat affamé dans
une cage (boîte à problème) - Placer de la nourriture à proximité
- Observer les comportements du chat et le temps qu’il utilise
pour trouver la solution et sortir de la cage - Ces observations permettent de comprendre comment s’opère l’apprentissage
- Apprentissage par essais et erreurs
- La solution est trouvée par hasard
- D’un essai à l’autre, diminution progressive des réactions inutiles
- En fin d’apprentissage, le chat ouvre immédiatement le loquet
Le temps utilisé pour trouver la solution diminue d’un essai à l’autre
Il obtient le même résultat (la même courbe d’apprentissage) d’un animal à l’autre
comment nomme t-on le concept décrit par ceci: Les comportements sont acquis en fonction de leur effet dans
l’environnement
la loi des effets de Thorndike
quest ce que la loi des effets
Un comportement qui produit une conséquence agréable ou qui
élimine ou prévient une conséquence désagréable aura tendance à se répéter.
Un comportement qui produit une conséquence désagréable ou qui prévient (élimine) une conséquence agréable aura tendance à disparaître.
Éléments de base:
S:R –> C
Les comportements sont acquis en fonction de leur effet dans l’environnement
Pour Thorndike, l’apprentissage est un processus associatif caractérisé par la formation de connexions entre deux éléments en contiguïté spatiale :
- Ces connexions sont fixées, renforcées par la répétition (ou affaiblies si les essais sont supprimés)
- Ces connexions sont renforcées ou affaiblies par l’effet des conséquences (positive ou négative)
quest ce qu’un renforcateur
c’est la conséquence
c’est un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action.
- Le renforçateur peut être de nature appétitive ou aversive.
- La relation de nécessité entre la réponse et la conséquence est appelée contingence. Le renforcement est un type particulier de contingence.
quest ce que la contingence
Renvoie à la relation séquentielle de dépendance entre deux événements.
Dans le cas du CO, la contingence spécifie les conditions sous
lesquelles un comportement entraîne une conséquence donnée.
Association en contingence d’un comportement et d’un stimulus qui entraîne une modification du comportement.
Un comportement est suivi d’un événement.
4 types déterminés par la nature du stimulus-conséquence
(appétitif ou aversif) et par l’effet du comportement sur le stimulus-conséquence (apparition ou disparition du stimulus-conséquence)
quels sont les types de contigence
récompense (renforcement positif) > ajouter effet positif
échappement / évitement (renforcement négatif) > retirer effet négatif
punition (punition positive) > ajouter effet négatif
omission (punition négative) > retirer effet positif
quest ce que la punition
Opération qui consiste à ajouter ou retrancher un stimulus
comme conséquence à un comportement, tout en visant à
diminuer la probabilité que ce comportement apparaisse à
nouveau en des circonstances similaires
quest ce que le renforcement
vise à augmenter ou à maintenir élevée la
probabilité qu’un comportement apparaisse de nouveau en des
circonstances similaires.
quest ce que le renforcement positif
Augmentation de la
probabilité de
réapparition du
comportement
en ajoutant un élément
le comportement est suivi de
l’apparition (addition) d’un stimulus appétitif
quest ce que le renforcement négatif
Augmentation de la
probabilité de
réapparition du
comportement
en enlevant un élément
le comportement est suivi de la disparition (soustraction) d’un stimulus aversif.
qu’est ce que la punition positive
Diminution de la
probabilité de
réapparition du
comportement en ajoutant un élément
le comportement est suivi de l’apparition
d’un stimulus aversif.
qu’est ce que la punition négative
Diminution de la
probabilité de
réapparition du
comportement
en enlevant un élément
le comportement est suivi de la disparition (soustraction) d’un stimulus appétitif.
quels sont les différents points de vue pour l’analyse des types d’apprentissages
les types d’entrainement
la nature de la contingence
les effets comportementaux
quels sont les types d’entrainement pour l’analyse de l’apprentissage
récompense
échappement / évitement
punition
omission
quels sont les différentes nature de la contingence
Renforcement positif
Renforcement négatif
Punition positive
Punition négative
quels sont les différents effets sur les comportements
Augmentation
Augmentation
Diminution
Diminution
diapo 33
conditionnement opérant VS classique
Classique : la relation s’établit entre un SN et un SI. Le comportement du sujet n’a aucun effet sur l’apparition des stimuli.
Opérant : la relation s’établit entre une réponse et sa
conséquence. Le comportement détermine une conséquence, c’est-à-dire l’apparition ou la disparition du renforçateur.
quels sont les différentes situations d’apprentissage instrumental
Situations à essais discrets :
- Labyrinthes, boîtes d’évitement, etc.
- Le début et la fin des essais sont faciles à identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance.
Situations à essais continus :
- Situations opérantes libres (boîte de Skinner)
- Le début et la fin des essais ne sont pas clairement identifiés
quest ce que le faconnement diapo 36 à 40
Cette procédure consiste à renforcer des approximations
successives du comportement. À la toute fin, seul le comportement désiré sera renforcé.
(Ex.: Enfant : entraînement à la continence).
Le façonnement est généralement utilisé lorsque des réponses complexes doivent être apprises ou lorsque les réponses ne font pas partie du répertoire comportemental de l’organisme
quest ce que le stimulus discriminatif (SD)
contexte
Dans une situation d’apprentissage instrumental, il
peut y avoir d’autres stimuli que le stimulus
renforçateur.
Le stimulus discriminatif signale à l’animal une
occasion de répondre.
La réponse est déclenchée en présence d’un
stimulus particulier. Le sujet discrimine, ou fait la
différence, entre un stimulus et un autre
exemple de SD
Lorsqu’une lumière est allumée, un pigeon sera renforcé
par de la nourriture lorsqu’il picore sur un disque. En
circulation, les panneaux indicateurs sont des stimuli
discriminatifs.
nomme des types de renfocateur
renforcateur primaire
renforcateur secondaire
quest ce que le renforcateur primaire
Ne nécessite aucun entraînement préalable :
- Les renforçateurs biologiquement importants : nourriture,
eau, sexe, attention, approbation, décharge électrique
Les renforçateurs sensoriels ont une valeur
renforçante uniquement à cause de la simple
stimulation des organes sensoriels
L’autostimulation cérébrale
quest ce que les renforçateurs secondaires
Stimulus qui entraîne une satisfaction n’ayant pas de valeur biologique intrinsèque
- Les renforçateurs secondaires acquièrent des propriétés renforçantes à la suite de pairages successifs avec un renforçateur primaire: argent, biens matériels, économie de
jetons. - Caractéristiques de renforçateurs secondaires ou conditionnés
La prévisibilité
quest ce que le principe de Premack
Une réponse à forte probabilité naturelle d’apparition peut
renforcer une réponse dont la probabilité d’apparition est plus faible.
exemple du principe de Premack
Faire ses devoirs pour aller jouer avec ses amis
- Réponse cible « faire ses devoirs » = faible probabilité
d’apparition naturelle - Le renforçateur « jouer avec ses amis » est par contre un comportement dont la probabilité naturelle est très élevée
- En rendant ce second comportement contingent au premier,
les parents visent à augmenter la probabilité de la première
réponse
fini la phrase:
la valeur du renforçateur (appétitif et aversif) et la force du conditionnement sont reliées à …
la quantité et la qualité
plus grande est la récompense, plus fort sera le renforcement
quest ce que l’effet de contraste
La valeur d’un renforçateur n’est pas absolue. L’effet
renforçant devient plus prononcé lorsque le renforçateur
peut être comparé avec une autre quantité du
renforçateur. Le comportement peut être amplifié ou
diminué à la suite d’une telle comparaison.
diapo 47
quest ce que la relation réponse- conséquence
- La contiguïté temporelle :
Le délai de renforcement/punition : Un délai court permet
généralement un meilleur apprentissage parce qu’il diminue la probabilité qu’il y ait interférence entre d’autres réponses et le
renforçateur - La contingence réponse-conséquence :
La contingence est aussi importante qu’en conditionnement classique. Tout le conditionnement instrumental repose sur la
corrélation entre la réponse et la conséquence. Si aucune
relation n’existe, il n’y aura aucun apprentissage.
*L’absence de relation de contingence entre le comportement
et ses conséquences produit le phénomène de résignation
acquise (impuissance acquise).
quest ce que l’acquisition
L’acquisition peut mener à une modification du comportement à la hausse ou à la baisse, mais il s’agit d’apprendre une nouvelle contingence qui n’était pas en fonction auparavant.
quest ce que l’extinction
L’extinction consiste à cesser de renforcer une réponse. Il faut donc qu’il y ait eu établissement d’une contingence auparavant
pour qu’il puisse y avoir extinction.
L’extinction est susceptible d’être suivie d’une
récupération spontanée.
quest ce que la récupération spontanée
L’extinction est susceptible d’être suivie d’une
récupération spontanée.
Récupération spontanée : réapparition d’une réponse
éteinte, à la suite d’une période de repos consécutive à l’extinction.
quest ce que l’impuissance acquise
???????????????????
quest ce qui a donné naissance à l’impuissance acquise et explique le moi
Expérience avec les chiens et les rats
- Décharges électriques occasionnelles sur le plancher de la cage
- Apprentissage de l’animal : presser un levier pour empêcher les chocs ou changer de compartiment pour circuler librement
- L’animal demeure donc fonctionnel
quest ce que le renforcement continu
Chaque fois que le comportement est adopté. Chaque réponse
est renforcée ou punie. Plus rapide.
quest ce que le renforcement partiel ou intermmittent
Le comportement n’est pas renforcé chaque fois qu’il apparaît.
Seulement un certain nombre de réponses sont renforcées ou punies. Plus « efficace » et plus résistant à l’extinction.
quels sont les façons de renforcer partiellement le comportement
programmes à intervalles fixes
progr. à intervalles variables
progr. à rapport fixe
progr. à rapport variable
quest ce que le programme à intervalle fixe
Le renforcement survient après la première réponse émise après un intervalle de temps fixe.
quest ce que le programme à intervalle variable
le renforcement survient après la première réponse émise après un intervalle de temps moyen
ex: contravention
quest ce que le programme à rapport fixe
Le renforcement survient après un nombre fixe de réponses
carte fidélité
quest ce que le programme à rapport variable
Le renforcement survient après un nombre variable de réponses
ex: casino
quels sont les programmes de renforcement simples
programme à durée (fixe et variable)
programme de débit de réponse :
- renforcement différentiel du débit rapide (RDDR)
- renforcement différentiel du débit lent (RDDL)
- renforcement différentiel de réponses rythmée (RDRR)
programmes non contingents
- programme à temps fixes
- programme à temps variable
quest ce que le programme à durée fixe
renforcement si comportement
exécuté en continu durant une période « X » prévisible et fixe
Ex. : pouvoir écouter la TV 1 h si 2 h d’études (DF2)
quest ce que le programme à durée variable
renforcement si
comportement exécuté en continu durant une période
imprévisible et variable
Ex. : donner un biscuit à des moments variés (pour une moyenne d’un biscuit aux 30 minutes) (DV30) à un jeune qui doit étudier
quest ce que le renforcement différentiel du débit rapide
fait partie du programme de débit de réponse
renforcement est fonction d’un certain nombre de réponses
durant un certain délai de temps.
Ex. : participant récompensé si 20 hot-dogs / 1 minute
quest ce que le renforcement différentiel du débit lent
fait parti du programme de débit de réponse
durée de temps minimal nécessaire (débit lent)
Ex. : se brosser lentement les dents
quest ce que le renforcement différentiel de réponse rythmé
fait parti du programme de débit de réponse
débit préétabli (ni trop vite ni trop lent)
Ex. : course à pied : renforcer un rythme moyen.
comment caractérisons les programmes non contingents
présence du renforçateur même si aucune réponse
quest ce que le programme à temps fixe
cest un programe non contingent
renforçateur après une période
« X » prévisible et fixe
Ex. : cadeau à Noël pour tous, peu importe si gentil (TF1)
quest ce que le programme à temps variable
programme non contingent
renforçateur après une
période « X » imprévisible et variable, peu importe le
comportement du sujet
Ex. : rencontrer par hasard un ami d’enfance aux 3 mois
quels sont les programmes de renforcement complexes
programmes conjonctifs
programmes ajustables
programmes en chaine
comment caractérisons les programmes de renforcement complexes
Combinaison d’au moins deux programmes simples
comment caractérisons le programme conjonctif
exigences d’au moins deux programmes
simples avant la présentation d’un renforçateur.
Ex. : reçoit un salaire si nb h/sem. travail + réalisation tâches
quest ce que le programmeajustable
la réponse change en fonction de la
performance du sujet.
Ex. : exigences plus grandes pour bon élève (avant renforcement
si 80 %, maintenant renforcement si 85 %)
quest ce que le programme en chaine
2 programmes simples ayant un ordre de
présentation. Chacun a son Sd et le dernier produit un
renforçateur terminal.
Ex. : Prérequis > 49 % pour un 2e cours pour obtenir diplôme
pour etre efficace une punition doit être comment
une punition doit être intense, immédiate
(contiguë) et contingente (survenir à chaque réponse).
Une punition intense sensibilise les individus aux punitions
subséquentes.
comment la punition peut devenir plus efficace encore
si utilisée conjointement avec le renforcement positif des autres comportements désirés.
que produit une punition intense
sensibilise les individus aux punitions
subséquentes.
que produit des avertissement et des punitions peu sévères
habituent les
organismes aux punitions subséquentes.