Conditionnement opérant Flashcards
Vrai ou faux, le conditionnement opérant (CO) ou instrumental vise à contrôler le comportement par ses conséquences, c’est-à-dire par ce qui suit le comportement dans le temps?
Vrai
Que vise le conditionnement opérant (instrumental)?
vise à contrôler le comportement (la réponse à un stimulus ou à des stimuli) par ses conséquences, c’est-à-dire par ce qui suit le comportement (la réponse) dans le temps.
Le conditionnement opérant (CO) ou instrumental vise à
1._______ le comportement (la réponse à un stimulus ou à des stimuli) par ses 2._______, c’est-à-dire par ce qui suit le comportement (la réponse) dans le temps.
- contrôler
- conséquences
Quelle est la définition d’un comportement?
Le comportement est suivi d’une conséquence de façon à en
modifier son niveau opérant, soit augmenter ou diminuer sa
fréquence d’apparition
Vrai ou faux, Il est impossible de modifier le comportement d’un organisme en utilisant des conséquences plaisantes (appétitives) ou déplaisantes (aversives)?
Faux, il est possible de modifier le comportement
Quelle est la définition de l’apprentissage instrumental?
L’apprentissage instrumental est une modification de la probabilité de réapparition d’une réponse, modification entraînée par l’apparition ou le retrait d’un événement particulier, le renforçateur, de façon contingente à la réponse
Vrai ou faux, l’apprentissage instrumental est une modification de la probabilité de réapparition d’une réponse, modification entraînée par l’apparition ou le retrait d’un événement particulier, le renforçateur, de façon contingente à la réponse?
Vrai
L’apprentissage instrumental est une 1.________ de la probabilité de réapparition d’une réponse, modification entraînée par 2.________ ou le 3.________ d’un événement particulier, le renforçateur, de façon 4._________ à la réponse.
1.modification
2.l’apparition
3.retrait
4.contingente
L’apprentissage instrumental est quel type d’apprentissage?
Comportement/événement
Pourquoi on qualifie l’apprentissage comme étant instrumental?
On dit de l’apprentissage qu’il est instrumental, parce que l’effet est obtenu à partir du comportement, soit l’instrument
De quoi résultent les superstitions?
Les superstitions résultent d’un renforcement ou d’une
punition qui peut découler d’une simple coïncidence
Expliquez en quoi consiste l’expérience de Thorndike.
1-Enfermer un chat affamé dans une cage (boîte à problème)
2-Placer de la nourriture à proximité
3-Observer les comportements du chat et le temps qu’il utilise pour trouver la solution et sortir de la cage
4-Ces observations permettent de comprendre comment
s’opère l’apprentissage
Dans l’expérience de Thorndike, quels sont les 2 éléments importants à retenir?
La solution est trouvé au hasard, mais l’animal apprend cette solution afin de la réutiliser au besoin
La nourriture doit être proche de l’animal
Expliquez la loi des effets de Thorndike.
Un comportement qui produit une conséquence agréable ou qui élimine ou prévient une conséquence désagréable aura
tendance à se répéter
Un comportement qui produit une conséquence désagréable ou qui prévient (élimine) une conséquence agréable aura tendance à disparaître
Selon la loi des effets de Thorndike par quoi sont acquis les comportements?
Les comportements sont acquis en fonction de leur effet dans l’environnement
Pour Thorndike, l’apprentissage est un processus
associatif caractérisé par la formation de connexions
entre deux éléments en contiguïté spatiale.
Quels sont les 2 éléments?
Ces connexions sont fixées, renforcées par la répétition (ou
affaiblies si les essais sont supprimés)
Ces connexions sont renforcées ou affaiblies par l’effet des
conséquences (positive ou négative)
Qu’est-ce qu’un renforçateur?
Un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action
Vrai ou faux, un renforçateur peut être de nature appétitive ou aversive ?
Vrai
Vrai ou faux, la relation de nécessité entre la réponse et la conséquence est appelée contiguïté?
Faux, est appelée contingence
Vrai ou faux, le renforcement est un type particulier
de contingence?
Vrai
Quelle est la différence entre renforcement et renforçateur?
renforcement : le processus qui se passe entre la réponse et la conséquence (type d’association qui fait augmenter la prob de la réponse)
renforçateur :
Quelles sont les 4 types de contingence ?
Les 2 premiers sont des renforcements
Quelle est la différence entre un renforcement positif et négatif?
Renforcement positif : on ajoute quelque chose (appétitif)
Renforcement négatif : on retire quelque chose (aversif)
Quelle est la différence entre une punition positive et négative?
Punition positive : ajoute quelque chose (aversif)
Punition négative : retire quelque chose (appétitif)
La relation de 1.______ entre la réponse et la conséquence est appelée 2.______.
- nécessité
- contingence
Vrai ou faux, le renforcement est un type particulier
de contingence?
vrai
Quelle est la définition de la punition?
Opération qui consiste à ajouter ou retrancher un stimulus
comme conséquence à un comportement, tout en visant à
diminuer la probabilité que ce comportement apparaisse à
nouveau en des circonstances similaires.
La punition est une opération qui consiste à 1.______ ou 2._______ un stimulus comme conséquence à un comportement, tout en visant à 3._______ la probabilité que ce comportement apparaisse à nouveau en des 4._______.
- ajouter
- retrancher
- diminuer
- circonstances similaires
Que vise le renforcement?
vise à augmenter ou à maintenir élevée la
probabilité qu’un comportement apparaisse de nouveau en des circonstances similaires
Le renforcement positif : le comportement est suivi de
1._________ d’un stimulus 2_________
- l’apparition
- appétitif
Le renforcement négatif : le comportement est suivi de la
1._______ d’un stimulus 2.________
- disparition
- aversif
Les quatre types d’apprentissage peuvent être analysés selon 3 points de vue , lesquels?
Les types d’entraînement
La nature de la contingence
Les effets comportementaux
Expliquez la différence entre le conditionnement classique et le conditionnement opérant.
Classique : la relation s’établit entre un SN et un SI. Le
comportement du sujet n’a aucun effet sur l’apparition des
stimuli.
Opérant : la relation s’établit entre une réponse et sa
conséquence. Le comportement détermine une
conséquence, c’est-à-dire l’apparition ou la disparition du
renforçateur
Expliquez ce qu’est une situation à essais discrets.
Le début et la fin des essais sont faciles à identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance
Ex: Labyrinthes, boîtes d’évitement
Expliquez ce qu’est une situation à essais continus.
Situations opérantes libres (boîte de Skinner)
Le début et la fin des essais ne sont pas clairement identifiés.
Dans quel type de situation le début et la fin des essais ne sont pas clairement identifiés?
situation à essais continus
Dans quel type de situation le début et la fin des essais sont faciles à identifier?
situation à essais discrets
Que vise à renforcer le façonnement?
des approximations successives du comportement
Vrai ou faux, le façonnement consiste à renforcer des approximations successives du comportement et à la toute fin, seul le comportement désiré sera renforcé?
Vrai
Quand utilise-t-on le façonnement?
Le façonnement est généralement utilisé lorsque des
réponses complexes doivent être apprises ou lorsque les
réponses ne font pas partie du répertoire comportemental de l’organisme
Vrai ou faux, le façonnement est généralement utilisé lorsque des réponses complexes doivent être apprises ou lorsque les réponses ne font pas partie du répertoire comportemental de l’organisme?
Vrai
Qu’est-ce que la contingence dans le conditionnement opérant?
La contingence spécifie les conditions sous lesquelles un comportement entraîne une conséquence donnée.
La contingence renvoie à la relation séquentielle de dépendance entre deux événements.
Quelle est la méthode de façonnement par approximations successives?
C’est une méthode pour acquérir un comportement absent ou peu fréquent d’un organisme.
Le façonnement consiste à renforcer, de façon différentielles et successives, les comportements se rapprochant de plus en plus du comportement désiré.
Quels sont les types de renforçateurs?
Renforçateurs primaires
Renforçateurs secondaires
Principe de Premack
Les renforçateurs primaires ne nécessitent aucun entraînement préalable.
Qu’est-ce qu’un renforçateur primaire?
Ce sont des stimuli biologiquement importants qui influencent la survie.
Exemples: l’eau, la nourriture, les chocs électriques, un partenaire sexuel.
Comment acquièrent les renforçateurs secondaires leurs propriétés renforçantes?
À la suite d’appariements successifs avec un renforçateur primaire.
Exemples: l’argent, les économies de jetons.
Quel est un exemple d’entraînement de chimpanzés dans le contexte des renforçateurs?
Entraînement à placer des jetons dans une machine pour avoir des raisins.
Ensuite, entraînement à presser sur un levier pour obtenir des raisins ou des jetons.
Qu’est-ce qu’une réponse à forte probabilité naturelle d’apparition?
Une réponse qui peut renforcer une réponse dont la probabilité d’apparition est plus faible.
Cela est lié au principe de Premack.
Définissez le principe de Premack.
Ce qui renforce un comportement n’est pas un stimulus en tant que tel mais la possibilité de s’engager dans une activité.
La possibilité d’exécuter une réponse à forte probabilité naturelle d’apparition peut renforcer une réponse dont la probabilité d’apparition est plus faible.
Complétez la phrase: Faire ses devoirs pour _______ est un exemple du principe de Premack.
sortir dehors
Cela illustre comment une activité à forte probabilité peut renforcer une activité à faible probabilité.
Qu’est-ce que la technique du façonnement ?
Programmer une série d’étapes entre le comportement de base et la réponse terminale recherchée
Le façonnement implique le renforcement progressif de séquences d’action.
Comment l’organisme adopte-t-il le comportement désiré dans le façonnement ?
Grâce à une récompense associée à chaque acte allant dans le sens de la réponse terminale
Les récompenses renforcent les comportements souhaités.
Dans quels contextes le façonnement peut-il intervenir ?
Éducation de l’enfant, relations de couple, vie en société
Le façonnement est applicable à diverses interactions humaines.
Qu’est-ce qu’un stimulus discriminatif ?
Un stimulus qui signale à l’animal une occasion de répondre
Il permet de discriminer entre différents stimuli.
Quel est le rôle d’un stimulus discriminatif dans l’apprentissage ?
Il déclenche la réponse en présence d’un stimulus particulier
Le sujet apprend à faire la différence entre stimuli.
Qu’est-ce que l’acquisition dans le contexte de l’apprentissage ?
Modification du comportement à la hausse ou à la baisse par l’apprentissage d’une nouvelle contingence
Cela implique que des comportements nouveaux sont établis.
Qu’est-ce que l’extinction dans le processus d’apprentissage ?
Cesser de renforcer une réponse
L’extinction nécessite qu’une contingence ait été établie au préalable.
Qu’est-ce que la récupération spontanée ?
Réapparition d’une réponse éteinte après une période de repos consécutive à l’extinction
Cela montre que des réponses peuvent revenir même après extinction.
Quels sont les types d’entraînement d’un apprentissage instrumentale ?
- Récompense
- Échappement / évitement
- Punition
- Omission
Quels sont les effets sur le comportement d’un apprentissage comportementale ?
- L’augmentation ou la diminution du comportement
De quel nature peut être la contingence d’un apprentissage instrumentale ?
- Renforcement positif
- Renforcement négatif
- Punition positive
- Punition négative
Qu’est-ce que l’effet de contraste ?
La valeur d’un renforçateur n’est pas absolue. L’effet renforçant devient plus prononcé lorsque le renforçateur peut être comparé avec un autre quantité du renforçateur.
- Le comportement peut être amplifié ou diminué à la suite de cette comparaison
Donne un exemple d’effet de contraste.
Le premier renforçateur est une friandise tandis que le deuxième renforçateur est une sortie au cinéma.
Au départ, le premier renforçateur suffisait pour que le comportement augmente, mais suite à la comparaison au deuxième renforçateur, la friandise n’est plus suffisante pour que le comportment se répète.
Qu’est-ce que la contiguïté temporelle ?
Le délai de renforcement/punition
La contiguïté temporelle est bien utilisé lorsque …
Le délai entre la réponse et la conséquence est court puisqu’il diminue la probabilité qu’il y ait interférence entre d’autres réponses et le renforçateur.
Qu’est-ce que la contingence ?
La relation entre la réponse et la conséquence.
Si aucune relation n’existe, il n’y aura aucun apprentissage.
Le phénomène de résignation acquise se produit de quel façon ?
Lorsqu’il y a une absence de relation de contingence entre le comportement et ses conséquences.
Qu’est-ce que le programme renforcement et de punition «Renforcement continu» ?
Chaque fois que le comportement est adopté. Chaque réponse est renforcée ou punie.
Qu’est-ce que le programme de renforcement et de punition «Renforcement partiel ou intermittent» ?
Le comportment n’est pas renforcé chaque fois qu’il apparaît. Seulement un certain nombre de réponses sont renforcées ou punies.
Quel type de programme de renforcement est le plus rapide pour apprendre un comportement ?
Le renforcement continu
Quel type de programme de renforcement est le plus «efficace» et le plus résistant à l’extinction ?
Le renforcement partiel ou intermittent
Quels sont les 4 programmes de renforcement et de punition partiels ?
- Programmes à intervalles fixes
- Programmes à intervalles variables
- Programmes à rapport fixe
- Programmes à rapport variable
Qu’est-ce que le programmes de renforcement partiel «Programmes à intervalles fixes» ?
Le renforcement survient après la première réponse émise après un intervalle de temps fixe.
Ex. Préparation d’un plat au four, le manger dans une heure
Qu’est-ce que le programmes de renforcement partiel «Programmes à intervalles variables» ?
Le renforcement survient après la première réponse émise après un intervalle de temps moyen.
Ex. Contraventions aux automobilistes
Qu’est-ce que le programmes de renforcement partiel «Programmes à rapport fixe» ?
Le renforcement survient après un nombre fixe de réponses.
Ex. Le 5e changement d’huile est gratuit
Qu’est-ce que le programmes de renforcement partiel « Programmes à rapport variable» ?
Le renforcement survient après une nombre variable de réponses.
Ex. Jouer dans les machines à sous, la personnes peut gagner un prix après seulement quelques essais alors que d’autres fois, elle peut jouer de très nombreux tours dans gagner. Le rapport est aléatoire.
Quels sont les programmes de renforcement simples; programme à durée ?
- Programme à durée fixe (DF)
- Programme à durée variable (DV)
Qu’est-ce que le programme à durée fixe (DF) ?
Renforcement si comportement exécuté en continu durant une période «X» prévisible et fixe.
Ex. Pouvoir écouter la TV 1h si 2h d’études (DF2)
Qu’est-ce que le programme à durée variable (DV) ?
Renforcement si comportement exécuté en continu durant une période imprévisible et variable.
Ex. Donner un biscuit à des moments variés (pour une moyenne 1 biscuits/30 min) (DV30) à un jeune qui doit étudier
Quels sont les programmes de renforcement simples; Programme de débit de réponse ?
- Renforcement différentiel du débit rapide (RDDR)
- Renforcement différentiel du débit lent (RDDL)
- Renforcement différentiel de réponses rythmées (RDRR)
Qu’est-ce qu’un renforcement différentiel du débit rapide (RDDR) ?
Renforcement est en fonction d’un certains nombre de réponses durant un certain délai de temps.
Ex. Participant récompensé si 20 hot-dogs/ 1 min
Qu’est-ce qu’un renforcement différentiel du débit lent (RDDL) ?
Durée de temps minimal nécessaire
Ex. Se brosser lentement le dents
Qu’est-ce qu’un renforcement différentiel de réponses rythmées (RDRR) ?
Débit préétabli (ni trop vite ni trop lent)
Ex. Course à pied : renforcer un rythme moyen
Quels sont les programmes de renforcement simples; Programmes non contingents ( présence du renforçateur même si aucune réponse) ?
- Programme à temps fixe (TF)
- Programme à temps variable (TV)
Qu’est-ce qu’un programme à temps fixe (TF) ?
Renforçateur après une période «X» prévisible et fixe.
Ex. Cadeau de Noël pour tous, peu importe si gentil (TF1)
Qu’est-ce qu’un programme à temps variable (TV) ?
Renforçateur après une période «X» imprévisible et variable, peu importe le comportement du sujet.
Ex. Rencontrer par hasard un ami d’enfance aux 3 mois
Quels sont les programmes de renforcement complexes ? (Combinaison d’au moins deux programmes simples)
- Programmes conjonctifs
- Programmes ajustables
- Programmes en chaîne
Qu’est-ce qu’un programme conjonctif ?
Exigences d’au moins deux programmes simples avant la présentation d’un renforçateur.
Ex. Reçoit un salaire si nb h/sem. Travail + réalisation de tâches
Qu’est-ce qu’un programme ajustable ?
La réponse change en fonction de la performance du sujet.
Ex. Exigences plus grandes pour bon élève (avant renforcement si 80%, maintenant renforcement si 85%)
Qu’est-ce qu’un programme en chaîne ?
2 programmes simples ayant un ordre de présentation. Chacun a son Sd et le dernier produit un renforçateur terminal.
Ex. Prérequis > 49% pour un 2e cours pour obtenir diplôme
Une punition efficace est un punition 1._______, 2.________ et 3.__________
- Intense
- Immédiate
- Contingente
Qu’est-ce qui sensibilise les individus aux punitions subséquentes ?
Les punitions intense
Vrai ou faux, une punition implique nécessairement une douleur physique ?
Faux
De quelle façon une punition devient plus efficace ?
Lorsque la punition est utilisée conjointement avec le renforcement positif des autres comportments désirés.
Vrai ou faux, Des avertissements et des punitions peu sévères habituent les organismes aux punitions subséquentes ?
Vrai