Conditionnement opérant (apprentissage instrumental) Flashcards
Comment se différencie le conditionnement opérant (CO) du conditionnement répondant (CR)?
Le CO a pour but d’augmenter ou diminuer la fréquence d’apparition d’un comportement
En CR, la relation s’établit entre un SN et un SI. Le comportement n’a pas d’effet sur l’apparition des stimuli
En CO, la relation s’établit entre un comportement et une conséquence. Le comportement détermine la conséquence
De quelle manière se pratique le CO?
Des conséquences positives ou négatives surviennent après un comportement. Ces conséquences amènent à augmenter ou diminuer leur fréquence d’apparition
Comment se développent les superstitions?
Renforcement ou punition à la suite d’un comportement, mais résultant d’une simple coïncidence
Qu’est-ce qu’on a pu observer dans la cage de Thorndike?
- Apprentissage par essais-erreurs
- Solution trouvée par hasard
- D’un essai à l’autre diminution progressive des comportements inutiles
- En fin d’apprentissage, la solution est trouvée immédiatement
En fonction de quoi les comportements sont acquis?
Leur effet dans l’environnement
Selon Thorndike l’apprentissage est un processus associatif caractérisé par la formation de connexions entre deux éléments en contiguïté spatiale. Par quoi les connexions peuvent-elles être renforcées et affaiblies?
- Répétition et non-répétition
2. Conséquences positives et conséquences négatives
Qu’est-ce qu’un renforçateur?
Événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action.
Vrai ou faux
Un renforçateur est toujours positif
Faux
Quel synonyme peut-on donner pour la contingence?
Relation de nécessité
Quels sont les 4 types de contingences en CO?
Renforcement positif et négatif
Punition positive et négative
Positif veut-dire “ajout d’un stimulus” et négatif veut dire “retrait d’un stimulus”.
Quel est la différence entre un renforcement et une punition?
Un renforcement vise la répétition du comportement alors que la punition vise la diminution/suppression du comportement
Les quatre types d’apprentissage peuvent-être analysés selon 3 points de vue. Quels sont-ils?
Les types d'entraînement (récompense, échappement/évitement, punition, omission) Nature de la contingence (renf. pos et nég, pun. pos et nég) Effets comportementaux (augmentation ou diminution)
Différenciez les situations à essais discrets de celles à essais continus.
Discret: Début et fin des essais sont faciles à identifier, on peut les compter.
Continu : Début et fin pas clairement identifiables
Qu’est-ce que le façonnement?
Renforcer des approximations successives du comportement. À la fin, seul le comportement désiré sera renforcé.
Utilisé quand des réponses complexes doivent être apprises ou quand les réponses ne font pas partie du répertoire comportemental de l’organisme
Vrai ou faux
Selon Skinner et les béhavioristes, la plupart des comportements humains s’acquerraient par façonnement
Vrai
Qu’est-ce qu’un stimulus discriminatif?
Il signale à l’organisme de répondre.
Ex: Feux de circulation
Qu’est-ce qu’un renforçateur primaire?
Un renforçateur qui ne nécessite aucun entraînement préalable.
Ex: Biologiquement important, renforçateurs sensoriels, autostimulation cérébrale
Qu’est-ce qu’un renforçateur secondaire?
Stimulus qui entraîne une satisfaction n’ayant pas de valeur biologique intrinsèque
Ex: argent, biens matériels
Vrai ou faux
Le principe de Premack dit qu’une réponse à forte probabilité naturelle d’apparition peut renforcer une réponse dont la probabilité d’apparition est plus faible
Vrai
Vrai ou faux
La force du conditionnement dépend seulement de la répétition
Faux
Elle dépend aussi de la qualité du renforçateur
Résumez l’effet de contraste.
Le fait de savoir qu’il y a un meilleur renforçateur diminue la qualité du renforçateur reçu. Inversement, le fait de savoir qu’il y a de moins bon renforçateurs rend meilleur celui reçu.
Vrai ou faux
La contiguïté temporelle n’a pas d’importance en CO
Faux
Un délai court permet généralement un meilleur apprentissage
Qu’est-ce que la récupération spontanée en CO?
Réapparition d’une réponse éteinte à la suite d’une période de repos consécutive à l’extinction.
Qu’est-ce que l’impuissance acquise?
Après une présentation prolongée à un stimulus aversif dont on ne peut s’échapper, on peut développer un sentiment d’impuissance et ne plus voir comment s’en sortir.
Qu’est-ce qu’un renforcement partiel?
Le comportement n’est pas renforcé à chaque fois qu’il apparaît. Il est plus efficace et plus résistant à l’extinction.
Quels sont les 4 types de programmes de renforcement partiel?
Programmes à intervalles fixes et variables (temps fixe ou temps moyen)
Programmes à rapport fixes et variables (nb de réponses fixe ou nb de réponses moyen)
Quels sont les 2 types de programmes de renforcement à durée?
Programme à durée fixe : Renforcement si comportement exécuté en continu durant une période prévisible et fixe
Programme à durée variable : Renforcement si comportement exécuté en continu durant une période imprévisible et variable (moyenne)
Quels sont les 3 types de programme de renforcement de débit de réponse?
Renforcement différentiel du débit rapide (RDDR) : Renforcement en fonction d’un certain nb de réponse en une certaine période de temps
Renforcement différentiel du débit lent (RDDL) : Période de temps minimale nécessaire (se brosser les dents lentement)
Renforcement différentiel de réponses rythmées (RDRR) : débit préétabli (course à pied, on renforce un rythme moyen)
Quels sont les 2 types de programmes de renforcement non-contingents?
Programme à temps fixe : Renforçateur après un période prévisible et fixe, peu importe le comportement
Programme à temps variable : Renforçateur après un période imprévisible et variable, peu importe le comportement
Quels sont les 3 types de programmes de renforcement complexes?
Programme conjonctif : exigences d’au moins deux programmes simples avant la présentation d’un renforçateur (recevoir un salaire si présent et efficace)
Programme ajustable : La réponse change en fonction de la performance (avant, on renforce pour plus faible performance, maintenant pour une plus grande)
Programmes en chaîne : 2 programmes simples ayant un ordre de présentation.
Vrai ou faux
Des avertissements et des punitions sévères habituent les organismes aux punitions subséquentes.
Faux
peu sévères
Vrai ou faux
Pour être efficace, la punition devrait être jumelée à du renforcement postif
Vrai