Cours 6 Flashcards
Qu’est-ce que le conditionnement opérant?
Un comportement qui est suivi d’une conséquence & modifie (aug ou dim) fréquence d’apparition d’un cpt
Quels sont les deux types d’une conséquence?
Aversive ou appétitives
Pourquoi on dit apprentissage instrumental?
Pcq l’effet est obtenu par comportement (l’instrument)
Quelle est la définition de l’apprentissage de Thordike?
Processus associatif par formation de connexion entre 2 éléments en contiguité spatiale
Quels sont les 2 éléments en contiguité spatiale selon Thordike (apprentissage)?
- Connexions fixées & renforcées par répétition (ou affaiblies si essais sont supprimés.
- Connexions renforcées ou affaiblies par effet des conséquences
Renforcement
Augmenter ou maintenir élevée la prob qu’un cpt aparaisse de nouveau
Qu’est-ce que le renforcement positif?
CPt suivi de l’apparition (add) d’un stimulus appétitif
Qu’est-ce que le renforcement negatif?
Cpt suivi de la disparition (soustraction) d’Un stimulus aversif
QU’est-ce que la punition positive?
Cpt suivi de l’apparition (add) d’un stimulus aversif
Qu’est-ce que la punition negative?
Cpt suivi de disparition de stimulus appétitif
Quelle est la différence entre la conditionnement classique & opérant?
Classique : Relation entre SN et SI. Cpt du sujet a aucun effet sur apparition des stimuli.
Opérant : Relation entre réponse et une conséquence. Cpt détermine conséq = apparition ou disparition du cpt
Qu’est-ce que la notion du renforçateur?
Renforçateur (conséquence) est un événement consécutif à une action (hausse ou baisse) de la prob de réapparition
Qu’est-ce que la relation de nécessité?
La relation de nécessité entre réponse & conséquence s’appele contingence.
Qu’est-ce que la contingence?
Relation de dépendance entre 2 événements
Quelles sont le rôle de la contingence?
- Spécifie conditions sous lesquelles un comportement mène à une conséquence
- Association en contingence cpt + stimulus = modif du cpt
- UN cpt est suivi d’un événement
Quels sont les 4 types de contingence?
Renforcement positif
Renforcement négatif
Punition positive
Punition négative
Quoi retenir de la cage de Thorndike? (étapes)
- Essais & erreurs
- Hasard
- Diminution progressive des reactions inutiles
- Le chat ouvre directement
* Le temps pour trouver diminue d’un essai à l’autre - même resultat (courbe) des animaux
Quelle est la loi des effets de Thordike?
Un comportement qui produit une conséquence AGRÉABLE ou élimine conséquence DÉSAGRÉABLE va PLUS + se RÉPÉTER.
Un comportement qui produit une conséquence DÉSAGRÉABLE ou élimite AGRÉABLE va PLUS + DISPARAITRE.
Comportmeents sont acquis en fonction de leur effet dans l’environnement
Quels sont les renforçateurs? (3)
Renforçateurs primaires
Renforçateurs secondaires
Principe de Premack
Quels sont les renforçateurs primaires?
Nécessitent aucun entraînement préalable.
Biologiquement importants : Bouffe, sexe, décharge
Sensoriels : Stimulation organes sensoriels
Autostimulation cérébrale
Quels sont les renforçateurs secondaires?
Stimulus qui entraine satisfaction, amis qui n’a pas de valeur biologique intrinsèque.
Propriétés renforçantes par pairage avec renforçateur primaire: Argent, biens matériels, etc.
Quel est le principe de Prémack?
Une réponse à FORTE probabilité naturelle d’apparition peut renforcer une réponse dont la probabilité d’apparition est plus FAIBLE.
Exemples du principe de Premack
Faire ses devoirs pour jouer avec ses amis.
Faible prob d’app naturelle : Faire ses devoirs
Renforçateur : jouer avec ses amis = cpt prob naturelle +++ élevée.
Donc, le 2e cpt contingent au 1er vise à augmenter la prob de la 1ère réponse
Que dit-on de la qualité & quantité du renforçateur?
La valeur (appétitif ou aversive) et la force du conditionnement sont reliées à la quantité * qualité du renforçateur.
+ grande est la récompense, + fort le renforcement
(ex: animaux courent + vite labyrinthe qd course chaque donnne + bouffe)
Quels sont les types d’entrainement ?
Récompense (renforcement +)
Échappement/évitement (renforcement -)
Punition (punition +)
Omission (punition -)
Les 4 types de contingence peuvent être analysés selon 3 points de vue, lesquels?
- Types d’entrainement (récompense, omission..)
- Nature de la contingence (renforcement positif, punition positive..)
- Effets sur les cpts (augmentation, diminution)
Quels sont les 2 situations dapprentissage instrumental?
Situations à essais discrets : labyrinthe, boite d’évitement. Début & fin facile à identifier, on peut les compter… Entre les essais, pas important
Situations à essais continus : Situations opérantes libres (boite Skinner). Début et fin pas identifiés clairement
Qu’est-ce que le façonnement?
Renforcer des approximations successives du comportement. à la fin, seul le comportement désiré sera renforcé.
À quoi sert le façonnement?
Souvent utilisé quand il faut apprendre des réponses complexes ou qd elles font pas partie du répertoire.
Acquérir un cpt absent/peu fréquent de l’organisme
Renforcer de façon différentielle & successive les cpts et plus en plus cpts du cpt désiré
Quelle est la technique pour le façonnement?
Programmer une série d’étapes entre le cpt de base et lui souhaité. Donc, renforcer progressivement et systématiquement chacune jusqu’au désiré, grace à récompenses à chaque acte
Qu’est-ce que le stimulus discriminatif (contexte)?
Autre stimuli que le stimulus renforcé.
Réponse déclenchée avec le stimulus, le sujet discrimine ou fait la différence entre stimulus ou un autre.
Qu’est-ce que l’effet de contraste?
Valeur du renforçateur pas absolue. Effet renforcant devient + prononcé quand le renforcateur peut être comparé avec une autre quantité du renforcateur. Le cpt peut être amplifié/diminué après la comparaison
Qu’est-ce que la contiguité temporelle?
Délai de renforcement/punition
Quel délai est meilleur pour la contiguité temporelle pour un meilleur apprentissage?
Court, pcq ça diminue la probabilité d’une interférence entre d’autres réponses & renforçateur (chien pipi!)
qu’est-ce que la contingence réponse-conséquence?
Conditionnement opérant = corrélation entre réponse & conséquence.
Si PAS de relation = aucun apprentissage.
L’absence de relation contigence = phénomene de résignation acquise
Qu’est-ce que l’acquisition?
Modification du cpt (hausse ou baisse), mais apprendre une nouvelle contingence pas en fonction avant
Qu’est-ce que l’extinction?
Cesser de renforcer une réponse. Faut avoir une contingence pour avoir extinction
Qu’est-ce que la récupération spontanée?
Réapparition d’une réponse éteinte, après periode de repos consécutive à l’extinction.
Extinction susceptible d’être suivi par la récupération spontanée
Qu’est-ce qu’un renforcement continu?
Chaque fois que le comportement est adopté, chaque réponse punie/renforcée est + rapide. Contingence parfaite.
Qu’est-ce qu’un renforcement partiel/intermittent?
Comportement pas renforcé chaque fois qu’il est là.
+ efficace et + résistant à l’extinction
Quels sont les programmes de renforcements partiels ?
Programmes à intervalles fixes
Programmes à proportions variables
Programmes à rapport fixe
Programmes à rapport variable
Qu’est-ce que le programme à intervalles fixes?
Renforcement survient après la 1ère réponse émise après intervalle de temps fixe (avoir paye aux 2 sem peu importe le travail que tu te donnes)
qu’est-ce que le programme à rapport fixe?
Renforcement survient après un nb fixe de réponses (une carte fidélité qui donne un café gratuit après 10 achats.
Qu’est-ce que le programme à proportion variable?
Renfrocement survient après 1ère reponse émise apres intervalle de temps moyen (contraventions aux conducteurs)
Qu’est-ce que le le programme à rapport varialbe?
Renforcement après un nb variables de réponses (machine à sous)
Qu’est-ce que le programme à durée fixe? (DF)
Renforcement si comportement exécuté en continu pendant période X fixe et prévisible (tv 1h si 2h d’étude)
qu’est-ce que le programme à durée variable (DV)?
Renforcement si comportement exécuté en continu pendant période imprévisible & variable. (donner 1 biscuit à des moments variés = moyenne de 1 aux 30 min)
Qu’est-ce que le renforcement différentiel du débit rapide (RDDR)?
Nombre de réponses + délai = récompensé si 20 hot-dogs / 1 min
Qu’est-ce que le renforcement différentiel du débit lent RDDL?
Durée de temps minimale (lent) = brosser les dents lentement
Qu’est-ce que le renforcement différentiel de réponses rythmées (RDRR)?
Débit préétabli (pas vite, pas lent) (course
a pied, ryhtme moyen)
QUels sont les programmes non contingents? (Présence de renforçateur même si aucune réponse)
Programme à temps fixe (TF) : Renforçateur après période X fixe (cadeau Noel pour tous, même si pas gentil)
Programe à temps variable (TV) : ‘’ imprévisible et variable peu importe le cpt du sujet
C’est quoi programme de renforcement complexes?
(Combinaison d’au moins 2 programmes simples)
Quels sont les programmes de renforcement complexes?
Programmes conjonctifs
Programmes ajustables
Programmes en chaine
Qu’est-ce que le programme conjonctif?
Exigeances d’au moins 2 programmes simples avant présentation du renforçateur (reçoit salaire + job)
Qu’est-ce que le programme ajustable?
Réponse change en fonction performance du sujet (exigeances + grandes si bon eleve)
Qu’est-ce que le programme en chaine?
2 programmes simples ayant ordre de présentation. Chaque a son Sd et le dernier produit renforçateur final.
Que doit-on avoir pour qu’une punition soit efficace?
- Intense
- Immédiate (contigue)
- Contingence (survenir à ch réponse)
+ efficace si utilisée conjointement avec renforcement positif des autres cpts désirés
à quoi sert une bonne punition
La punition intense sensibilise les individus aux punitions subséquentes
Avertissements et punition peu sévères habituent organismes aux punitions subséquentes