Béhaviorisme IIa : Le conditionnement opérant (Partie II) Flashcards
Quand se produit l’extinction?
Lorsque l’opérant (comportement) n’est plus suivi par la conséquence
En quoi consiste le Principle de Premack?
Les comportements peuvent fonctionner comme renforçateur (comport. frequent )ou punition (comport. rarement).
Quel est le conditionnement le plus efficace et pourquoi?
Le renforcement intermittent car il y plus résistent à l’extinction(mieux pour le mantient du comportement)
Que c’est -que l’extinction? Parle de Etude de Williams?
Extinction - se produit lorsque l’opérant n’est plus suivi par la conséquence qui lui était préalablement associée - Etude de WILLIAMS : petit garçon de 21 mois ayant reçu 24h d’attention lorsqu’il était malade une fois guéri, enfant a demandé le même niveau d’attention (renforçateur) - nouveau régime de sommeil : parents ferment la porte et refusent de réagir aux pleurs et aux cris qui suivent - Résultats : après 45 mn, garçon s’assoupit puis en moins de 10mn et finalement ne crie plus du tout au bout de la 6ème fois
Quels sont les programmes de renforcement de Skinner?
SKINNER : programmes de renforcement - Programme de renforcement continu: chaque réaction correcte est renforcée - Programme de renforcement intermittent (partiel): seules quelques-unes des réactions correctes sont renforcées - Renforcement intermittent est généralement plus efficace en terme de maintien du comportement appris et les comportements maintenus sous renforcement intermittent sont en général plus résistants à l’extinction - Programme à proportion : récompenses sont liées au nombre de réponses émises (ex: réaction correcte sur trois) - Programme à intervalle : récompenses n’apparaissent qu’après un laps de temps (ex: réaction correcte après 5 mn)
Que sont les réactions cumulatives ?
Les réactions cumulatives - Au cours du conditionnement, les réactions s’accumulent. - Il est possible de mettre en relation le temps passé et le taux de réactions. - Le conditionnement est le plus efficace si beaucoup de réactions avec peu de latence entre-temps sont produites.
Quels sont les effets cumulatif des programmes de renforcement?
Effets cumulatifs des programmes de renforcement - Programme à proportion fixe (fixed-ratio FR): réactions rapides, mais pas durables récompenses tous les “x” essais (régulier) - Programme à proportion variable (variable-ratio VR): réactions rapides et plus durables. (efficace dans la vitesse d’apprentissage) récompense pour seulement 10 sur 30 choisies “au hasard” (irrégulier) peut-être qu’il y aura de nouveau une récompense si je continue - Programme à intervalle fixe (fixed-interval FI): seulement des réactions à la fin de l’intervalle et peu durable (faiblesse d’apprentissage) délai fixe : examens - Programme à intervalle variable (variable-inteval VI): très efficace pour créer une performance constante et durable récompenses pour 10 sur 30 mais pas de délai déterminé (=aléatoire) : examens surprises Il ne faut pas renforcer chaque réaction pour l’apprentissage, il suffit d’en renforcer quelques-unes.
Quels sont les renforçateurs secondaires?
Renforçateurs secondaires: stimuli qui ont obtenu la qualité d’un renforçateur par association avec un renforçateur primaire qui satisfait directement un besoin : • Ex: renforçateur primaire: nourriture, douleur • Ex: renforçateur secondaire: argent, critique
what is the Premack principle?
Le “PREMACK principle” Une application dans l’éducation : comportmenets peuvent fonctionner comme renforçateurs et punitions. Procédure selon PREMACK : 1) Observation du comportement d’un individu détermine probabilité des actions exécutées spontanément la fréquence du comportement 2) Les actions qui sont exécutées fréquemment peuvent fonctionner comme renforçateur et les actions qui sont exécutées très rarement peuvent fonctionner comme punition.
Ex: renforcement positif d’abord tu joues au piano, puis tu peux regarder la TV punition négative si tu arrives trop tard à table, tu n’auras pas de dessert
Comment fonction l’apprentissage de comportements complexes?
Les comportements “complexes” SKINNER : étude systématique des effets des programmes de renforcement sur l’apprentissage (étude avec rats et pigeons dans la “skinner box”) - Apprentissage des comportements complexes : discriminer des stimuli qui signalent renforcement VS non-renforcement – stimuli discriminatifs (SD) SC +, SC – suite au conditionnement classique si animal appuie sur le levier lorsque lumière verte nourriture VS lumière rouge non lorsque lumière rouge, n’appuie même plus
Que c’est que le shaping?
Modification progressive d’un comportement spécifique pour produire une nouvelle réponse. Dans le dressage (“shaping”), on produit un comportement nouveau en renforçant des comportements approximatifs de plus en plus proches de la réponse désirée. Ex: dressage d’un tigre : 1. S’asseoir sur commande, 2. Sauter sur commande, 3. Sauter à tarvers un cerceau, 4. Sauter à travers un cerceau en feu apprentissage progressif
Que c’est que La chaîne (“chaining”)?
- Mise en place d’une séquence de réponses (nouvelles ou existantes) dans un ordre temporel. Ex: rat en train d’apprendre à presser levier (R) après avoir été mis dans une skinner box
Comment se passe l’apprentissage de l’échappement et d’évitement dans une “puzzle box”?
L’apprentissage de l’échappement et de l’évitement dans une “puzzle box” Puzzle box a 2 sections, dont une avec une grille électrique sur le sol Condition échappement : animal apprend à sauter par dessus la barrière lorsque l’électricité est allumée réponse apprise stoppe le stimulus aversif Condition évitement : animal apprend à sauter la barrière lorsqu’il entend un son juste avant que l’électricité soit allumée réponse apprise empêche le stimulus aversif de se produire en premier prévoyance
Quels sont les spécifications pour des intervals de temps? => Rythme définit par la reaction => Rythme définit par le temps
Des spécifications Dans les programmes fixes et variables, le même taux de renforcement est présenté, mais d’après des règles différentes : - FR–5 proportion fixe : chaque 5ème réaction est renforcée renforcement à proportion constante, rythme clair - VR–5 proportion variable : en moyenne chaque 5ème réaction est renforcée récompense pour un pourcentage de réponses mais nombre de réactions nécessaires avant renforcement est imprévisible, rythme pas clair (ex: 4e, 7e, 13e, 20e réponses = 1/5 moyenne) Rythme définit par la réaction - FI–5 intervalle fixe : première réaction exécutée après un délai de 5mn est renforcée (avant 5mn non) - VI–5 intervalle variable : renforcements après des intervalles de temps variables, mais en moyenne toutes les 5mn (ex: 2mn, 5mn, 6mn, 20mn = moyenne 5mn) Rythme définit par le temps On peut combiner les programmes. (ex: commencer par proportion fixe pour acquisition rapide et continuer avec intervalle variable pour maintenir le comportement beaucoup de compliments puis seulement de temps en temps continue à s’habiller bien pour essayer de plaire tout le temps et d’avoir ds compliments)
Que c’est qu’une contingence?
- Contingence: Une relation entre un comportement (R) est une conséquence (SR) dans une certaine situation