Cours 5 ****IMPORTANT*** Flashcards

1
Q

Les programmes de renforcement (schedules) : Les programmes continus

A

Les programmes continus
À chaque fois qu’un comportement a lieu
Rat pèse sur un levier = nourriture
Enfant range ses jouets = bravo !
Acquisition plus rapide d’un nouveau comportement
Limites
Applications réelles ?

Plus théorique, peu vu dans la vraie vie, peu réaliste, peu pratique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Les programmes intermittents

A

Proportion (ratio) fixe
Répétition du comportement un nombre fixe de fois (RF 3)
Rat reçoit de la nourriture après avoir pesé 3 fois sur le levier
Employé payé à la pièce (RF 1)
Travaille rapidement —» payé à ch fois qu’il fait le geste
Équivaut à un programme continu

Prend au comportement un nombre fixe de fois avant de recevoir le renforcement

Employé payé à la pièce (RF 1)
Travaille rapidement —» payé à ch fois qu’il fait le geste, ne va pas prendre de grandes pauses parce que ce n’est pas payant, plus c’est vite, plus tu travailles = plus tu es payé
Équivaut à un programme continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Suite

A

Proportion (ratio) variable
Le nombre de comportement nécessaire pour un renforcement varie autour d’une moyenne
RV 5
Renforcement parfois après 2 comportements, parfois après 10
Moyenne 5 fois
Plus productif
Travaille plus rapidement que sur ratio fixe

Travaille plus rapidement que sur ratio fixe parce qu’il ne sait jamais quand il sera renforcé, donc essayer de travailler le plus fort et le plus intensément possible car il ne sait jamais quand le renforcement aura lieu

Ex : Vendeur sous commissions (vente à pression, va essayer le plus intensément possible de faire des ventes, essayer au max de faire des ventes car on ne sait jamais quand ça va marcher, extrêmement persistent, joue un peu avec la vérité)
Serveur avec tips

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Proportion ratio variable

A

Proportion (ratio) variable
Vente à commission
Parfois fonctionne, parfois non
Jeu (casino)
Parfois la machine paie, parfois non
Enfants… Cédule RV à éviter !!!
Caractère imprévisible de la situation

Enfants : Comme je ne sais jamais quand il dira oui, je vais le tester au maximum. À ch fois qu’on leur dit non, ils vont persister et ils vont être gossants, ils reviennent à la charge plusieurs fois car ils savent que le non n’est pas fixe, peut être modifié en oui

»Mettre moins de règlements, mais qui peuvent tous être appliqués en tout temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Intervalle fixe

A

Intervalle fixe
Cuire du pain dans un four
Regarde seulement dans les dernières minutes
Regarder l’heure
Plus fréquent avant la fin du cours
Étude des étudiants
Semaine avant l’examen (haute fréquence)
Semaine après l’examen (basse fréquence)
Évaluation annuelle
Chasser le naturel…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Intervalle variable

A

Intervalle variable
Chasseur qui attend
Parfois après 5 minutes, parfois après 3 heures
Examen surprise
Attendre un courriel

On ne sait jamais quand les renforcements vont arriver

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Modification du ratio

A

Ratio
Par shaping
RF
RF 3
RF 5
RF 8 etc…
Modification du ratio
Avec un animal…
Casino
Stratégie
Laisser le client gagner au début
Modification en cours de partie

On va miser sur l’explosion de l’extinction quand le comportement ne donne plus de renforcement pour modifier le ratio (Extinction progressive) Ex : Mes parents ne me donnent plus d’argent de poche quand je fais du ménage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Extinction

A

L’effet partiel du renforcement
Un ratio intermittent (RV) est plus résistant à l’extinction qu’un ratio continu (contre-intuitif)
Deux principales hypothèses sont envisagées
Discrimination
Séquentielle

Comportements deviennent plus résistants à l’extinction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hypothèse 1

A

Discrimination
Plus long de comprendre l’extinction sur RF 30 que RF 1
Besoins d’au moins 30 essais avant de comprendre que l’accès au renforcement est impossible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hypothèse 2

A

Séquentielle
Plusieurs pesées sur le levier non renforcées ont précédé l’obtention d’un renforcement
X X X X 1000$ (Après 5 coups = 1000$) Elle a fini par payée, faire plusieurs fois avant de recevoir son renforcement, habituer d’avoir une séquence qui n’est pas payante avant d’avoir une séquence payante, va finir par y arriver parce que ça s’est passé comme ça dans le passé

Ex : J’ai vraiment faim, met 1 $ dans la machine distributrice, mais elle ne donne rien. Met un 2e $, mais donne rien. On dit que la machine est défectueuse, elle ne fonctionne plus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Applications

A

Au travail
Learned industriousness (Einsenberger)
Effort/fatigue = sensation aversive/désagréable
Si + effort, alors meilleurs résultats (généralement)
Pairage sensation d’effort et renforcement
Travailleur plus productif/persévérant
Manipulation des schedules

No pain, no gain

Travaillants, ont dû faire beaucoup d’efforts avant de recevoir un renforcement, ça les fait travailler plus parce que ça a pris beaucoup d’efforts pour obtenir le renforcement voulu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Application en thérapie

A

En thérapie
Modification progressive du ratio avant renforcement
Retrait du renforcement

Le client qui a les bons comportements au début = beaucoup de renforcement au début. Après, on va modifier notre ratio pour que même si on est plus là (fin de la thérapie) pour donner le renforcement, qu’il garde les habiletés qu’il a acquises

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Applications: Jeu compulsif

A

Jeu compulsif
Moyenne du retour 90%
Pour chaque dollar dépensé, le casino remet 90 cent
Caractéristiques personnelles ?
Histoire de renforcement
Gains rapides ?

Redonne de l’argent au joueur, mais au long terme le joueur perd plus d’argent

Caractéristiques personnelles ? Pas impossible
Histoire de renforcement
Gains rapides ? Semblent jouer un rôle dans la cédule de renforcement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Expérience du pigeon

A

Étape 1
Expérience pigeon
50 coups de bec = 3 secondes accès à un plat de nourriture
Travail 30 minutes jour = maintien du poids santé de pigeon
Étape 2
Choix entre jeu (hasard) ou travail
Disque standard
50 coups de bec = 3 secondes accès à un plat de nourriture
Disque illuminé
Paie de manière imprévisible
Parfois 1 coup de bec = 15 secondes
Arrangement du chercheur
Certains pigeons feront de gros gain dès le départ
Étape 3
Extinction
Mieux de retourner travailler que de jouer
Les pigeons jouent jusqu’à perdre du poids
Retrait du jeu
Pigeon retour au poids normal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Suite

A

Étape 4
Réinstauration du jeu
Les pigeons jouent encore jusqu’à perdre du poids
Pigeons peuvent gagner plus par jeu
Ex: 15 secondes au jeu

Le jeu compulsif met le joueur compulsif sur une cédule de renforcement à RV, devient accros au jeu à cause de l’hypo séquentiel et aux possibilités de gagné, s’habitue à l’incertitude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly