Cours 7 - Le conditionnement opérant II Flashcards

1
Q

Qu’est-ce qu’un programme de renforcement?

A

Ça désigne la demande de réponse à satisfaire pour obtenir un renforcement, ce qui doit être fait pour s’assurer d’obtenir un renforçateur. Ensemble de règles à suivre pour obtenir un renforçateur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Donne un exemple de programme de renforcement.

A

Le rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture?
Combien de temps dois-je attendre au McDo avant d’obtenir ma commande?
Combien de fois devez-vous dire à votre coloc de faire sa vaisselle?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

VRAI OU FAUX.
Différents programmes (demandes) vont produire différents effets sur le comportement.

A

VRAI.
Ces effets sont nommées effet de programme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un programme de renforcement continu?

A

C’est un programme où chaque réponse est renforcée.
Exemple : chaque fois que le rat appuie sur le levier, le choc cesse.
Chaque vous que je vous pose une question, vous répondez.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

VRAI OU FAUX.
Le programme de renforcement continu est très efficace.

A

VRAI.
Il est facile à comprendre, donc c’est utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose.
Exemple : ma mère s’empressait de souligner qu’elle appréciait que j’avais appeler pour dire que je ne rentrerais pas à chaque fois que je le faisais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’un programme de renforcement intermittent?

A

C’est un programme où seules certaines réponses sont renforcées. Exemple, le rat doit appuyer 3 fois sur le levier afin d’obtenir de l’eau. Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

VRAI OU FAUX.
Le programme de renforcement intermittent est le plus courant dans la vie.

A

VRAI.
L’environnement renforce rarement tous nos comportements. Les relations amoureuses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Il existe 4 types de programmes intermittents de base. Quels sont-ils?

A
  1. Programme à proportion
  2. Programme à proportion variable
  3. Programme à intervalle fixe
  4. Programme à intervalle variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’un programme à proportion fixe?

A

C’est un programme où le renforcement est fonction d’un nombre de réponses prévisibles et fixe.
Exemple : Un pigeon doit donner 3 coups de bec sur le disque rouge pour obtenir un morceau de fruit.
Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Le programme à proportion fixe est noté PFXX, en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur. Donne un exemple.

A

PF3 pour l’exemple du pigeon.
PF200 pour l’exemple de la copie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

VRAI OU FAUX.
PF1 = programme continu.

A

VRAI.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

VRAI OU FAUX.
Le programme à proportion fixe engendre habituellement un débit de réponse rapide.

A

VRAI.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

VRAI OU FAUX.
Le programme PF engendre habituellement une courte pause après l’obtention de chaque renforçateur, nommée pause après renforcement.

A

VRAI.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

VRAI OU FAUX.
Il y a un retour rapide des réponses après la pause dans le ppf.

A

vrai.
Exemple, un signe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

VRAI OU FAUX.
Dans le ppf, après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long.

A

VRAI.
Exemple, lorsqu’on peinture un appartement, on va prendre une petite bière après avoir fait 4 murs, puis une 2e, 3e, etc.
Par contre, une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

VRAI OU FAUX.
Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce.

A

VRAI.
Il faut commencer par quelque chose de facile.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

VRAI OU FAUX.
Dans le programme à proportion fixe, il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause.

A

VRAI.
Pause pour PF25 < pause pour PF100

18
Q

On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE et RICHE

A

VRAI.

19
Q

On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme frugal.

A

VRAI

20
Q

Comment calculer le ratio?

A

Ratio = nombre de comportements / renforçateur

21
Q

Quel est le problème avec le programme à proportion fixe?

A

Le programme DENSE est souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux.

22
Q

VRAI OU FAUX.
Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion.

A

Exemple : féliciter Charlie d’avoir rangé ces livres à chaque fois qu’il le fait, vers le féliciter à chaque 3 fois

23
Q

VRAI OU FAUX.
L’étirement de la proportion engendre parfois une dégradation dans le comportement.

A

VRAI.
Il peut y avoir une tension de ratio : perturbation de la réponse causée par une demande trop exigeante.
Exemple : Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 100 fois
Entrer au Doctorat

24
Q

Qu’est-ce qu’un programme à proportion variable?

A

Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ.
Ex: un pigeon doit donner en moyenne 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit.
La plupart des sports ou des jeux.

25
Q

Le programme à proportion variable peut être nommé PV10, mais le renforçateur obtenu si la réponse est faite entre 1 et 20, mais en moyenne 10 fois après.

A

VRAI.

26
Q

On ne tient pas vraiment compte de la variance dans le programme à proportion variable.

A

vrai.

27
Q

Qu’est-ce qu’un programme à intervalle fixe?

A

Programme où le renforcement est fonction de la première réponse produite après une période de temps prévisible et fixe.
Ex: un singe doit attendre 30 sec avant de tirer sur une corde pour libérer de la nourriture.

28
Q

Programme à intervalle fixe est noté IFXX en fonction du TEMPS qui doit s’écouler avnt que le comportement puisse donner accès au renforçateur.

A

Exemple : IF30 (lien avec exemple plus haut)

29
Q

Ce type de programme engendre habituellement un mode de réponse ondulatoire - courbe orienté vers le haut

A
30
Q

Qu’est-ce qu’un programme à durée fixe?

A

Programme pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long d’une certaine période de temps fixe
Ex : un rat doit courir dans une roue pendant 10 secondes avant d’obtenir de la nourriture
On doit garder une position de yoga pendant 2 min avant de passer à l’autre

31
Q

Noté DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur (DF10 secondes)

A

c

32
Q

Programme à durée variable

A

le renforcement est fonction de l’éxécution d’un comportement continu pendant une période de temps imprévisble et variée
Ex : un rat doit courir dans une roue pendant en moyenne 10sec avant d’obtenir de la nourriture
Noté DVXX

32
Q

Programme à durée variable

A

le renforcement est fonction de l’éxécution d’un comportement continu pendant une période de temps imprévisble et variée
Ex : un rat doit courir dans une roue pendant en moyenne 10sec avant d’obtenir de la nourriture
Noté DVXX

33
Q

Programmes à durée fixe et variable, comparés aux autres programmes simples vus, sont habituellement plus imprécis dans leur capacité à faire produire des comportements.

A

VRAI,
il laisse plus de place à l’interprétation de ce qui doit être fait - courir pendant 10 min, courir vite vs courir lentemement, etc.
Besoin de plus de spécifications sur les détails des comportemetns à produire afin que l’on obtienne le résultat désiré.

34
Q

Programme à débit de réponse : programme pour lesquels le renforcement est fonction du débit de réponse.

A

IMPORTANCE DE L’ASPECT DIFFÉRENTIEL : un seul type de réponse est renforcé, alors qu’un autre ne l’est pas.

35
Q

Programme de renforcement différentiel du débit rapide (RDDR)

A

programme pour lequel le renforcement est fonction de la production d’au moins un certain nombre de réponses en une certaine période de temps - plus généralement, seulement si le débit est assez rapide, pcq aspect différentiel où tout débit plus lent n’est pas renforcé.
Un pigeon qui doit appuyer au moins 10 fois en 1 min afin de mettre fin è une stimulation douloureuse.

36
Q

Programme de renforcement différenciel du débit lent (RDDL)

A

Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponse en une certaine période de temps.

37
Q

qu’est-ce qu’un programme complexe?

A

C’est la combinaison d’au moins deux programmes simples.

38
Q

Qu’est-ce qu’un programme conjonctif?

A

C’est un programme complexe (donc au moins 2 prog. simples) dans lequel les exigences à au moins deux programmes simples doivent être satisfaites avant de recevoir le renforçateur.
P.ex., Un rat qui doit courir dans une roue pendant 2 minutes (DF2 minutes) et appuyer en moyenne 10 fois sur un levier (PV10) pour obtenir de la nourriture
Pour réussir une soirée presque parfaite vous devez compléter votre entrée, votre plat principal et votre dessert (PF3) et s’assurer de verser du vin au minimum à toutes les 2 minutes et au maximum à toute les 5 minutes (RDRR)

39
Q

Qu’est-ce qu’un programme ajustable?

A

C’est un programme ou la demande de réponse change en fonction de la performance sujet pendant qu’il répond au renforçateur précédent.
P.ex., Rat qui doit appuyer 10 fois sur un levier avant d’obtenir de la nourriture (PF10) puis qui doit appuyer 20 fois dans l’essai suivant (PF20)
Quand on apprend à faire de la musique, passer de faire la gamme lentement à rapidement

40
Q

Qu’est-ce qu’un programme en chaîne?

A

Programme qui consiste en une SUITE d’au moins deux programmes simples, où chacun à son propre SD et dont le dernier produit un renforçateur terminal
DIFFÈRE D’un programme conjonctif car les programmes doivent être complété dans un ordre précis.

41
Q

Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien est fort

A

Principe général de l’effet du gradient : hausse de la force ou de l’efficacité de la réponse à mesure que l’on s’approche de l’objectif.