Cours 1 - Programmes de renforcement Flashcards

1
Q

Quelle est la définition de programme de renforcement?

A

Ensemble de ce qui doit être fait pour obtenir un renforçateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment nomme-t-on les effets que les programmes de renforcement ont sur le comportement?

A

Effets de programme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les 5 grands types de programmes simples?

A
1- Continu 
2- Intermittent 
3- Durée 
4- Débit de réponse
5- Non contingent
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la fréquence des récompenses avec le programme continu?

A

Chaque comportement est renforcé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou Faux? Le programme de renforcement continu est très peu efficace.

A

Faux. Il est très efficace car facile à comprendre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est la fréquence des récompenses avec les programmes intermittents?

A

Ce ne sont pas tous les comportements qui sont renforcés. Seulement certaines réponses le sont.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou Faux? Les programmes de renforcement intermittent sont les plus courant dans la vie de tous les jours.

A

Vrai. L’environnement renforce rarement tous nos comportements.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les 4 programmes de renforcement intermittent?

A

1- Proportion fixe
2- Proportion variable
3- Intervalle fixe
4- Intervalle variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est la définition d’un programme à proportion fixe?

A

Programme où le nombre de réponses est renforcé de manière prévisible et fixe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment note-t-on le programme à proportion fixe?

A

PFXX

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Nommer les 3 caractéristiques concernant le programme de renforcement à proportion fixe. (Dans les notes: “Engendre habituellement…”)

A

a. Un débit de réponse rapide
b. Une courte pause
c. Le retour rapide des réponses après la pause.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment appelle-t-on le retour des réponses après la pause?

A

L’amorce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou Faux? Dans le programme PF, il peut parfois avoir un délai plus long entre la pause et le retour des réponses.

A

Vrai. Toutefois, une fois qu’on a commencé le programme, les réponses se font de plus en plus rapidement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel est le truc pour favoriser l’amorce?

A

Commencer par un comportement facile.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou Faux? Dans le PF, y a un généralement une corrélation négative entre le temps de pause et le nombre de réponses nécessaires pour recevoir la récompense.

A

Faux. La corrélation est positive. EX: Plus de temps de pause pour PF100 que pour PF25

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qu’un programme riche/dense?

A

Un programme où le ratio en bas. C’est-à-dire, les récompenses sont faciles à obtenir. (On ne doit faire que 2 réponses pour 1 récompense, par exemple)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce qu’un programme frugal?

A

Un programme où le ratio est haut. C’est-à-dire, les récompenses sont difficiles à obtenir. (On doit faire 10 comportements pour 1 récompense, par exemple)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quel est le problème et la solution avec les programmes riches? Et quelle est sa solution?

A

Ils sont très coûteux (besoin de beaucoup de récompenses pour satisfaire le ratio). Solution: Étirement de la proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce qu’implique l’étirement de la proportion?

A

On passe d’un programme riche à un programme frugal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

L’étirement de la proportion, s’il est fait de manière trop brutal, peut engendrer une dégradation du comportement. Comment appel-t-on ce phénomène?

A

Tension du ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce qu’un programme à proportion variable?

A

Un programme où la récompense est variable et imprévisible. On fait la moyenne du nombre de comportement nécessaire pour obtenir la récompense.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment note-t-on le programme à proportion variable?

A

PVXX

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quelles sont les 4 caractéristiques que peut engendrer un PV?

A

a. Débit de réponse stable et rapide
b. Peu de pause
c. Peut aller à aucune pause si le minimum de réponse requis est très bas.
d. Le sujet sait que même après une seule réponse il peut être récompensé, alors il sera tenté de ne jamais arrêter pour avoir une récompense ASAP.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Vrai ou Faux? Le PV peut engendrer un comportement mal adapté.

A

Vrai. EX: jeu compulsif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Quelle est la défintion du programme à intervalle fixe?

A

Programme où le renforcement est en fonction de la première réponse produite après une période de temps prévisible et fixe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Comment note-t-on le programme à intervalle fixe?

A

IFXX

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Qu’est-ce que ce type de programme engendre habituellement? (3)

A

a. un mode de réponse ondulatoire
b. pause après l’obtention du renforçateur
c. après la pause, retour de réponse rapide plus l’intervalle de temps avance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Vrai ou Faux? Dans un programme IF, le temps représente un stimulus discriminatif.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Quelle est la définition d’une programme a intervalle variable?

A

Programme où le renforçateur est en fonction de la première réponse produite après une période de temps imprévisible et variable. (En fonction de la moyenne de temps)

30
Q

Comment note-t-on le programme à intervalle variable?

A

IVXX

31
Q

Le programme IV engendre habituellement 4 éléments. Quels sont-ils?

A

a. un débit de réponse stable et modéré
b. Peu de pause après l’obtention de chaque renforçateur
c. Peu aller jusqu’à aucune pause si le tmeps minimum est court
d. L’animal ne veut pas manque rsa chance d’obtenir un renforçateur, donc il continue toujours le comportement.

32
Q

Vrai ou Faux? Dans un programme PV, le comportement est très irrégulier.

A

Faux. Il devient régulier. Moyen d’avoir des comportements très réglier sans trop utliser de renforçateurs.

33
Q

Quelles sont les 2 caractéristiques globales des programmes à proportion?

A

a. Débit rapide car les renforçateurs dépendent du nombre de réponses produit.
b. Pour augmenter le nombre de renforçateurs, on renforce le nombre de réponses.

34
Q

Vrai ou Faux? Les programmes fixes ont tendance à engendrer des pauses après le renforçateur.

A

Vrai. L’organisme sait qu’avant d’obtenir le prochain renforçateur, il devrai nécessairement attendre (un délai ou de faire un certain nombre de comportement).

35
Q

Qu’est-ce qu’un programme à durée fixe?

A

Programme pour lesquels le renforcement est en fontion de l’éxécution d’un comportement étalé tout au long d’une certaine période de temps fixe. EX: rouler dans une roue pendant 10 secondes.

36
Q

Comment note-t-on le programme à durée fixe?

A

DFXX

37
Q

Qu’est-ce qu’un programme à durée variable?

A

Programme pour lequel le renforcement est fonction de l’éxécution d’un comportement étalé tout au long d’une certaine période de temps imprévisible et variable (nombre de temps moyen).

38
Q

Comment note-t-on le programme à durée variable?

A

DVXX (moyenne de la durée de temps)

39
Q

Comparément aux autres programmes simples, à quel point les programme à durée fixe et variable sont efficace?

A

Ils sont en fait plus imprécis dans leur capacité à faire produire des comportements. Il y a plus de place à l’interprétation. L’organisme aurait besoin de plus de spécificité sur le comportement pour qu’on obtienne le résultat désiré.

40
Q

Qu’est-ce qu’un programme à débit de réponse?

A

Un programme pour lequel le renforcement est en fonction du débit de réponse.

41
Q

Qu’est-ce que l’aspect différentiel?

A

Le fait que certains types de réponses soient renforcées alors que d’autres, non.

42
Q

Qu’est-ce qu’un programme de renforcement diféfrentiel à débit rapide?

A

Un programme pour lequel le renforcement est en fonction de la production d’au moins un certain nombre de réponses en une certaine période de temps.

43
Q

Qu’est-ce qu’un programme de renforcement différentiel à débit lent?

A

Programme pour lequel la production d’au plus un certain nombre de réponses dans une certaine période de temps est renforcée.

44
Q

Qu’est-ce qu’un programme de renforcement différentiel de réponses rythmées?

A

Programme pour lequel le renforcement se fait en fonction d’une suite de réponse préétabli. (Fixer une intervalle de nombres de réponses acceptables. L’oganisme doit faire le comportement selon cette intervalle.)

45
Q

Qu’est-ce qu’un programme non contingent?

A

Programme où il n’existe aucun lien entre le comportement de la personne et la récompense.

46
Q

Quel est le deuxième nom donné aux programmes non contingents?

A

Programme indépendants de la réponse.

47
Q

Qu’est-ce qu’un programme à temps fixe?

A

Le renforcement apparaît après une période de temps prévisible et fixe, peu importe le comportement du sujet.

48
Q

Comment note-t-on le programme à temps fixe?

A

TFXX

49
Q

Qu’est-ce qu’un programme à temps variable?

A

Le renforcement apparaît après une période de temps imprévisible et variée, peu importe le comportement du sujet. *On tient compte de la moyenne de temps.

50
Q

Comment note-t-on le programme à temps variable?

A

TVXX

51
Q

Quel programme de renforcement est responsable de l’apparition de des comportement supersticieux?

A

Programme à temps variable

52
Q

Qu’est-ce qu’un comportement supersticieux?

A

Penser que les comportements doivent être fait pour obtenir quelque chose, mais ils n’ont aucun lien avec la récompense.

53
Q

Il y a une tendance particulière en lien avec les comportements supersticieux, quelle est-elle?

A

C’est une tendence innée à être intolérent à l’incertitude et à essayer de précoir uo de contrôler l’incertitude.

54
Q

Qu’est-ce qu’un programme conjonctif?

A

Un programme complexe dans lequel les exigences à au moins 2 programmes simples doivent être respectées pour recevoir le renforçateur.

55
Q

Qu’est-ce qu’un programme ajustable?

A

Un programme où la demande de la réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent.

56
Q

En quoi est-ce que le programme ajustable est utile?

A

Pour façonner exactement le comportement que l’on veut. On ajoute les critères au fur et à mesure pour “diriger” le comportement.

57
Q

Qu’est-ce qu’un programme en chaîne?

A

Programme qui consiste en une suite d’au moins deux programmes simples où chacun a son propre SD et dont le dernier produit un renforçateur terminal. (Tâche initiale, suivit de tâche final, qui elle est suivit d’un renforçateur.)

58
Q

Quelle est la différence entre un programme en chaîne et un programme conjonctif?

A

Les tâches doivent être faites dans un ordre précis pour le programme en chaîne.

59
Q

Vrai ou Faux? Dans le programme en chaîne, les réponses aux premiers maillons (tâches) sont plus faibles que celle aux tâches plus près du renforçateur.

A

Vrai.

60
Q

Dans le programme en chaîne, les réponses aux premiers maillons (tâches) sont plus faibles que celle aux tâches plus près du renforçateur. Pourquoi? (3)

A

a. Renforcement immédiat plus efficace que renforcement différé.
b. Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien en fort.
c. Principe d’effet de gradient: hausse de la force ou de l’efficacité à mesure qu’on s’approche de l’objectif.

61
Q

Qu’est-ce que l’enchaînement à rebours?

A

Établir un programme en chaîne en débutant par le maillon final et finissant par le maillon initial.

62
Q

Expliquez les grandes lignes de la théorie de la réduction des pulsions de Hull.

A

Un comportement en renforcé lorsqu’il réduit une pulsion. Ces pulsions sont souvent de nature physiologique (besoins physio). Tout renforcement est lié de près ou de loin`un besoin physiologique.

63
Q

Quelle est une grande limite de la théorie de la réduction des pulsions de Hull?

A

Certains comportement semblent n’être associés aucun type de réduction des pulsions (besoin) ou le lien est très mince et dur à voir.

64
Q

Qu’est-ce que la motivation incitatrice?

A

Motivation issue d’une certaine propriété du renfroçateur.

65
Q

Qu’est-ce que le principe de Premack?

A

Un comportement très probable peut servir de renforçateur à un comportement peu probable.

66
Q

Vrai ou Faux? Le principe de Premack offre une façon d’identifier facilement des renforçateurs dans l’environnement.

A

Vrai.

67
Q

Dans l’hypothèse de la déprivation de la réponse, un comportement peut servir de renforçateur à deux conditions. Quelles sont ces conditions?

A
  1. L’accès à ce comportement est restreint

2. La fréquence du comportement se situe sous son niveau préférentiel.

68
Q

Qu’est-ce que le niveau préférentiel?

A

Niveau de référence lorsque le sujet peut faire librement son comportement.

69
Q

Le niveau préférentiel permet de comprendre pourquoi les contingences de renforcement sont efficaces. Pourquoi? (2 raisons)

A

a. Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel sont renforcés.
b. Dans un état de déprivation, si on ne fait pas le comportement, notre niveau restera sous le niveau préférentiel.

70
Q

Quelles sont les grandes lignes de l’approche comportementale axée sur le point de satiété?

A

Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global. La durée de chaque activité = leur renforcement optimal (satiété). Impossible d’atteindre le niveau de satiété dans toutes les activités. On peut toutefois s’en rapprocher le plus possible. Nous devons donc ajuster notre temps afun d’atteindre un point qui nous rapproche de nos points de satiété, sans vraiment les atteindre.