Plans de renforcement Flashcards

cours 7

1
Q

Qu’est ce que le renforcement continu?

A

Lorsque chaque réponse est suivie d’une conséquence/renforcement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est ce que le renforcement partiel?

A

Lorsque la réponse n’est toujours renforcé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel renforcement fournit un meilleur apprentissage et pourquoi?

A

C’est le renforcement continu, à cause de la loi de l’effet (comportement est controlé par ses conséquences)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les effets du renforcement partiel?

A

Ralentissement de la courbe d’apprentissage et la résistance à l’extinction (plus lent mais plus résistant)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pour quel renforcement l’extinction est plus rapide?

A

Pour le renforcement continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi la résistance est présence

A

À cause de la frustration et la discrimination

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce qu’un plan à ratio fixe (FR)?
Donner un exemple

A

C’est comme un renforcement continu, la réponse dépend du nombre de réponses répétitives
ex. travail payé à l’unité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel comportement est observé pour un FR?

A

Les réponses sont à haute fréquence mais elle sont suivie d’une pause “post-renforcement”, qui dépend du ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce qu’un plan à ratio variable (VR)?
Donner un exemple

A

Le nombre de réponse nécessaire varie pour chaque récompense
ex. travail à commission

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel comportement est observé pour un VR?

A

Il y a un effort constant et élevé, les pauses sont courtes et moins fréquente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est ce qu’un plan à intervalle fixe (FI)?
Donner un exemple

A

L’individu doit effectuer une réponse après qu’un intervalle de temps spécifique se soit écoulé pour recevoir une récompense
ex. ouvrir le four pour regarder le gâteau qu’on cuit, en espérant que la cuisson soit terminer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel comportement est observé pour un FI?

A

Les réponses sont isolées et espacées dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est ce qu’un plan à intervalle variable (VI)?
Donner un exemple

A

L’individu doit effectuer une réponse après qu’un intervalle de temps (qui varie) se soit écoulé pour recevoir une récompense
ex. un photographe qui essaye de photographier des animaux dans la nature

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel comportement est observé pour un VI?

A

Il y a un rythme de réponses lents mais assez constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce qu’on apprend de l’expérience d’Hammond?

A

L’expérience illustre la façon dont les individus ajustent leurs comportements en fonction du lien perçu entre une action et une récompense. Si ce lien est faible ou absent, le comportement diminue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce qu’un renforçateur selon Pavlov?

A

Un renforçateur est un SI associées avec un SC

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est ce qu’un renforçateur selon Thorndike?

A

Les renforçateurs fournissent de la satisfaction et ceux-ci établissent des connexions entre les stimuli

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qu’est ce qu’un renforçateur selon Skinner?

A

Un renforçateur est tout stimuli qui augmente la réponse qui le précède

19
Q

Qu’est-ce que l’extinction?

A

Lorsqu’un comportement renforcer ne reçoit plus de renforcement (ça augmente la variabilité du comportement et la fréquence du comportement émotionnel comme l’agressivité)

20
Q

Qu’est-ce que l’extinction burst?

A

C’est lorsque après l’extinction, le sujet a une augmentation brute du comportement
ex. parent qui ignore son enfant qui veut des bonbons –> enfant se met a crier

21
Q

Qu’est-ce que la resurgence?

A

Lorsqu’un comportement appris dans le passé refait surface lorsque le comportement actuellement renforcé arrête d’être renforcé

22
Q

Qu’est-ce que le spontaneous recovery?

A

Lorsque le comportement revient sans renforcement (la fréquence du comportement baisse mais il peut réapparaître à l’improviste)

23
Q

Qu’est ce qu’un plan à durée fixe (FD)?
Donnez un exemple

A

Le comportement doit être effectué de façon continue sur une période de temps et le renforcement est donné à la fin de la durée
ex. enfant qui pratique le piano pendant 30mins et à la fin, sa mère lui donne un cookie pour le féliciter

24
Q

Qu’est ce qu’un plan à durée variable (VD)?
Donnez un exemple

A

Le comportement doit être effectué de façon continue sur une période de temps qui varie et le renforcement est donné à n’importe qui moment
ex. enfant qui pratique le piano pendant 30/40/45min et à la fin, sa mère lui donne un cookie n’importe quand

25
Q

Qu’est ce qu’un plan à temps fixe (FT)?
Donnez un exemple

A

Le renforcement est donné après une période de temps, peu importe si le comportement a été effectué ou pas
ex. pigeon reçoit de la nourriture chaque 10sec peu importe s’il picore le disque ou pas, recevoir un cadeau à son anniversaire

26
Q

Qu’est ce qu’un plan à temps variable (VT)?
Donnez un exemple

A

Le renforcement est donné périodiquement à intervalles irréguliers, peu importe si le comportement a été effectué ou pas
ex. fleurs qui poussent à n’importe quel moment (pas besoin de l’arroser constamment)

27
Q

Qu’est ce qu’un plan à ratio progressif (PR)?
Donnez un exemple

A

Le nombre de réponse pour obtenir une récompense augmente progressivement après chaque renforcement
ex. appuyer sur un levier un nombre déterminé de fois, qui augmente

28
Q

Nomme les différents plans composées

A

Le plan multiple, le plan mixte, le plan en chaîne, le plan tandem, le plan coopératif et le plan simultané

29
Q

Quels sont les plans à renforcement non contingent (NCR)?

A

Le plan à temps fixe et le plan à temps variable

30
Q

Quels sont les plans à renforcement qui dépendent de la réponse

A

Le plan à ratio fixe et le plan à ratio variable

31
Q

Quels sont les plans à renforcement qui dépendent du passage du temps

A

Le plan à intervalle fixe et le plan à intervalle variable

32
Q

Qu’est ce qu’un plan multiple?

A

2 plans ou + qui alterne et influence le comportement, chaque plan est associé à un stimuli particuliers

33
Q

Qu’est ce qu’un plan mixte?

A

2 plans ou + qui alterne et influence le comportement, mais il n’y a pas de changement apparent de plan

34
Q

Qu’est ce qu’un plan en chaîne?

A

Le renforcement arrive seulement lorsque la dernière série de plan est complété, changement apparent (couleur/son)

35
Q

Qu’est ce qu’un plan tandem?

A

Le renforcement arrive seulement lorsque la dernière série de plan est complété, pas de changement apparent

36
Q

Qu’est ce qu’un plan coopératif?
Donnez un exemple

A

2 individus ou +, le renforcement qu’un individu reçoit dépend du comportement de l’autre individu
ex. travail d’équipe

37
Q

Qu’est ce qu’un plan simultané?

A

2 plans ou + disponible simultanément, le sujet doit alors faire un choix

38
Q

Que signifie l’effet de renforcement partiel?

A

C’est lorsque les comportements renforcer avec le renforcement partiel sont plus résistant à l’extinction qu’un comportement renforcé de manière continue

39
Q

Quels sont les théories qui expliquent l’effet de renforcement partiel?

A

Discrimination hypothesis
Frustration hypothesis
Sequential hypothesis
Response unit hypothesis

40
Q

Expliquez the discrimination hypothesis

A

Lorsque le renforcement est partiel, il est plus difficile de détecter l’arrêt total de récompense (extinction) VS avec un renforcement continu c’Est facile de détecter l’extinction car l’absence de récompense devient évidente
ex. une personne qui reçoit des compliments manière irrégulière aura du mal à remarquer immédiatement l’absence totale de compliments

41
Q

Expliquez the frustration hypothesis

A

Lorsque le renforcement n’est pas constant, l’individu éprouve de la frustration lorsqu’une récompense attendue n’est pas donnée. Au fils du temps, il apprend à tolérer sa frustration et à persister dans son comportement malgré l’absence de récompense
ex. rat qui continue à appuyer sur un levier même lorsqu’il ne reçoit pas systématiquement une récompense

42
Q

Expliquez the sequential hypothesis

A

L’individu apprend une séquence où les comportements non récompensés sont souvent suivis de comportements récompensé
ex. un pigeon reçoit une récompense après une série de pression sur un levier (3 essais infructueux), continuera à essayer même sans récompense immédiate

43
Q

Expliquez the response unit hypothesis

A
44
Q

Expliquez la loi de l’appariement

A

Lorsqu’un organisme répartis ses réponses entre plusieurs options en fonction du taux de renforcement par option