Plans de renforcement, renforçateurs - cours 7 Flashcards

1
Q

qu’est ce qu’un renforcement continu vs un renforcement partiel ?

A

Continu : 100% de chance d’avoir une conséquence
Partiel : réponse pas toujours suivi de conséquence (infinité de modèles)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lequel entre continu et partiel est le plus efficace ?

A

Le renforcement continu : courbe monte vite mais descend vite aussi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les deux types de plans de renforcement simple ?

A
  • Plan de renforcement à ratio
  • Plan de renforcement à intervalle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel est l’intérêt du renforcement partiel ?

A

Apprentissage + lent MAIS courbe d’extinction plus lente aussi (résiste à l’extinction). + validité écologique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi l’extinction est plus lente dans les plans de renforcement partiels ?

A
  • Discrimination difficile (conséquence peut être associée à la mauvaise chose)
  • frustration (tendance à interrompre le comportement/la recanaliser dans un contre-conditionnement = persister) –> exemple loteries
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est ce que la théorie de la frustration ?

A

Exemple avec bébé qui ne fait pas ses nuits

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou faux : le plan à ratio est un plan de renforcement simple

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

En quoi consiste le plan à ratio ?

A

obtention du renforcement est conditionnel à la production d’un certain nombre de répétitions (ex : appuyer trois fois pour avoir une friandise)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les types de plans à ratios ?

A

Ratio fixes (nombre nécessaire est tjrs le même) et ratios variables (nombres changent)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Différence entre plans à ratio fixe/ratio variable

A

fixe : toujours le mm nombre de réponses nécessaires
variable : nombre de réponses nécessaires varie d’un renforcement à l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment se traduisent les courbes de performance des plans à ratios fixes ?

A

réponse à haute fréquence mais avec pause “post renforcement” lié à fatigue ou consommation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment se traduisent les courbes de performance des plans à ratios variables ?

A

pas de pause (ex: machines à sous)
effort élevé et constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Définition plan à intervalle fixe

A

Renforcement est disponible seulement après une période de temps déterminée (ensuite 1 seule réponse est suffisante)
ex: Duolingo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Définition plan à intervalle variable

A

renforcement est disponible après une période de temps indéterminée (exemple de la tante Gertrude toujours au téléphone)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quels sont les comportements observés dans un plan à intervalle fixe ?

A

Réponses isolées et espacées dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

quels sont les comportements observés dans un plan à intervalle variable ?

A

Rythme de réponses lent mais assez constant

17
Q

Qu’a démontré Tinklepaugh en 1928 ?

A

Que les organismes apprennent à s’attendre à un renforçateur particulier (singes déçus devant feuille de salade)
= il y a de meilleurs renforçateurs que d’autres
Donc modification de la “loi de l’effet”

18
Q

Quelle était la proposition de Colwill et Rescola dans leur modèle de la contingence ?

A

Stimulus –> Réponse –> Conséquence

19
Q

En quoi consiste l’expérience de contingence d’Hammond en 1980, et à quoi celle-ci est apparentée ?

A

Phase 0 : apprentissage/conditionnement pré-expérimental
Phase 1 : renforcement de 5% des réponses. résultat : 3000 pressions/h
Phase 2 : continue renforcement phase 1 avec ajout de récompense dans 5% des cas où levier n’a pas été pressé.
(apparenté au principe de GO-NOGO)
Phase 3&4 = phases 1&2 (plan ABAB)

20
Q

Quels sont les résultats de l’expériences d’Hammond ?

A

Nombre de réponses diminue graduellement presque à 0, puis revient au comportement précédent en phase 3.

21
Q

Que peut on conclure de l’expérience d’Hammond ?

A

Montre qu’il n’y a pas d’extinction car retour au comportement = apprentissage de deux “différents chemins”.
Pour Rescola il n’y avait qu’une contingence par situation, or Hammond nous montre qu’il peut y en avoir deux

22
Q

Quelles sont les différentes description de la notion de renforçateur selon Pavlov, Thorndike et Skinner ?

A

Pavolv : renforçateur = SI associés avec SC
Thorndike : renforçateur = fournis satisfaction ce qui établie des connections entre stimuli
Skinner : renforçateur = tout stimulus qui augmente la réponse qui le précède