Les théories du renforcement - cours 10 Flashcards

1
Q

Qui suis-je : l’apprentissage fut ma troisième carrière en psycho, je parle russe et j’ai ainsi été inspiré par les concepts du conditionnement classique en traduisant un ouvrage de Pavlov.

A

Clark Leonard Hull (1884-1952)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est l’opinion de Hull par rapport à l’importance des variables non observables ?

A

Contrairement à Skinner, Hull assume l’existence de comportements non-observables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel modèle illustre l’existence d’une variable interne dans le comportement ?

A

S - X - R - C
X = hypothétique cas ne peut pas être observé = “variable intermédiaire”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel concept est proposé par Hull qui ajoute un côté plus humain au béhaviorisme ?

A

L’homéostasie comportementale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est ce que la “drive” (tendance) ?

A

Lorsque l’homéostasie est déséquilibrée, cela crée un “besoin” que la “drive” tente de réduire = motivation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou Faux : pour Hull il peut y avoir différents types de drive.

A

Faux : pour Hull, il n’y a qu’une seule motivation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la formule de comportement qui illustre la théorie de Hull ?

A

E = (H*D) - (nIc+Ic)
E : force de comportement observable
H : habit (apprentissage)
D : drive (motivation/tendance)
nIc : inhibition non conditionnée (fatigue)
Ic : inhibition conditionnée (ex: peur)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que permet un renforçateur ?

A

Réduit la “drive”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce que la motivation incentive ?

A

Motivation créée par le renforçateur lui-même, indépendant de sa capacité objective à satisfaire le besoin à l’origine de la tendance.
Tend vers 0 mais jamais 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Donnez un exemple de motivation incentive

A

Ex : chocolat peut nous faire manger même lorsqu’on n’a pas faim, shopping, sucre pour les rats
Varie d’une personne à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle théorie en marketing peut être associée au concept de ma motivation incentive ?

A

Théorie du Push and Pull
Push = drive
Pull = motivation incentive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est alors la formule du comportement en ajoutant la motivation incentive ?

A

E = (HDK) - (nIc+Ic)
K= motivation incentive, additionnelle qui énergie le comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

à quoi sert la “boite noire de Hull” ?

A

Illustrer ce qui se trouve dans les mécanismes internes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Par quoi sera déterminé la force de la réponse selon le modèle de Hull?

A

Si HDK - nIc+Ic dépasse le seuil, soit la valeur de E détermine la vitesse et l’amplitude de la réponse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qui suis-je : héritier de Tinklepaugh, j’ai effectué des travaux avec des primates et des cochons dans les situations opérantes libres. À la base béhavioriste progressiste, j’ai contribué à développer une conception différente du renforçateur.

A

David Premack (1925-2015)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les caractéristiques du cochon Newt par rapport au cochon Jack ?

A

Newt : 1 h au choix
28 min cherche des racines
17 min repos

Jack : 1 h au choix
28 min repos
17 min cherche des racines

17
Q

Que peut on faire comme conclusion par rapport au comportement de Jack ?

A

Jack préfère le repos, le repose peut donc renforcer jack
= variable individuelle

18
Q

Quel est le Principe de Premack ?

A

Un comportement plus probable peut servir de renforcement à un comportement moins probable
= S - R - R - C (le deuxième r renforce le premier)

19
Q

Qu’ont démontré Timberlake et Allison ?

A

Que le principe de Premack n’est pas toujours exact

20
Q

Qu’est ce que la théorie de la privation de la réponse de Timberlake et Allison ?

A

Tout comportement produit à un niveau inférieur à son niveau optimal peut être un renforçateur (ex : niveau optimal de préférence est d’étudier 20% du temps et qu’il ne peut étudier que 10%, alors pouvoir étudier plus que 10% = renforçateur)

21
Q

Quelle expérience illustre la théorie de Tolman ?

A

Expérience de Crespi = labyrinthe où rats sont entrainés à courir pour 1(vert), 16(jaune) ou 256(rouge) pilules de nourriture

22
Q

Quels sont les résultats de l’expérience de Crespi ?

A

Après que tous les rats aient reçu 16 pilules : la modification de la taille de la récompense influence immédiatement la vitesse de parcours.
rats du groupe vert = apprentissage latent

23
Q

Que démontre l’expérience de Crespi ?

A

Montre le rôle de l’attention dans le conditionnement : on ne peut apprendre que les choses auxquelles on prête attention
+ remise en cause de la loi de l’effet (si la loi de l’effet était en cause, le grp 1 aurait commencé à apprendre au jr 21)

24
Q

Qui suis-je : j’ai proposé un modèle alternatif à celui de Rescorla dans lequel l’attention du sujet à un SN/SC est lié à la capacité du SN/SC à prédire le SI (contingence)

A

Mackintosh

25
Q

Quel est le modèle de Mackintosh ?

A

DeltaV = alpha (lambda - V)
alpha : plus la contingence mais le niveau d’attention, qui augmente avec l’apprentissage

26
Q

Que permet d’expliquer le modèle de Macintosh que ne permettait pas celui de Resorla ?

A

L’inhibition latente

+ explique le blocage de Kamin en terme de non-attention à B lorsque A a déjà été conditionné avec SI

27
Q

Quel est le problème du modèle de Macintosh ?

A

Plus on apprend, plus le niveau d’attention augmente (alpha n’est pas une constante puisqu’on est de plus en plus attentif)
–> démontré comme faux dans l’expérience de Pearce et Hall

28
Q

Quelles sont les étapes de Pearce et Hall ?

A

Phase 1 : grp exp = SN/SC + choc faible
Grp contrôle = choc sans SN (rien à apprendre)
Phase 2 : grp exp = choc +intense avec SC
Grp contrôle = choc +intense avec SN (pour la première fois)

29
Q

Quels auraient étés les résultats si Mackintosh avait raison ?

A

SC du groupe expérimental aurait un alpha plus élevé (à cause de la phase 1) et donc une réaction plus forte/meilleure performance.

30
Q

Quels ont étés les résultats de l’expérience 1 de Pearce et Hall ?

A

inverse de ce que prédisait Mackintosh : le groupe exp a la moins bonne performance et le groupe contrôle fait plus attention.

31
Q

À quoi pouvons nous associer les résultats de l’expérience 1 de Pearce et Hall ?

A

Le transfert négatif de Pearce-Hall : si on effectue un apprentissage ds une situation, cet apprentissage va nous nuit dans une situation similaire mais différente (laisse une trace mnésique)

32
Q

L’attention est une ressource …

A

cognitive limitée

33
Q

Quelle est la formule proposé par Pearce et Hall ?

A

dV = a(I-SommeV)
I-sommeV = quantité de surprise
I = max de surprise possible
a = attention qui dépend du degré de surprise à l’essai précédent (augmente avec la surprise, diminue avec l’apprentissage)

34
Q

En quoi consiste l’expérience 2 de Pearce et Hall

A

Lumière est associée à
grp 1 : un SI (continu)
grp 2 : l’absence de SI (nul)
grp 3 : présentation aléatoire de la lumière et de SI (partiel)

35
Q

Qu’observent-on dans l’expérience 2 de Pearce et Hall ?

A

Réponses d’orientation diminuent pour grp continu et nul mais restent fortes pour grp partiel (reste surpris)

36
Q

Comment Pearce et Hall expliquent-ils le transfert négatif et l’inhibition latente ?

A

Transfert négatif : après phase 1 le CS est bien connu et donc moins surprenant (alpha est plus faible que normalement au début de la phase 2)

Pareil pour l’inhibition latente (réduction de l’attention)