Les théories du renforcement - cours 10 Flashcards
Qui suis-je : l’apprentissage fut ma troisième carrière en psycho, je parle russe et j’ai ainsi été inspiré par les concepts du conditionnement classique en traduisant un ouvrage de Pavlov.
Clark Leonard Hull (1884-1952)
Quel est l’opinion de Hull par rapport à l’importance des variables non observables ?
Contrairement à Skinner, Hull assume l’existence de comportements non-observables
Quel modèle illustre l’existence d’une variable interne dans le comportement ?
S - X - R - C
X = hypothétique cas ne peut pas être observé = “variable intermédiaire”
Quel concept est proposé par Hull qui ajoute un côté plus humain au béhaviorisme ?
L’homéostasie comportementale
Qu’est ce que la “drive” (tendance) ?
Lorsque l’homéostasie est déséquilibrée, cela crée un “besoin” que la “drive” tente de réduire = motivation
Vrai ou Faux : pour Hull il peut y avoir différents types de drive.
Faux : pour Hull, il n’y a qu’une seule motivation
Quelle est la formule de comportement qui illustre la théorie de Hull ?
E = (H*D) - (nIc+Ic)
E : force de comportement observable
H : habit (apprentissage)
D : drive (motivation/tendance)
nIc : inhibition non conditionnée (fatigue)
Ic : inhibition conditionnée (ex: peur)
Que permet un renforçateur ?
Réduit la “drive”
Qu’est ce que la motivation incentive ?
Motivation créée par le renforçateur lui-même, indépendant de sa capacité objective à satisfaire le besoin à l’origine de la tendance.
Tend vers 0 mais jamais 0
Donnez un exemple de motivation incentive
Ex : chocolat peut nous faire manger même lorsqu’on n’a pas faim, shopping, sucre pour les rats
Varie d’une personne à l’autre
Quelle théorie en marketing peut être associée au concept de ma motivation incentive ?
Théorie du Push and Pull
Push = drive
Pull = motivation incentive
Quelle est alors la formule du comportement en ajoutant la motivation incentive ?
E = (HDK) - (nIc+Ic)
K= motivation incentive, additionnelle qui énergie le comportement
à quoi sert la “boite noire de Hull” ?
Illustrer ce qui se trouve dans les mécanismes internes
Par quoi sera déterminé la force de la réponse selon le modèle de Hull?
Si HDK - nIc+Ic dépasse le seuil, soit la valeur de E détermine la vitesse et l’amplitude de la réponse
Qui suis-je : héritier de Tinklepaugh, j’ai effectué des travaux avec des primates et des cochons dans les situations opérantes libres. À la base béhavioriste progressiste, j’ai contribué à développer une conception différente du renforçateur.
David Premack (1925-2015)
Quelles sont les caractéristiques du cochon Newt par rapport au cochon Jack ?
Newt : 1 h au choix
28 min cherche des racines
17 min repos
Jack : 1 h au choix
28 min repos
17 min cherche des racines
Que peut on faire comme conclusion par rapport au comportement de Jack ?
Jack préfère le repos, le repose peut donc renforcer jack
= variable individuelle
Quel est le Principe de Premack ?
Un comportement plus probable peut servir de renforcement à un comportement moins probable
= S - R - R - C (le deuxième r renforce le premier)
Qu’ont démontré Timberlake et Allison ?
Que le principe de Premack n’est pas toujours exact
Qu’est ce que la théorie de la privation de la réponse de Timberlake et Allison ?
Tout comportement produit à un niveau inférieur à son niveau optimal peut être un renforçateur (ex : niveau optimal de préférence est d’étudier 20% du temps et qu’il ne peut étudier que 10%, alors pouvoir étudier plus que 10% = renforçateur)
Quelle expérience illustre la théorie de Tolman ?
Expérience de Crespi = labyrinthe où rats sont entrainés à courir pour 1(vert), 16(jaune) ou 256(rouge) pilules de nourriture
Quels sont les résultats de l’expérience de Crespi ?
Après que tous les rats aient reçu 16 pilules : la modification de la taille de la récompense influence immédiatement la vitesse de parcours.
rats du groupe vert = apprentissage latent
Que démontre l’expérience de Crespi ?
Montre le rôle de l’attention dans le conditionnement : on ne peut apprendre que les choses auxquelles on prête attention
+ remise en cause de la loi de l’effet (si la loi de l’effet était en cause, le grp 1 aurait commencé à apprendre au jr 21)
Qui suis-je : j’ai proposé un modèle alternatif à celui de Rescorla dans lequel l’attention du sujet à un SN/SC est lié à la capacité du SN/SC à prédire le SI (contingence)
Mackintosh
Quel est le modèle de Mackintosh ?
DeltaV = alpha (lambda - V)
alpha : plus la contingence mais le niveau d’attention, qui augmente avec l’apprentissage
Que permet d’expliquer le modèle de Macintosh que ne permettait pas celui de Resorla ?
L’inhibition latente
+ explique le blocage de Kamin en terme de non-attention à B lorsque A a déjà été conditionné avec SI
Quel est le problème du modèle de Macintosh ?
Plus on apprend, plus le niveau d’attention augmente (alpha n’est pas une constante puisqu’on est de plus en plus attentif)
–> démontré comme faux dans l’expérience de Pearce et Hall
Quelles sont les étapes de Pearce et Hall ?
Phase 1 : grp exp = SN/SC + choc faible
Grp contrôle = choc sans SN (rien à apprendre)
Phase 2 : grp exp = choc +intense avec SC
Grp contrôle = choc +intense avec SN (pour la première fois)
Quels auraient étés les résultats si Mackintosh avait raison ?
SC du groupe expérimental aurait un alpha plus élevé (à cause de la phase 1) et donc une réaction plus forte/meilleure performance.
Quels ont étés les résultats de l’expérience 1 de Pearce et Hall ?
inverse de ce que prédisait Mackintosh : le groupe exp a la moins bonne performance et le groupe contrôle fait plus attention.
À quoi pouvons nous associer les résultats de l’expérience 1 de Pearce et Hall ?
Le transfert négatif de Pearce-Hall : si on effectue un apprentissage ds une situation, cet apprentissage va nous nuit dans une situation similaire mais différente (laisse une trace mnésique)
L’attention est une ressource …
cognitive limitée
Quelle est la formule proposé par Pearce et Hall ?
dV = a(I-SommeV)
I-sommeV = quantité de surprise
I = max de surprise possible
a = attention qui dépend du degré de surprise à l’essai précédent (augmente avec la surprise, diminue avec l’apprentissage)
En quoi consiste l’expérience 2 de Pearce et Hall
Lumière est associée à
grp 1 : un SI (continu)
grp 2 : l’absence de SI (nul)
grp 3 : présentation aléatoire de la lumière et de SI (partiel)
Qu’observent-on dans l’expérience 2 de Pearce et Hall ?
Réponses d’orientation diminuent pour grp continu et nul mais restent fortes pour grp partiel (reste surpris)
Comment Pearce et Hall expliquent-ils le transfert négatif et l’inhibition latente ?
Transfert négatif : après phase 1 le CS est bien connu et donc moins surprenant (alpha est plus faible que normalement au début de la phase 2)
Pareil pour l’inhibition latente (réduction de l’attention)