Cours 6 Flashcards
John B. Watson
- Critiquait les structuralistes (puisque le structuralisme ne serait pas capable de tout expliquer : la psycho expérimentale était vague et les événements mentaux étaient difficiles à décrire) et la méthode d’introspection qui est peu fiable
- Solution au fait que la psycho expérimentale était vague et peu fiable : faire de la psycho une science objective : c’est-à-dire basé seulement sur ce que l’on peut observer
- Le behaviorisme selon Watson : science naturelle qui focus sur l’étude de l’influence de l’environnement sur le comportement observable : CETTE MÉTHODE IGNORAIT LES PENSÉES + LES FEELINGS
- Il croyait que le comportement des animaux s’appliquait aussi au comportement des humains
- Vu de l’apprentissage très mécanique : selon lui, les humains naissent avec des réflexes fondamentaux et 3 émotions (love/rage/fear). Tout le reste est appris
- Watson est donc un peu considéré comme un extrémiste
B.F. Skinner
o Né à Susquehanna, en Pennsylvanie
o Carrière d’écrivain
o PhD (Harvard) 1931
o Professeur + chercheur à l’U. du Minnesota, Indiana, retour à Harvard en 1948
o Décès en 1990 de la leucémie : il est resté un béhavioriste radical jusqu’à sa mort
o Béhaviorisme radical :
Influence de l’environnement sur les comportements observables
Rejette événements internes pour expliquer le comportement
Les pensées et les sentiments sont des comportements qui ont eux-mêmes besoin d’être expliqués (il ne rejette donc pas complétement les événements interne, comme le fait Watson)
Selon lui : l’apprentissage de comment on se sent se fait ainsi : on apprend que la douleur fait « mal » parce qu’on se faire dire que quand on se cogne un orteil : ça fait mal. Cette manière d’étiqueter les sentiments n’est pas très précise
DONC, Skinner rejetait les événements internes pour expliquer les comportements, à la place, il focussait sur l’environnement comme la cause ultime pour autant les comportements observables que non-observable (interne).
Grande appréciation pour l’influence des facteurs génétiques sur l’apprentissage et le comportement.
Countercontrol : la manipulation délibérée des événements environnementaux pour modifier leur impact sur notre comportement.
• Impact comparable à Freud dans son importance (mais opposé dans les théories)
Début année 80 : apparition psycho cognitive : a réduit de bcp la quantité de gens qui pratiquaient avec le béhaviorisme. Psycho cognitive = + complète comme théorie
• Skinner = moins bien vu par les médias, mais n’a jamais placé des enfants dans sa « boîte de Skinner »
• Faisait des expériences sur les animaux : pour lui les résultats étaient généralisables des animaux aux humains, il n’aurait donc pas fait d’expérience avec un humain.
La boîte de Skinner
o La boite de Skinner n’est qu’une façon pratique de gérer les conditions d’apprentissage
Invente cette boîte puisqu’il remarque un manque de standardisation : il remarque que tout le monde fait ses petites choses et que la standardisation ne semble pas exister.
Il doit y avoir de la standardisation pour pouvoir comparer les recherches.
Skinner décide donc d’utiliser une boîte ou il y aura TOUT.
La boîte est idéale pour les expériences du conditionnement classique ou instrumental : grande contribution méthodologique
La boîte comprend un plancher en métal, avec des trous par exemple : facilite expérimentation et gagne du temps
Avec ses boîtes, Skinner abandonnera l’idée que tous les comportements pouvaient être analysé en termes de réflexes
Il en vient donc à la conclusion que les comportements peuvent être divisés en 2 catégories : 1) les reflexive-type behavior : conditionnement classique et 2) conditionnement opérant
Standardisation définition
uniformisation des outils et des concepts
Thorndike
- Intéressé dans l’intelligence animale
- Découverte de la loi de l’effet à travers son expérience : les comportements qui mènent à une certaine satisfaction sont renforcés et ceux qui mènent à un mécontentement sont affaiblit.
Les situations expérimentales : 2 grandes catégories
1- L’essai discret
2- La situation opérante libre
L’essai discret
des essais particuliers avec un début et une fin qui sont identifiables ; il requière une plus grande implication du chercheur ; plus efficace.
Comme expérience de Thorndike : le chat entre, expérimente et sort.
Le début et la fin sont très claires.
Avantage essai discret
la fin claire permet un apprentissage facile pour l’animal : permet à l’animal de mieux identifier la conséquence
La situation opérante libre
pas d’essai particulier, réponse disponible en tout temps, mais pour période fixée à l’avance ; plus réaliste.
Il y a une situation : on place le rat pendant une période de temps, le rat peut ou peut ne pas faire le nombre de réponse qu’il veut.
La fréquence des réponses est mesurée plutôt que le temps que sa prend pour avoir une réponse.
Le paradigme instrumental
- SITUATION-RÉPONSE-CONSÉQUENCE
- Sd → R → Sr (ou C pour conséquence) (Sr = conséquence, stimulus renforçant)
- Dérivé de la loi de l’effet de Thorndike
- Dans une situation de stimulation (Sd), une réponse (R) est suivie d’un stimulus renforçant (Sr/conséquence).
- Essentiellement : comportements qui sont influencés par leur conséquence
Sd : stimulus discriminatif
- dit au rat “si tu fais cette réponse, tu vas avoir cette conséquence”
Stimulus qui indique automatiquement quelque chose.
Signal qui indique qu’une réponse va être suivie d’un renforcement
“Set the occasion for” : indique simplement que la conséquence est maintenant disponible
Sdp
stimulus discriminatoire pour la punition : exemple → le chat va apprendre à ne pas miauler quand il voit une bouteille d’eau
Striangle
stimulus discriminatoire pour l’extinction : le stimulus signale l’absence de renforcement (cloche : prese levier : pas de nourriture. Cloche = donc absence de nourriture)
Comparaison conditionnement classique et instrumental
• Classique
- RC est automatique
- RC prépare pour la RI
- S’apprend par la contingence
Animal réagissait au stimulus : la réponse était essentiellement un réflexe. On présentait le stimulus et on avait un réponse qui suivait automatiquement.
La réponse ne cause pas de conséquence (salivation n’amène pas nourriture)
• Instrumental
- R est émise
- R nous amène à Sr
- S’apprend par la contingence
La réponse de l’animal est volontaire, ce n’est plus automatique, ce n’est plus un réflexe.
La réponse cause une conséquence : elle produit un effet
Similitudes avec le conditionnement classique
- Loi de la pratique
- Loi de l’intensité des stimuli (+ grosse récompense, par exemple)
- Extinction (ne pas renforcer un comportement qui l’a été auparavant → processus beaucoup plus doux que la punition et beaucoup plus lent) et récupération spontanée (sur conditionnement et sur extinction aussi)
- Importance de la contiguïté (si pas assez de contiguïté : on n’associera pas, si on puni longtemps après : ça ne fonctionnera pas non plus)
- Importance de la contingence
- Blocage et masquage
- Généralisation et discrimination
Type de contingence : conditionnement classique
lien statistique entre les 2 stimulus
Type de contingence : conditionnement opérant
lien entre comportement (réponse) et conséquence
Renforcement
Toute situation Sd-R-C dans laquelle l’effet de C sur R est d’augmenter la probabilité de la réponse R.
Conséquence n’est pas nécessairement agréable : mais elle augmente la réponse (masochiste, par exemple)
Renforcement immédiat VS retardé
le renforcement immédiat a un meilleur impact que le renforcement retardé
Renforcement primaire
le stimulus a l’habileté inné de renforcer le comportement : l’efficacité peut être liée à un état de privation
Renforcement secondaire
le stimulus est renforçant puisqu’il a été associé à quelque chose qui était renforçant (un événement peut être à la fois un renforcement primaire et secondaire (souper de noël par exmeple)
Renforcement intrinsèque
renforcement qui provient simplement de faire la chose : on fait quelque chose puisque c’est intrinsèquement agréable : motivation intrinsèque