Cours 5 Conditionnement Opérant Flashcards

1
Q

Rappel du béhaviorisme
3 items clé

A

1) Emphase sur l’apprentissage et rejet de l’inné
Pour Skinner:
¡ Ton savoir = résultat de l’expérience
¡ Pas de nature humaine, nous sommes infiniment malléables (*Watson)

2) Anti-mentalisme
¡ Pas scientifique: Désirs, souhaits, buts, croyances, émotions
¡ Scientifique (qu’on peut observer): Stimulus, réponse, caractéristiques de l’environnement

3) Il n’y a pas de différence à travers les espèces

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Conditionnement classique VS conditionnement opérant

A

Stimuli avec l’environnement =Conditionnement classique (cloche/nourriture)

Nos propres comportements en lien avec des événements importants (récompense, punition) = Conditionnement opérant

Ex: (je fais une blague = personne rit = je vais plus le faire) conséquence environnementale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Conditionnement opérant (CO)

A

Déf: Apprendre la relation entre des actions et des récompenses/punitions
• C’est également l’effet des conséquences du comportement sur ledit comportement (l’augmente/le diminue)
• Comportement opérant : comportement influencé par ses conséquences

Le monde autour de toi décide qui tu es

Ca sert à quoi?
Lesquelles de vos actions mènent à des résultats positifs et lesquelles ne mènent pas à des résultats positifs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qui est-ce qui a développé et établit le CO?

A

Thorndike : a établi les fondements théoriques du CO c’est lui qui a développé

Skinner : n’a pas conçu l’idée du CO (ce n’est pas son idée, il l’a développé)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Programme de recherche théorique et expérimental :

A

Skinner qui développe le CO

Jusqu’à quel point le conditionnement opérant peut façonner le comportement des humains et des animaux ? on mélange les deux conditionnements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La loi de l’effet de Thorndike

A

1ères études expérimentales du CO

«Il ne faut pas prendre pour acquis que ce sont des motifs intelligents qui sous-tendent le comportement des animaux»

Les capacités intellectuelles des animaux ne peuvent être adéquatement évaluées qu’au moyen d’une étude systématique (observation vigoureuse).

Boîte problème de Thorndike
Tu mets le chat dans la boite et tu attends
Diminution, au fil des essais, du temps nécessaire pour que le chat réussisse à sortir de la boîte.
=
Le renforcement graduel de l’action de peser sur la pédale, affaiblissement de l’erreur
Amélioration du temps entre la première fois et la 10em fois

La loi de l’effet :
Un comportement donnant lieu à un résultat satisfaisant est renforcé ou «imprimé», tandis qu’un comportement qui entraine un résultat insatisfaisant ou «irritant» se trouve affaibli ou «jugulé».

L’ampleur de l’irritation ou de la satisfaction issue des conséquences d’un comportement détermine si celui-ci se répétera.
Bref: Le sentiment est ce qui nous pousse à faire l’action ou non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La sélection par les conséquences de Skinner

A

Skinner a étendu les principes du CO et l’a vraiment développé

L’expérience du rat dans la boite
1) Il a réalisé les répercussions de ce principe dans la compréhension et la modification du comportement.
2) Standardisation des recherches : milieu bien contrôlé

Boîte de Skinner (procédure opérante libre)
- Procédure opérante libre : pas d’essai particulier, réponse disponible en tout temps. La boite en est un exemple (CO)

  • L’essai discret : des essais particuliers avec un début et une fin qui sont identifiables et qui requiert donc une plus grande implication du chercheur. Pas essai discret ici, plus l’expérience de Pavlov (CC)

Problème avec la boite: on ne peut pas tout faire avec l’instrument, petite boite donc pas d’orientation spatiale, seulement un rat donc pas de social. Seulement choc électrique ou nourriture.

Skinner reformule l’effet de Thorndike qu’il qualifie de mentaliste (conséquences= satisfaisantes ou irritantes) en affirmant que la probabilité future d’un comportement est influencée par les conséquences de celui-ci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La différence entre le CC vs CO (prise 2)

A

La nature de la réponse

CC: la réponse existe déjà et est une réponse prédéterminée (ex. saliver). C’est juste le stimulus qui est nouveau.
¡ Comportement involontaire

CO: la réponse est quelque chose que l’animal ne faisait pas avant. (ex. appuyer sur un levier)
¡ + volontaires et régis par leurs conséquences (plutôt que par les stimuli qui les précèdent) le rat décide de peser sur la pédale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

C’est un type d’apprentissage se caractérisant par le fait suivant :

A

la probabilité future d’un comportement est influencée par les conséquences de celui-ci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

CO est le regroupement de 3 éléments :

A

1) Une réponse (R comportement)

2) Une conséquence (R (renforcement) et P (punition))

3) Un stimulus discriminatif (précède la réponse) SD (as-tu accès à la récompense ou non, est-ce que je dois faire le comportement afin de recevoir une réponse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

1) Le comportement opérant (la réponse)

A

C’est une classe de réponses produites qui engendrent certaines conséquences

Ces conséquences influencent la probabilité ou la force future de ces réponses.

Réponse opérante ou un opérant (= le comportement) -> conséquences -> probabilité de reproduire la réponse (ou force)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

2) Les conséquences opérantes : le renforçateur et le punisseur

A

Ce qui va augmenter ou diminuer le comportement
Ont lieu après le comportement :

Renforçateur (SR): stimulus renforçateur
¡ Conséquence qui renforce un comportement
¡ La probabilité future de ce comportement s’accroit (ex. appuyer sur le levier)

Appuyer sur l’évier (Réponse opérante) = nourriture (Stimulus renforçateur)

Punisseur (SP): stimulus punisseur
¡ Conséquence qui affaiblit un comportement
¡ La probabilité future de ce comportement s’amoindrit (ex. raconter une blague)

Raconter une blague (R) = on fronce les sourcils (Sp) (négatif)

Un renforçateur pour moi n’est pas nécessairement du renforcement chez l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Renforçateurs/Punisseurs VS Renforcement/Punition

A

Renforçateurs/Punisseurs=
les conséquences précises (du comportement) qui servent à accroitre ou affaiblir un comportement
Ex. La nourriture

Renforcement/Punition=
procédure qui fait en sorte qu’une certaine conséquence modifie la force d’un comportement.

Ex. Utiliser de la nourriture pour accroitre la force de l’action d’appuyer sur un levier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Extinction:

A

l’affaiblissement d’un comportement par abandon de son renforcement. (+ doux, mais + lent que la punition)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  1. Les antécédents opérants : le stimulus discriminatif
A

Lorsqu’un comportement est constamment renforcé ou puni en présence de certains stimuli = ceux-ci vont commencer à influencer l’apparition du comportement.

Ex. appuyer sur un levier ne procure de la nourriture que lorsqu’une tonalité est audible
Tonalité (Sd) : levier (R) = nourriture (Sr)

SD: stimulus en présence duquel une réponse se trouve renforcée et en l’absence duquel elle ne l’est pas.
¡ C’est un signal qui indique qu’une réponse sera suivie d’un renforçateur.

Suzanne (Sd) : raconte une blague (R) = elle rit (Sr)

C’est un signal, Suzanne rit (signal) = elle me trouve drôle

L’intensité du comportement est différente, et ne déclenche pas lui-même le comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

ECC ou ABC (en anglais)

A
  • Événement antécédent (Antecedent event)
  • Comportment (Behavior)
  • Conséquence (Consequence)

Tonalité (Sd) : levier (R) = nourriture (Sr)
E C C
Suzanne (Sd) : raconte une blague (R) = elle rit (Sr)

17
Q

Les sortes de stimulus discriminatif

A

SDp: Un stimulus qui signale qu’une réponse sera punie
Ex: voiture de police quand je fais de la vitesse

SD= stimulus discriminatif signalant le renforcement
Ex: la tonalité ou Suzanne

Striangle= stimulus discriminatif signalant l’extinction
(signale l’absence de renforcement).
Ex: coup de sifflet qui signalerait la fin de l’expérience donc pas de nourriture

18
Q

Faut-il considérer la tonalité comme SD ou un SN (SC) (cc)

A

Les deux processus ne sont pas contradictoires. Ils peuvent se chevaucher

19
Q

Généralement, pour établir s’il s’agit d’un CC ou CO, le + important consiste à déterminer si …

A

le comportement est surtout fonction de ce qui le précède (CC) ou de ce qui pourrait le suivre (CO).

20
Q

4 contingences

A

Renforcement: augmente le comportement
+ : AJOUTER qqchose de plaisant
- : SUPPRIME qqchose de déplaisant

Punition: Diminue le comportement
+ : AJOUTE qqchose de déplaisant
- : SUPPRIME qqchose de plaisant

21
Q

Les effets nocifs de la punition positive

A

Façon la plus directe et la plus rapide pour contrôler le comportement, MAIS…effets nocifs:

Intensification de l’agressivité chez celui qui administre la punition. (Habitue à l’agressivité, devient de plus en plus agressif)

Agressivité passive (ex. «oublier de faire des choses») (la personne peut bouder, niaiser, ne pas être efficacité, l’enfant apprend par observation que l’agressivité est ce qui est efficace)

Comportement d’évitement de la punition (j’ai été punis parce qu’ils m’ont découvert. Je vais éviter et dire des mensonges. Ce n’est pas ce que j’ai fait qui est mal, mais que je me suis fait pogner)

22
Q

Il existe plusieurs distinctions pour le renforcement positif

A

Le renforcement immédiat et le renforcement différé
Renforçateur : Présenté immédiatement après la manifestation d’un comportement VS après un certain délais
+ le renforçateur est immédiat, + son effet sur le comportement est prononcé

Faible effet d’un renforçateur différé sur un comportement
!!! Humains : renforçateurs différés régis par des règles (compense)
Ex. Si je rédige ce travail ce soir, je vais sans doute avoir une bonne note la semaine prochaine. **pas jeunes enfants (un enfant ne voit pas plus loin dans le temps)

Le renforcement différé s’avère habituellement beaucoup moins fort que le renforcement immédiat

Le renforçateur primaire et le renforçateur secondaire
Renforçateur primaire (ou inconditionnel): c’est un événement renforçant en soi.
Ex. nourriture, eau, température adéquate, contacts sexuels
Efficacité liée à l’était de déprivation (ex. soif, rassasié)
Pas efficace si je n’ai pas faim

Renforçateur secondaire (ou conditionnel): c’est un événement ayant un effet renforçant parce qu’il a été associé à un autre renforçateur.
Ex. de bonnes notes sont associées à des compliments; idem pour des beaux vêtements ou une belle voiture.
Ex. Un SC qui a été associé à un SI appétitif

¡ Renforçateur généralisé (ou renforçateur secondaire généralisé): renforçateur secondaire ayant été associé à plusieurs autres renforçateurs.
¡ Ex. Argent

Le renforcement intrinsèque et extrinsèque
Renforcement intrinsèque : découle de l’exécution même du comportement (c.-à-d., que le comportement lui-même a en effet renforçant).

Renforcement extrinsèque : découle d’une conséquence extérieure au comportement (soit un renforçateur extrinsèque).

Souvent il y a une part intrinsèque et une part extrinsèque à un comportement. Par exemple vous lisez un chapitre d’un manuel de cours obligatoire en partie parce que ce comportement satisfait votre curiosité (est renforçant en soi) et aussi pour obtenir une bonne note.

23
Q

Le façonnement

A

réfère à la production graduelle d’un nouveau comportement opérant au moyen du renforcement d’approximations successives de ce comportement.

Ex. apprendre à un rat à pressier sur un levier pour obtenir de la nourriture :
1) Lui donner un peu de nourriture dès qu’il se tient près du levier
2) Lui donner de la nourriture juste quand il fait face au levier,
3) Puis seulement lorsqu’il touche le levier
4) Et finalement seulement lorsqu’il presse le levier.

Le façonnement implique donc l’apprentissage par une succession d’étapes vers le comportement cible