7. Behaviorisme IIa: Le conditionnement opérant I Flashcards

1
Q

Quelle est l’étude d’Edward Thorndike?

A

• Un chat se trouve dans une cage munie d’un levier mécanique qui permet d’ouvrir la porte (la «puzzle box»); à l’extérieur, de la nourriture est placée bien en vue. Les chats n’ont pas une prédisposition pour appuyer sur un levier  ce n’est pas un réflexe. On peut entrainer notre chat pour qu’il appuie sur le levier. Pour changer un comportement ça peut prendre bcp de temps.
• Le chat explore la cage (actif car faim), il sent la nourriture. Par hasard, il trébuche sur le levier, la porte de la cage s’ouvre et le chat a accès à la nourriture.
• Qu’est-ce qui se passe si le chat est remis dans la cage et la porte fermée?
• Le chat devient de plus en plus expert à manipuler le levier et quitte la cage dès que la nourriture
est présentée. Il répète ça de tout le temps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que dit la courbe d’apprentissage concernant l’étude d’Edward Thorndike?

A

Le stimulus en conditionné n’est plus nécessaire car la réaction est conditionné.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la loi de l’effet?

A

C’est la base de notre société : prq on travaille, prq on ne fait pas de bêtises, etc.
C’est la tendance d’un animal à reproduire un comportement dépend des effets de ce comportement sur l’environnement et de l’impact de ces effets sur l’animal, càd le comportement est donc une fonction de ses conséquences. Ex : on peut présenter qch qui va rendre la répétition moins probable (punition), ou alors présenter qch qui va rendre la répétition plus probable (récompense). La punition marche mal dans l’apprentissage, c’est mieux d’utiliser la récompense.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qui a proposé la loi de l’effet?

A

THORNDIKE sur la base de ses observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi THORNDIKE a nommé le processus d’apprentissage un conditionnement instrumental?

A

Parce que le comportement avait un caractère instrumental dans l’accomplissement d’un but – la satisfaction (p.ex. obtenir de la nourriture).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’a fait Skinner?

A

SKINNER a systématisé la façon dont le comportement est contrôlé par l’environnement selon la « loi de l’effet » sur la base de ses nombreuses expériences

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’une position behavioriste radicale?

A

On explique le comportement sans aucun concepts mentaux

C’était la position de Skinner, il ne s’intéressait qu’aux choses observables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Skinner introduit le terme conditionnement opérant, qu’est-ce que cela signifie?

A

Que le comportement opère sur l’environnement afin de produire une conséquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que les opérants?

A

Des comportements émis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les trois suppositions fondamentales de Skinner?

A
  1. Les animaux sont très fréquemment actifs (si pas actif, on ne pourrait pas changer un comportement) – par conséquent les organismes manifestent des comportements d’une manière continue
  2. Les conséquences des comportements influencent la probabilité avec laquelle ces comportements seront répétés à l’avenir ou pas répétés.
  3. L’état motivationnel de l’organisme et son environnement physique et social influencent l’efficacité de ces conséquences.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est l’idée principale du conditionnement opérant?

A

Tout le comportement est déterminé par ses comportements selon la loi de l’effet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment marche le conditionnement opérant?

A

Lors du conditionnement opérant, le comportement précède l’événement environnemental qui produit le futur comportement. Il n’y a pas de projection dans le futur, le chat ne réfléchit, il bouge le levier et ça bouge. Il va refaire et voir que ça bouge, alors il va le faire. Il le fait par hasard, il n’y a pas de réflexion. Il a crée une machine pour faire le comportement des chats et aussi pour les bb (la baby boxe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelles sont les deux types de conséquences du conditionnement opérant?

A
  • Le renforcement

- La punition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que fait le renforcement?

A

Il augmente la probabilité d’une réaction se produise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la punition et que fait elle?

A

C’est une conséquence environnementale d’un comportement qui diminue la probabilité d’une réponse (R).
Elle diminue la probabilité qu’une réaction se produise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est l’idée de Skinner?

A

Skinner est sûr qu’une société libre n’est pas une bonne idée. Le comportement est déterminé par les processus pour lui. Il refusait qu’on laisse les gens décider de comment éduquer les enfants. Pour lui, il faut des spécialistes. Il s’est déguisé en philosophe et a parlé d’un endroit où les enfants sont éduqués par des professionnels qui n’ont pas d’attache alors les enfants seront bien éduqués. Il était têtu, il a postulé cette idée.

17
Q

Qu’est-ce que Skinner a construit?

A

La skinner box

18
Q

Qu’est-ce qu’un renforçateur?

A

C’est une conséquence environnementale qui se produit après la réaction d’un organisme et qui rend la réapparition de cette réponse ( R ) plus probable.

19
Q

Qu’est-ce qu’un renforçateur positive?

A

C’est le processus par lequel la présentation d’un stimulus après un comportement augmente la probabilité que ce comportement se produise à nouveau.

20
Q

Qu’est-ce qu’un renforcement négatif?

A

C’est le processus par lequel l’ élimination d’un stimulus après un comportement augmente la probabilité que ce comportement se produise de nouveau.

21
Q

Qu’est-ce que l’apprentissage d’échappement?

A

C’est un renforcement par l’élimination d’un événement aversif (désagréable) déjà existant.

22
Q

Qu’est-ce que l’apprentissage d’évitement?

A

C’est un renforcement par l’élimination d’un événement qui est signalé par avance. (typique phobie)

23
Q

Que se passe-t-il dans une punition positive?

A

Le stimulus aversif est présenté

24
Q

Que se passe-t-il dans une punition négative?

A

Le stimulus agréable est éliminé

25
Q

Quelle sorte de société Skinner voulait?

A

Une société sans criminalité et sans personne avec des troubles psychiques.

26
Q

Qu’est-ce que les contingences dans la théorie de Skinner?

A

Le fait de savoir si en faisant un certain comportement on sera puni ou alors récompensé. Et souvent les enfants et les animaux ne connaissent pas bien les contingences

27
Q

Quel est l’un des problèmes de la punition?

A

La difficulté à distinguer quel opérant a été puni
Exemple: Les « experts », qui appellent plusieurs fois de suite leur chien (ou enfant) et lui crient dessus parce qu’il n’est pas venu tout de suite, punissent le bon comportement – venir après l’appel.

28
Q

D’après Skinner entre l’extinction et la punition positive qu’est-ce qui est le plus efficace?

A

L’extinction, car après l’arrêt de la punition positive, il y a fréquemment une récupération spontanée.

29
Q

Comment se passe l’étude de l’ESTES sur la punition et l’extinction?

A

• D’abord, des rats sont renforcés avec de la nourriture pour appuyer sur un levier. Le rat devient un expert pour ouvrir la cage.
• Puis, on forme deux groupes:
- Punition : Au cours d’une session, des chocs électriques sont émis suite à l’action d’appuyer sur le levier (au lieu de la nourriture)
- Extinction : Au cours d’une session, il n’y a plus de renforcement (pas de récompense).
• Puis on observe les rats au cours de quatre jours d’ extinction.
• Mesure : Fréquence d’appui sur le levier.
• Résultat : La punition réduit le comportement cible (appuyer sur le levier), mais ensuite il y a une récupération spontanée.

30
Q

Que se passe-t-il avec la punition à court terme?

A

Elle peut permettre de pas faire le comportement, mais ensuite le comportement recommence = récupération spontanée.
C’est efficace que qd on a tjrs le contrôle. Alors qd ceux qui n’ont pas eu de punition, il arrête le comportement et graduellement ça va disparaitre. Avec l’extinction, il n’y a pas de récupération spontanée

31
Q

Qu’est-ce que la récupération spontanée?

A

Quand le comportement recommence, mais pour cela il faut toujours le contrôle.

32
Q

Quel est l’autre problème de la punition?

A

L’association de la peur de celui qui apprend avec la personne qui punit (via le conditionnement classique) plutôt qu’avec sa propre activité (via le conditionnement opérant).
Exemple: Si nos parents nous punissent, on va arrêter le comportement qd ils sont là = les parents sont associés à la punition

33
Q

Quand est-ce que la punition est efficace?

A

Quand elle est accompagnée d’un raisonnement et d’un comportement alternatif qui est renforcé.

34
Q

Quelles sont les 3 stratégies pour changer ou éliminer les réactions conditionnées?

A
  • L’extinction
  • La punition
  • Le contre-conditionnement
35
Q

Qu’implique l’extinction?

A

Arrêter de renforcer une réaction

36
Q

Qu’implique la punition?

A

Présenter une conséquence aversive ou éliminer une conséquence agréable du comportement

37
Q

Qu’implique le contre-conditionnement?

A

Renforcer un comportement incompatible

Ex: féliciter un enfant d’être assis afin d’éliminer son habitude à courir partout