cours 4 CO Flashcards

1
Q

comment peut on aussi appelé le Conditionnement opérant

A

apprentissage instrumental

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

que vise le conditionnement opérant

A

vise à
contrôler le comportement (la réponse à un stimulus ou à des
stimuli) par ses conséquences, c’est-à-dire par ce qui suit le
comportement (la réponse) dans le temps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

quest ce que le conditionnement opérant

A

Le comportement est suivi d’une conséquence de façon à en modifier son niveau opérant, soit augmenter ou diminuer sa fréquence d’apparition.

Il est possible de modifier le comportement d’un organisme en
utilisant des conséquences plaisantes (appétitives) ou
déplaisantes (aversives)

 L’apprentissage instrumental est une modification de la probabilité
de réapparition d’une réponse, modification entraînée par
l’apparition ou le retrait d’un événement particulier, le
renforçateur, de façon contingente à la réponse

On dit de l’apprentissage qu’il est instrumental, parce que l’effet
est obtenu à partir du comportement, soit l’instrument

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

pourquoi dit on que les superstitions sont construit du CO

A

résultent d’un renforcement ou d’une punition qui peut découler d’une simple coïncidence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

nomme des exemples de CO

A

la cage de thorndike
la boite de skinner

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

quest ce que la cage de Thorndike

A
  • Enfermer un chat affamé dans
    une cage (boîte à problème)
  • Placer de la nourriture à proximité
  • Observer les comportements du chat et le temps qu’il utilise
    pour trouver la solution et sortir de la cage
  • Ces observations permettent de comprendre comment s’opère l’apprentissage
  1. Apprentissage par essais et erreurs
  2. La solution est trouvée par hasard
  3. D’un essai à l’autre, diminution progressive des réactions inutiles
  4. En fin d’apprentissage, le chat ouvre immédiatement le loquet

Le temps utilisé pour trouver la solution diminue d’un essai à l’autre
Il obtient le même résultat (la même courbe d’apprentissage) d’un animal à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

comment nomme t-on le concept décrit par ceci: Les comportements sont acquis en fonction de leur effet dans
l’environnement

A

la loi des effets de Thorndike

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

quest ce que la loi des effets

A

 Un comportement qui produit une conséquence agréable ou qui
élimine ou prévient une conséquence désagréable aura tendance à se répéter.
 Un comportement qui produit une conséquence désagréable ou qui prévient (élimine) une conséquence agréable aura tendance à disparaître.

Éléments de base:
S:R –> C
Les comportements sont acquis en fonction de leur effet dans l’environnement

Pour Thorndike, l’apprentissage est un processus associatif caractérisé par la formation de connexions entre deux éléments en contiguïté spatiale :
- Ces connexions sont fixées, renforcées par la répétition (ou affaiblies si les essais sont supprimés)
- Ces connexions sont renforcées ou affaiblies par l’effet des conséquences (positive ou négative)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

quest ce qu’un renforcateur

A

c’est la conséquence
c’est un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action.
- Le renforçateur peut être de nature appétitive ou aversive.

  • La relation de nécessité entre la réponse et la conséquence est appelée contingence. Le renforcement est un type particulier de contingence.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

quest ce que la contingence

A

Renvoie à la relation séquentielle de dépendance entre deux événements.
Dans le cas du CO, la contingence spécifie les conditions sous
lesquelles un comportement entraîne une conséquence donnée.

Association en contingence d’un comportement et d’un stimulus qui entraîne une modification du comportement.

Un comportement est suivi d’un événement.

4 types déterminés par la nature du stimulus-conséquence
(appétitif ou aversif) et par l’effet du comportement sur le stimulus-conséquence (apparition ou disparition du stimulus-conséquence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

quels sont les types de contigence

A

récompense (renforcement positif) > ajouter effet positif

échappement / évitement (renforcement négatif) > retirer effet négatif

punition (punition positive) > ajouter effet négatif

omission (punition négative) > retirer effet positif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

quest ce que la punition

A

Opération qui consiste à ajouter ou retrancher un stimulus
comme conséquence à un comportement, tout en visant à
diminuer la probabilité que ce comportement apparaisse à
nouveau en des circonstances similaires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quest ce que le renforcement

A

vise à augmenter ou à maintenir élevée la
probabilité qu’un comportement apparaisse de nouveau en des
circonstances similaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quest ce que le renforcement positif

A

Augmentation de la
probabilité de
réapparition du
comportement
en ajoutant un élément

le comportement est suivi de
l’apparition (addition) d’un stimulus appétitif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quest ce que le renforcement négatif

A

Augmentation de la
probabilité de
réapparition du
comportement
en enlevant un élément

le comportement est suivi de la disparition (soustraction) d’un stimulus aversif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

qu’est ce que la punition positive

A

Diminution de la
probabilité de
réapparition du
comportement en ajoutant un élément

le comportement est suivi de l’apparition
d’un stimulus aversif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

qu’est ce que la punition négative

A

Diminution de la
probabilité de
réapparition du
comportement
en enlevant un élément

le comportement est suivi de la disparition (soustraction) d’un stimulus appétitif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

quels sont les différents points de vue pour l’analyse des types d’apprentissages

A

les types d’entrainement
la nature de la contingence
les effets comportementaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

quels sont les types d’entrainement pour l’analyse de l’apprentissage

A

récompense
échappement / évitement
punition
omission

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

quels sont les différentes nature de la contingence

A

Renforcement positif
Renforcement négatif
Punition positive
Punition négative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

quels sont les différents effets sur les comportements

A

Augmentation
Augmentation
Diminution
Diminution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

diapo 33

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

conditionnement opérant VS classique

A

Classique : la relation s’établit entre un SN et un SI. Le comportement du sujet n’a aucun effet sur l’apparition des stimuli.

Opérant : la relation s’établit entre une réponse et sa
conséquence. Le comportement détermine une conséquence, c’est-à-dire l’apparition ou la disparition du renforçateur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

quels sont les différentes situations d’apprentissage instrumental

A

Situations à essais discrets :
- Labyrinthes, boîtes d’évitement, etc.
- Le début et la fin des essais sont faciles à identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance.

Situations à essais continus :
- Situations opérantes libres (boîte de Skinner)
- Le début et la fin des essais ne sont pas clairement identifiés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

quest ce que le faconnement diapo 36 à 40

A

Cette procédure consiste à renforcer des approximations
successives du comportement. À la toute fin, seul le comportement désiré sera renforcé.
(Ex.: Enfant : entraînement à la continence).

Le façonnement est généralement utilisé lorsque des réponses complexes doivent être apprises ou lorsque les réponses ne font pas partie du répertoire comportemental de l’organisme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

quest ce que le stimulus discriminatif (SD)

A

contexte
Dans une situation d’apprentissage instrumental, il
peut y avoir d’autres stimuli que le stimulus
renforçateur.

Le stimulus discriminatif signale à l’animal une
occasion de répondre.

La réponse est déclenchée en présence d’un
stimulus particulier. Le sujet discrimine, ou fait la
différence, entre un stimulus et un autre

29
Q

exemple de SD

A

Lorsqu’une lumière est allumée, un pigeon sera renforcé
par de la nourriture lorsqu’il picore sur un disque. En
circulation, les panneaux indicateurs sont des stimuli
discriminatifs.

30
Q

nomme des types de renfocateur

A

renforcateur primaire
renforcateur secondaire

31
Q

quest ce que le renforcateur primaire

A

Ne nécessite aucun entraînement préalable :
- Les renforçateurs biologiquement importants : nourriture,
eau, sexe, attention, approbation, décharge électrique

Les renforçateurs sensoriels ont une valeur
renforçante uniquement à cause de la simple
stimulation des organes sensoriels

 L’autostimulation cérébrale

32
Q

quest ce que les renforçateurs secondaires

A

Stimulus qui entraîne une satisfaction n’ayant pas de valeur biologique intrinsèque

  • Les renforçateurs secondaires acquièrent des propriétés renforçantes à la suite de pairages successifs avec un renforçateur primaire: argent, biens matériels, économie de
    jetons.
  • Caractéristiques de renforçateurs secondaires ou conditionnés
     La prévisibilité
33
Q

quest ce que le principe de Premack

A

Une réponse à forte probabilité naturelle d’apparition peut
renforcer une réponse dont la probabilité d’apparition est plus faible.

34
Q

exemple du principe de Premack

A

Faire ses devoirs pour aller jouer avec ses amis

  • Réponse cible « faire ses devoirs » = faible probabilité
    d’apparition naturelle
  • Le renforçateur « jouer avec ses amis » est par contre un comportement dont la probabilité naturelle est très élevée
  • En rendant ce second comportement contingent au premier,
    les parents visent à augmenter la probabilité de la première
    réponse
35
Q

fini la phrase:
la valeur du renforçateur (appétitif et aversif) et la force du conditionnement sont reliées à …

A

la quantité et la qualité
plus grande est la récompense, plus fort sera le renforcement

36
Q

quest ce que l’effet de contraste

A

La valeur d’un renforçateur n’est pas absolue. L’effet
renforçant devient plus prononcé lorsque le renforçateur
peut être comparé avec une autre quantité du
renforçateur. Le comportement peut être amplifié ou
diminué à la suite d’une telle comparaison.
diapo 47

37
Q

quest ce que la relation réponse- conséquence

A
  • La contiguïté temporelle :
    Le délai de renforcement/punition : Un délai court permet
    généralement un meilleur apprentissage parce qu’il diminue la probabilité qu’il y ait interférence entre d’autres réponses et le
    renforçateur
  • La contingence réponse-conséquence :
    La contingence est aussi importante qu’en conditionnement classique. Tout le conditionnement instrumental repose sur la
    corrélation entre la réponse et la conséquence. Si aucune
    relation n’existe, il n’y aura aucun apprentissage.
    *L’absence de relation de contingence entre le comportement
    et ses conséquences produit le phénomène de résignation
    acquise (impuissance acquise).
38
Q

quest ce que l’acquisition

A

L’acquisition peut mener à une modification du comportement à la hausse ou à la baisse, mais il s’agit d’apprendre une nouvelle contingence qui n’était pas en fonction auparavant.

39
Q

quest ce que l’extinction

A

L’extinction consiste à cesser de renforcer une réponse. Il faut donc qu’il y ait eu établissement d’une contingence auparavant
pour qu’il puisse y avoir extinction.

L’extinction est susceptible d’être suivie d’une
récupération spontanée.

40
Q

quest ce que la récupération spontanée

A

L’extinction est susceptible d’être suivie d’une
récupération spontanée.

Récupération spontanée : réapparition d’une réponse
éteinte, à la suite d’une période de repos consécutive à l’extinction.

41
Q

quest ce que l’impuissance acquise

A

???????????????????

42
Q

quest ce qui a donné naissance à l’impuissance acquise et explique le moi

A

Expérience avec les chiens et les rats

  • Décharges électriques occasionnelles sur le plancher de la cage
  • Apprentissage de l’animal : presser un levier pour empêcher les chocs ou changer de compartiment pour circuler librement
  • L’animal demeure donc fonctionnel
43
Q

quest ce que le renforcement continu

A

Chaque fois que le comportement est adopté. Chaque réponse
est renforcée ou punie. Plus rapide.

44
Q

quest ce que le renforcement partiel ou intermmittent

A

Le comportement n’est pas renforcé chaque fois qu’il apparaît.
Seulement un certain nombre de réponses sont renforcées ou punies. Plus « efficace » et plus résistant à l’extinction.

45
Q

quels sont les façons de renforcer partiellement le comportement

A

programmes à intervalles fixes
progr. à intervalles variables
progr. à rapport fixe
progr. à rapport variable

46
Q

quest ce que le programme à intervalle fixe

A

Le renforcement survient après la première réponse émise après un intervalle de temps fixe.

47
Q

quest ce que le programme à intervalle variable

A

le renforcement survient après la première réponse émise après un intervalle de temps moyen
ex: contravention

48
Q

quest ce que le programme à rapport fixe

A

Le renforcement survient après un nombre fixe de réponses

carte fidélité

49
Q

quest ce que le programme à rapport variable

A

Le renforcement survient après un nombre variable de réponses
ex: casino

50
Q

quels sont les programmes de renforcement simples

A

programme à durée (fixe et variable)

programme de débit de réponse :
- renforcement différentiel du débit rapide (RDDR)
- renforcement différentiel du débit lent (RDDL)
- renforcement différentiel de réponses rythmée (RDRR)

programmes non contingents
- programme à temps fixes
- programme à temps variable

51
Q

quest ce que le programme à durée fixe

A

renforcement si comportement
exécuté en continu durant une période « X » prévisible et fixe
 Ex. : pouvoir écouter la TV 1 h si 2 h d’études (DF2)

52
Q

quest ce que le programme à durée variable

A

renforcement si
comportement exécuté en continu durant une période
imprévisible et variable
 Ex. : donner un biscuit à des moments variés (pour une moyenne d’un biscuit aux 30 minutes) (DV30) à un jeune qui doit étudier

53
Q

quest ce que le renforcement différentiel du débit rapide

A

fait partie du programme de débit de réponse

renforcement est fonction d’un certain nombre de réponses
durant un certain délai de temps.
 Ex. : participant récompensé si 20 hot-dogs / 1 minute

54
Q

quest ce que le renforcement différentiel du débit lent

A

fait parti du programme de débit de réponse

durée de temps minimal nécessaire (débit lent)
 Ex. : se brosser lentement les dents

55
Q

quest ce que le renforcement différentiel de réponse rythmé

A

fait parti du programme de débit de réponse

débit préétabli (ni trop vite ni trop lent)
 Ex. : course à pied : renforcer un rythme moyen.

56
Q

comment caractérisons les programmes non contingents

A

présence du renforçateur même si aucune réponse

57
Q

quest ce que le programme à temps fixe

A

cest un programe non contingent

renforçateur après une période
« X » prévisible et fixe
 Ex. : cadeau à Noël pour tous, peu importe si gentil (TF1)

58
Q

quest ce que le programme à temps variable

A

programme non contingent

renforçateur après une
période « X » imprévisible et variable, peu importe le
comportement du sujet
 Ex. : rencontrer par hasard un ami d’enfance aux 3 mois

59
Q

quels sont les programmes de renforcement complexes

A

programmes conjonctifs
programmes ajustables
programmes en chaine

60
Q

comment caractérisons les programmes de renforcement complexes

A

 Combinaison d’au moins deux programmes simples

61
Q

comment caractérisons le programme conjonctif

A

exigences d’au moins deux programmes
simples avant la présentation d’un renforçateur.
 Ex. : reçoit un salaire si nb h/sem. travail + réalisation tâches

62
Q

quest ce que le programmeajustable

A

la réponse change en fonction de la
performance du sujet.
 Ex. : exigences plus grandes pour bon élève (avant renforcement
si 80 %, maintenant renforcement si 85 %)

63
Q

quest ce que le programme en chaine

A

2 programmes simples ayant un ordre de
présentation. Chacun a son Sd et le dernier produit un
renforçateur terminal.
 Ex. : Prérequis > 49 % pour un 2e cours pour obtenir diplôme

64
Q

pour etre efficace une punition doit être comment

A

une punition doit être intense, immédiate
(contiguë) et contingente (survenir à chaque réponse).
Une punition intense sensibilise les individus aux punitions
subséquentes.

65
Q

comment la punition peut devenir plus efficace encore

A

si utilisée conjointement avec le renforcement positif des autres comportements désirés.

66
Q

que produit une punition intense

A

sensibilise les individus aux punitions
subséquentes.

67
Q

que produit des avertissement et des punitions peu sévères

A

habituent les
organismes aux punitions subséquentes.