Béhaviorisme IIa : Le conditionnement opérant (Partie II) Flashcards

1
Q

Quand se produit l’extinction?

A

Lorsque l’opérant (comportement) n’est plus suivi par la conséquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En quoi consiste le Principle de Premack?

A

Les comportements peuvent fonctionner comme renforçateur (comport. frequent )ou punition (comport. rarement).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est le conditionnement le plus efficace et pourquoi?

A

Le renforcement intermittent car il y plus résistent à l’extinction(mieux pour le mantient du comportement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que c’est -que l’extinction? Parle de Etude de Williams?

A

Extinction - se produit lorsque l’opérant n’est plus suivi par la conséquence qui lui était préalablement associée - Etude de WILLIAMS : petit garçon de 21 mois ayant reçu 24h d’attention lorsqu’il était malade  une fois guéri, enfant a demandé le même niveau d’attention (renforçateur) - nouveau régime de sommeil : parents ferment la porte et refusent de réagir aux pleurs et aux cris qui suivent - Résultats : après 45 mn, garçon s’assoupit puis en moins de 10mn et finalement ne crie plus du tout au bout de la 6ème fois

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quels sont les programmes de renforcement de Skinner?

A

SKINNER : programmes de renforcement - Programme de renforcement continu: chaque réaction correcte est renforcée - Programme de renforcement intermittent (partiel): seules quelques-unes des réactions correctes sont renforcées - Renforcement intermittent est généralement plus efficace en terme de maintien du comportement appris et les comportements maintenus sous renforcement intermittent sont en général plus résistants à l’extinction - Programme à proportion : récompenses sont liées au nombre de réponses émises (ex: réaction correcte sur trois) - Programme à intervalle : récompenses n’apparaissent qu’après un laps de temps (ex: réaction correcte après 5 mn)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que sont les réactions cumulatives ?

A

Les réactions cumulatives - Au cours du conditionnement, les réactions s’accumulent. - Il est possible de mettre en relation le temps passé et le taux de réactions. - Le conditionnement est le plus efficace si beaucoup de réactions avec peu de latence entre-temps sont produites.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les effets cumulatif des programmes de renforcement?

A

Effets cumulatifs des programmes de renforcement - Programme à proportion fixe (fixed-ratio FR): réactions rapides, mais pas durables  récompenses tous les “x” essais (régulier) - Programme à proportion variable (variable-ratio VR): réactions rapides et plus durables. (efficace dans la vitesse d’apprentissage)  récompense pour seulement 10 sur 30 choisies “au hasard” (irrégulier)  peut-être qu’il y aura de nouveau une récompense si je continue - Programme à intervalle fixe (fixed-interval FI): seulement des réactions à la fin de l’intervalle et peu durable (faiblesse d’apprentissage)  délai fixe : examens - Programme à intervalle variable (variable-inteval VI): très efficace pour créer une performance constante et durable  récompenses pour 10 sur 30 mais pas de délai déterminé (=aléatoire) : examens surprises  Il ne faut pas renforcer chaque réaction pour l’apprentissage, il suffit d’en renforcer quelques-unes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les renforçateurs secondaires?

A

Renforçateurs secondaires: stimuli qui ont obtenu la qualité d’un renforçateur par association avec un renforçateur primaire qui satisfait directement un besoin : • Ex: renforçateur primaire: nourriture, douleur • Ex: renforçateur secondaire: argent, critique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

what is the Premack principle?

A

Le “PREMACK principle” Une application dans l’éducation : comportmenets peuvent fonctionner comme renforçateurs et punitions. Procédure selon PREMACK : 1) Observation du comportement d’un individu  détermine probabilité des actions exécutées spontanément  la fréquence du comportement 2) Les actions qui sont exécutées fréquemment peuvent fonctionner comme renforçateur et les actions qui sont exécutées très rarement peuvent fonctionner comme punition.

Ex: renforcement positif  d’abord tu joues au piano, puis tu peux regarder la TV punition négative  si tu arrives trop tard à table, tu n’auras pas de dessert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment fonction l’apprentissage de comportements complexes?

A

Les comportements “complexes” SKINNER : étude systématique des effets des programmes de renforcement sur l’apprentissage (étude avec rats et pigeons dans la “skinner box”) - Apprentissage des comportements complexes : discriminer des stimuli qui signalent renforcement VS non-renforcement – stimuli discriminatifs (SD)  SC +, SC – suite au conditionnement classique  si animal appuie sur le levier lorsque lumière verte  nourriture VS lumière rouge  non  lorsque lumière rouge, n’appuie même plus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que c’est que le shaping?

A

Modification progressive d’un comportement spécifique pour produire une nouvelle réponse. Dans le dressage (“shaping”), on produit un comportement nouveau en renforçant des comportements approximatifs de plus en plus proches de la réponse désirée. Ex: dressage d’un tigre : 1. S’asseoir sur commande, 2. Sauter sur commande, 3. Sauter à tarvers un cerceau, 4. Sauter à travers un cerceau en feu  apprentissage progressif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que c’est que La chaîne (“chaining”)?

A
  • Mise en place d’une séquence de réponses (nouvelles ou existantes) dans un ordre temporel. Ex: rat en train d’apprendre à presser levier (R) après avoir été mis dans une skinner box
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment se passe l’apprentissage de l’échappement et d’évitement dans une “puzzle box”?

A

L’apprentissage de l’échappement et de l’évitement dans une “puzzle box” Puzzle box a 2 sections, dont une avec une grille électrique sur le sol Condition échappement : animal apprend à sauter par dessus la barrière lorsque l’électricité est allumée  réponse apprise stoppe le stimulus aversif Condition évitement : animal apprend à sauter la barrière lorsqu’il entend un son juste avant que l’électricité soit allumée  réponse apprise empêche le stimulus aversif de se produire en premier  prévoyance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quels sont les spécifications pour des intervals de temps? => Rythme définit par la reaction => Rythme définit par le temps

A

Des spécifications Dans les programmes fixes et variables, le même taux de renforcement est présenté, mais d’après des règles différentes : - FR–5 proportion fixe : chaque 5ème réaction est renforcée  renforcement à proportion constante, rythme clair - VR–5 proportion variable : en moyenne chaque 5ème réaction est renforcée  récompense pour un pourcentage de réponses mais nombre de réactions nécessaires avant renforcement est imprévisible, rythme pas clair (ex: 4e, 7e, 13e, 20e réponses = 1/5 moyenne)  Rythme définit par la réaction - FI–5 intervalle fixe : première réaction exécutée après un délai de 5mn est renforcée (avant 5mn non) - VI–5 intervalle variable : renforcements après des intervalles de temps variables, mais en moyenne toutes les 5mn (ex: 2mn, 5mn, 6mn, 20mn = moyenne 5mn)  Rythme définit par le temps On peut combiner les programmes. (ex: commencer par proportion fixe pour acquisition rapide et continuer avec intervalle variable pour maintenir le comportement  beaucoup de compliments puis seulement de temps en temps  continue à s’habiller bien pour essayer de plaire tout le temps et d’avoir ds compliments)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que c’est qu’une contingence?

A
  • Contingence: Une relation entre un comportement (R) est une conséquence (SR) dans une certaine situation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle pourrais être la relation entre le comportement supertitieux, les contingences et les renforçateurs?

A

Contingences et renforçateurs - Contingence: Une relation entre un comportement (R) est une conséquence (SR) dans une certaine situation - Conséquence : comportement superstitieux (SKINNER): Renforçateur (nourriture) donné à intervalles régulières sans rapport avec le comportement que les pigeons produisaient Résultats : chaque pigeon développait sa propre réponse idiosyncrasique ( tourner une horloge, agiter la tête comme pour activer un levier)  association par erreur d’un opérant avec un événement environnemental - Besoin de contrôle  accepte mal le hasard  volonté de trouver une explication même si c’est sans rapport avec le comportement émis. - Renforçateurs secondaires: stimuli qui ont obtenu la qualité d’un renforçateur par association avec un renforçateur primaire qui satisfait directement un besoin : • Ex: renforçateur primaire: nourriture, douleur • Ex: renforçateur secondaire: argent, critique

17
Q

Que c’est qui dit Mowrer par rapport aux vécus émotionnels comme renforçateurs?

A

MOWRER : les vécus émotionnels comme renforçateurs

Généralisation de la théorie : émotions sont les guides primaires du comportement ® émotions motivent le comportement

  • Les vécus émotionnels conditionnés fonctionnent comme renforçateurs et punitions.

Ex: - si un SC– signale qu’il n’y a pas de récompense, c’est la déception qui réduit la probabilité du comportement instrumental (punition négative)

  • si un SC + signale qu’on obtient une punition, c’est la peur qui augmente la probabilité d’évitement (punition positive)
  • si un SC– signale qu’il n’y a pas de punition, c’est le soulagement qui renforce l’évitement (renforcement négatif)
18
Q

Que c’est qui dit MOWRER par rapport au apprentissage à 2 processus?

A

MOWRER : apprentissage à 2 processus

Explication pour l’apprentissage d’évitement qui est un phénomène de l’apprentissage discriminatif ® organisme apprend à réagir à un signal pour éviter des conséquences aversives.

Deux processus:

  1. Conditionnement classique (“sign learning”): association d’un SC (ex: un son) avec un SI (ex: choc électrique).
  2. Conditionnement instrumental (“solution learning”): apprendre qu’un comportement spécifique va terminer une stimulation aversive ® renforcement négatif

En conséquence d’un conditionnement classique, un stimulus conditionné positif (SC +) signale qu’il y a une conséquence aversive (le SI) ou un stimulus conditionné négatif (SC–) signale qu’il n’y a pas de conséquence

19
Q
A