Cours 7 Flashcards

1
Q

Cest quoi un renforcement continu et un renforcement
partiel?

A

Le renforcement continu : chaque réponse appropriée est suivi d’un renforcement
Ex: 100% de chance que l’évier donne nourriture

Le renforcement partiel : chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement
Ex: 50% des chances que l’évier donne nourriture

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi une conséquence du renforcement continue?

A

La réponse est vite acquise, mais elle est vite perdu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

C’est quoi l’effet du renforcement partiel?

A

Ralentissement de la courbe d’apprentissage, car pas toute les réponse sont renforcées

Résistance à l’extinction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qui expliques ces effets du renforcement partiel?

A

Discrimination difficile
- Vue que pas toute les réponses sont récompensée il ne comprend pas nécessairement et donc,vue qu’il a faim il va continuer à appuyer sur le levier

Frustration
- Ce qui amène les gens à continuer, mais va finir par abandonner
Ex: rentre dans ascenseur porte ferme pas, va rester car frustrer (va me pousser à persister), mais va finir pas abandonner

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

C’est quoi les plans de renforcement simple?

A

Plan à ratio : il est basé sur
le nombre de réponses. Pour que la conséquence ce produit, il faut faire un nombre de réponses
– ratio fixe (FR)
– ratio variable (VR)

Plan à intervalle : il est
basé sur le délai depuis le
dernier renforcement. C’est le moment où on fait la réponse
– intervalle fixe (FI)
– intervalle variable (VI)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est la définition de ratio?

A

L’obtention du renforcement est
conditionnel à la production d’un nombre déterminé de réponses répétitives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pour le pans a ratio fixe, que veut dire fixe? Donner un exemple de ration fixe et un comportement observer

A

Fixe : le nombre de réponses
nécessaires ne change pas

Exemple : le travail payé à l’unité
produite, faire un chandail, payer 10$, 1:1, nombre de choses qui, fait déterminé le son salarié (le nombre de réponse)

Comportement observé : réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio
élevés (fatigue ou consommation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pour le pans a ratio variable, que veut dire variable? Donner un exemple de ration variable et un comportement observer

A

Variable : le nombre de
réponses nécessaires varie
d’un renforcement à l’autre

Exemple : une machine à sous,
VLT de Loto-Québec

Comportement observé : effort
élevé et constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que veut dire intervalle?

A

Le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pour le plan à intervalle, que veut dire fixe? Donner un exemple de plans à intervalle fixe et un comportement observé

A

Fixe : la durée de l’intervalle ne
change pas d’un renforcement à
un autre

Exemple : jeux-vidéo, une tâche à faire seulement une fois à chaque 24h, gens vont venir 1 fois par jours

Comportement observé : des
réponses isolées et espacées
dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pour le plan à intervalle variable, que veut dire variable? Donner un exemple de plans à intervalle variable et un comportement observé

A

Variable : la durée de l ’intervalle
varie d ’un renforcement à un
autre

Exemple : recomposer un
numéro de téléphone occupé

Comportement observé : rythme de réponses lent mais assez constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce qu’il est associé à ces plans de renforcement, selon Thorndike? (S-R ou R-C?)

A

La loi de l’effet de Thorndike: «suivi » donc serait- il cas de l’apprentissage par la contiguïté? Car cloché suivi de choc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’il est associé à ces plans de renforcement, selon Skinner? (S-R ou R-C?)

A

Skinner n’est pas d’accord avec Thorndike car cela contredit la
notion de contingence comme cause du conditionnement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce qu’il est associé à ces plans de renforcement, selon Tinklepaugh? (S-R ou R-C?)

A

En 1928, Tinklepaugh démontre que les organismes apprennent à s’attendre à recevoir des renforçateurs particuliers: des singes à qui on donne une feuille de salade se montrèrent déçus quand ils “s’attendaient” à un morceau de banane.
Donc R-C?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qu’il est associé à ces plans de renforcement, selon Colwill et Rescorla?

A

S - R - C ? C’est que propose Colwill et Rescorla dans leur modèle de la contingence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

C’est quoi l’expérience d’Hammond et ces phases?

A

L ’expérience de contingence d’Hammond (1980) est apparentée au concept « Go - NoGo »:

Phase 1: renforcement de 5% des réponses ( 5% de chance que nourriture tombe si pressé levier)
- Résultat: 3000 pression de levier par heure

Phase 2: continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas où aucune pression n ’a été faite
- Résultat: Le taux de réponse diminue graduellement presque à zéro (il arrête d’appuyer sur le levier, car moins d’effort)

Phases 3 (comme phase 1): va recommencer à presser le levier sans avoir à réapprendre
Phase 4 (comme phase 2): réponse va aussi arrêter

17
Q

C’est quoi la notion de renforçateur, selon Pavlov?

A

Pour Pavlov, les renforçateurs sont des SI qui sont associés avec des SC

18
Q

C’est quoi la notion de renforçateur, selon Thorndike?

A

Selon Thorndike, les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli

19
Q

C’est quoi la notion de renforçateur, selon Skinner?

A

En fin pour Skinner, un renforçateur est
tout stimulus qui augmente la réponse qui
le précède