Cours 10 Flashcards

1
Q

C’est quoi un plan à renforcement continue ?

A

Chaque réponse approprié est récompensée (il y a une conséquence) Meilleure courbe d’apprentissage (grâce à la loi de l’effet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi un plan de renforcement partiel ?

A

Chaque réponse approprié n’est pas nécessairement récompensée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les effets du renforcement partiel ? Pourquoi

A

Ralentissement de la courbe d’apprentissage
Résistance à l’extinction

Parce que:

  • Discrimination difficile: Comme la réponse arrive avec plusieurs situations, on a du mal à distinguer ce qui va être renforcé ou non = tendance à continuer/tester plus de trucs
  • Frustration: Comme ca marche pas, on fait autre chose (continue) mais si il y a rien d’autre à faire ne fait on ne fait pas autre chose car on sait que ca marche parfois (partiel)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

C’est quoi un plan à ratio ? Quels sont les 2 types ?

A

Plan à ratio: Il faut faire un certain nb de réponse pour avoir un renforcement
- Ratio fixe: toujours le même nb
- Ratio variable: change à chaque fois

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

C’est quoi un plan à intervalle ? Quels sont les 2 types ?

A

Plan à intervalle: Il y a un délai après chaque renforcement minimum. Si le rat appui le levier avant les 30 secondes, ca ne fait rien
- Intervalle fixe
- Intervalle variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

C’est quoi un plan à ratio fixe ? Donne un exemple et le comportement observé avec ce type de plan

A

Ratio : l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives

Fixe : le nombre de réponses nécessaires ne change pas

Exemple : le travail payé à l’unité produite

Comportement observé : réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés (fatigue ou consommation)

Quand les ratios augmentent le nb de pauses augmentent

Les plans à ratios (surtout fixe) donne beaucoup de contrôle au sujet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

C’est quoi un plan à ratio variable ? Donne un exemple et le comportement observé avec ce type de plan

A

Ratio : l’obtention du renforcement est conditionnel à la production d’un nombre déterminé (pas vraiment dans ce cas) de réponses répétitives

Variable : le nombre de réponses nécessaires varie d’un renforcement à l’autre

Exemple : une machine à sous, VLT de Loto-Québec

Comportement observé : effort élevé et constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

C’est quoi un plan à intervalle fixe ? Donne un exemple et le comportement observé avec ce type de plan

A

Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante

Fixe : la durée de l’intervalle ne change pas d’un renforcement à un autre

Exemple : vérifier si on a reçu un chèque de bien-être social

Comportement observé : des réponses isolées et espacées dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

C’est quoi un plan à intervalle variable ? Donne un exemple et le comportement observé avec ce type de plan

A

Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante

Variable : la durée de l ’intervalle varie d ’un renforcement à un autre

Exemple : recomposer un numéro de téléphone occupé

Comportement observé : rythme de réponses lent mais assez constant

La réponse va finir par marcher, mais on ne sait pas quand

Est-ce qu’on rapelle tout de suite Tante Gertrude ? Dépend de la récompense

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

C’est quoi l’expérience d’Hammond ?

A

Phase 0: Les sujets apprennent à se servir du levier avec un renforcement continue

Phase 1 (lumière verte): renforcement de 5% des réponses
- Résultat: 3000 pression de levier par heure;

Phase 2 (lumière rouge): continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas où aucune pression n’a été faite
- Résultat: Le taux de réponse diminue graduellement presque à zéro

Phases 3 & 4 répétition de 1 & 2 (design ABAB)

Permet à un rat de faire les choses différentes sans faire d’extinction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

C’est quoi la notion de renforçateur selon Pavlov ?

A

Pour Pavlov, “les renforçateurs sont des SI qui sont associés avec des SC”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

C’est quoi la notion de renforçateur selon Thorndike ?

A

Selon Thorndike, “les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

C’est quoi la notion de renforçateur selon Skinner ?

A

En fin pour Skinner, “un renforçateur est tout stimulus qui augmente la réponse qui le précède”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly