Cours 7 Flashcards
Types de renforcements
Renforcement continu
Renforcement partiel
Types de plans de renforcement simple
Plans de renforcement a ratio
Plans de renforcement a intervalle
Renforcement continu
Chaque reponse appropriee est suivi d’un renforcement
100% de chance de faire le comportement
Quel renforcement est le plus efficace
Le renforcement continu
A quoi ressemble la courbe d’apprentissage d’un renforcement continu
Elle monte rapidement, mais descend tout aussi rapidement (extinction plus rapide)
Quel renforcement est beaucoup moins utilise en pratique
Renforcement continu
Renforcement partiel
Chaque reponse appropriee n’est pas necessairement suivi d’un renforcement
Effet du renforcement partiel
Ralentissement de la courbe d’apprentissage (acquisition, mais aussi extinction plus lente)
Resistance a l’extinction (le renforcement n’est pas toujours presente/ courbe plus lente)
Quelles sont les explications des effets du renforcement partiel
Discrimination difficile
Frustration
Donne un exemple de frustration au niveau du renforcement partiel
Un bebe qui n’arrive pas a faire ses nuits. Il apprend que pleurer amene ses parents a aller le voir, alors il pleure et se fait renforcer lorsque ses parents arrivent. Pour interrompre le comportement, les parents doivent arreter de le voir amenant de la FRUSTRATION menant ainisi a l’extinction ou un contreconditionnement
Plan a ratio
Il est base sur le nombre de reponses produites
Types de ratio
Fixe
Variable
ratio fixe
Maintient du meme ratio tout au long du plan
Ratio variable
Variation du ratio pendant le plan
Plan a intervalle
Il est base sur le delai depuis le dernier renforcement
= le temps
Types d’intervalles
Fixe
Variable
Noms des courbes associees aux plans de renforcements simples
Courbe cumulative de perfromance
Regle temporelle refractaire
On a besoin d’un certain nombre de temps pour recuperer, pendant cette periode refractaire, il n’y a pas de renforcement
Plans a ratio fixe: definit ratio
L’obtention du renforcement est conditionnel a la production d’un nombre determine de reponses repetitives
Plan a ratio fixe: definit fixe
Le nombre de reponses necessaires ne change pas
Exemple de plans a ratio fixe
Le travail paye a l’unite produite
Le nombre de choses produites donne un salaire unitaire
Comportement observe plan a ratio fixe
Reponse a haute frequence mais suivie d’une pause post-renforcement pour les ratios eleves
Pourquoi lors de plans a ratio fixe, il y a une pause post-renforcement
Fatigue
Consommation (accumulation rapide de recompense sans interet pour la reponse)
Plans a ratio variable : definit ratio
Obtention du renforcement est conditionnel a la production d’un nombre determine de reponses repetitives
Plan a ratio variable: variable
Le nombre de reponses necessaires varie d;un renforcement a l’autre
Exemple plans a ratio variable
Machine a sous
Loto
Comportement observe plans a ratio variable
Effort eleve et constant
Si prend une pause= epuisement
Plans a intervalle fixe: definit intervalle
Le renforcement est disponible seulement apres une periode de temps determinee; une seule reponse est alors suffisante
Plans a intervalle fixe: definit fixe
La duree de l’intervalle ne change pas d’un renforcement a un autre
Exemple de plans a intervalle fixe
Verifier si recu cheque bs, remplir formulaire a chaque mois (intervalle fixe) pour recevoir le cheque (renforcement)
Comportement observe plans a intervalle fixe
Des reponses isolees et espacees dans le temps
Plans a intervalle variable: definit intervalle
le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
Plans a intervalle variable: definit variable
La duree de l’intervalle varie d’un renforcement a un autre
Exemple plans a intervalle variable
Recomposer le numero de qq d’occupe
Appeller(reponse), la personne ne repond pas (pas de renforcement)
Comportement observe plans a intervalle variable
Rythme de reponses lent mais assez constant
La loi de l’effet de thorndike ferait appel a de la contingence ou de la contiguite
Contiguite
Thorndike utilise le mot “suivi” dans sa definition, insinuant qu’on a besoin que la reponse soit suivie d’une recompense = contiguite
Que considere skinner comme important au niveau de l’apprentissage: la contingence ou la contiguite
La contingence comme cause du conditionnement
Que demontre Tinklepaugh
Les organismes apprennent a s’attendre a recevoir des renforcateurs particuliers
Quelque chose peut etre un renforcateur dans une situation, mais pas dans une autre
- nature cognitive
Quelle etait l’experience dde Tinklepaugh
Des singes se sont montres decus lorsqu’ils ont recu de la salade, a la place de banane (le renforcateur initial). Pourtant, les 2 nourrissent et recompensent les singes, mais ils ont montres une preference pour la banane
Que propose Colwill et Rescorla dans leur modele de la contingence
S-r-c
Il y a une contingence par situation= la meilleure possible
Qu’est ce que l’experience d’Hammond
-
L ’expérience de contingence d’Hammond (1980) est apparentée au concept « Go - NoGo »:
Phase 1: renforcement de 5% des réponses
- Résultat: 3000 pression de levier par heure;
Phase 2: continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas où aucune pression n ’a été faite
- Résultat: Le taux de réponse diminue graduellement presque à zéro
Phases 3 & 4 répétition de 1 & 2 (design ABAB)
Pour Pavlov, qu’est un renforcateur
“les renforçateurs sont des SI qui sont associés avec des SC”.
Pour Thorndike, qu’est un renforcateur
“les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli”.
Pour Skinner, qu’est un renforcateur
“un renforçateur est tout stimulus qui augmente la réponse qui le précède”.