Cours 10 Flashcards
C’est quoi un plan à renforcement continue ?
Chaque réponse approprié est récompensée (il y a une conséquence) Meilleure courbe d’apprentissage (grâce à la loi de l’effet)
C’est quoi un plan de renforcement partiel ?
Chaque réponse approprié n’est pas nécessairement récompensée
Quels sont les effets du renforcement partiel ? Pourquoi
Ralentissement de la courbe d’apprentissage
Résistance à l’extinction
Parce que:
- Discrimination difficile: Comme la réponse arrive avec plusieurs situations, on a du mal à distinguer ce qui va être renforcé ou non = tendance à continuer/tester plus de trucs
- Frustration: Comme ca marche pas, on fait autre chose (continue) mais si il y a rien d’autre à faire ne fait on ne fait pas autre chose car on sait que ca marche parfois (partiel)
C’est quoi un plan à ratio ? Quels sont les 2 types ?
Plan à ratio: Il faut faire un certain nb de réponse pour avoir un renforcement
- Ratio fixe: toujours le même nb
- Ratio variable: change à chaque fois
C’est quoi un plan à intervalle ? Quels sont les 2 types ?
Plan à intervalle: Il y a un délai après chaque renforcement minimum. Si le rat appui le levier avant les 30 secondes, ca ne fait rien
- Intervalle fixe
- Intervalle variable
C’est quoi un plan à ratio fixe ? Donne un exemple et le comportement observé avec ce type de plan
Ratio : l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives
Fixe : le nombre de réponses nécessaires ne change pas
Exemple : le travail payé à l’unité produite
Comportement observé : réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés (fatigue ou consommation)
Quand les ratios augmentent le nb de pauses augmentent
Les plans à ratios (surtout fixe) donne beaucoup de contrôle au sujet
C’est quoi un plan à ratio variable ? Donne un exemple et le comportement observé avec ce type de plan
Ratio : l’obtention du renforcement est conditionnel à la production d’un nombre déterminé (pas vraiment dans ce cas) de réponses répétitives
Variable : le nombre de réponses nécessaires varie d’un renforcement à l’autre
Exemple : une machine à sous, VLT de Loto-Québec
Comportement observé : effort élevé et constant
C’est quoi un plan à intervalle fixe ? Donne un exemple et le comportement observé avec ce type de plan
Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
Fixe : la durée de l’intervalle ne change pas d’un renforcement à un autre
Exemple : vérifier si on a reçu un chèque de bien-être social
Comportement observé : des réponses isolées et espacées dans le temps
C’est quoi un plan à intervalle variable ? Donne un exemple et le comportement observé avec ce type de plan
Intervalle : le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante
Variable : la durée de l ’intervalle varie d ’un renforcement à un autre
Exemple : recomposer un numéro de téléphone occupé
Comportement observé : rythme de réponses lent mais assez constant
La réponse va finir par marcher, mais on ne sait pas quand
Est-ce qu’on rapelle tout de suite Tante Gertrude ? Dépend de la récompense
C’est quoi l’expérience d’Hammond ?
Phase 0: Les sujets apprennent à se servir du levier avec un renforcement continue
Phase 1 (lumière verte): renforcement de 5% des réponses
- Résultat: 3000 pression de levier par heure;
Phase 2 (lumière rouge): continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas où aucune pression n’a été faite
- Résultat: Le taux de réponse diminue graduellement presque à zéro
Phases 3 & 4 répétition de 1 & 2 (design ABAB)
Permet à un rat de faire les choses différentes sans faire d’extinction
C’est quoi la notion de renforçateur selon Pavlov ?
Pour Pavlov, “les renforçateurs sont des SI qui sont associés avec des SC”.
C’est quoi la notion de renforçateur selon Thorndike ?
Selon Thorndike, “les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli”.
C’est quoi la notion de renforçateur selon Skinner ?
En fin pour Skinner, “un renforçateur est tout stimulus qui augmente la réponse qui le précède”.