Plans de renforcement Flashcards
cours 7
Qu’est ce que le renforcement continu?
Lorsque chaque réponse est suivie d’une conséquence/renforcement
Qu’est ce que le renforcement partiel?
Lorsque la réponse n’est toujours renforcé
Quel renforcement fournit un meilleur apprentissage et pourquoi?
C’est le renforcement continu, à cause de la loi de l’effet (comportement est controlé par ses conséquences)
Quels sont les effets du renforcement partiel?
Ralentissement de la courbe d’apprentissage et la résistance à l’extinction (plus lent mais plus résistant)
Pour quel renforcement l’extinction est plus rapide?
Pour le renforcement continu
Pourquoi la résistance est présence
À cause de la frustration et la discrimination
Qu’est ce qu’un plan à ratio fixe (FR)?
Donner un exemple
C’est comme un renforcement continu, la réponse dépend du nombre de réponses répétitives
ex. travail payé à l’unité
Quel comportement est observé pour un FR?
Les réponses sont à haute fréquence mais elle sont suivie d’une pause “post-renforcement”, qui dépend du ratio
Qu’est ce qu’un plan à ratio variable (VR)?
Donner un exemple
Le nombre de réponse nécessaire varie pour chaque récompense
ex. travail à commission
Quel comportement est observé pour un VR?
Il y a un effort constant et élevé, les pauses sont courtes et moins fréquente
Qu’est ce qu’un plan à intervalle fixe (FI)?
Donner un exemple
L’individu doit effectuer une réponse après qu’un intervalle de temps spécifique se soit écoulé pour recevoir une récompense
ex. ouvrir le four pour regarder le gâteau qu’on cuit, en espérant que la cuisson soit terminer
Quel comportement est observé pour un FI?
Les réponses sont isolées et espacées dans le temps
Qu’est ce qu’un plan à intervalle variable (VI)?
Donner un exemple
L’individu doit effectuer une réponse après qu’un intervalle de temps (qui varie) se soit écoulé pour recevoir une récompense
ex. un photographe qui essaye de photographier des animaux dans la nature
Quel comportement est observé pour un VI?
Il y a un rythme de réponses lents mais assez constant
Qu’est ce qu’on apprend de l’expérience d’Hammond?
L’expérience illustre la façon dont les individus ajustent leurs comportements en fonction du lien perçu entre une action et une récompense. Si ce lien est faible ou absent, le comportement diminue
Qu’est ce qu’un renforçateur selon Pavlov?
Un renforçateur est un SI associées avec un SC
Qu’est ce qu’un renforçateur selon Thorndike?
Les renforçateurs fournissent de la satisfaction et ceux-ci établissent des connexions entre les stimuli
Qu’est ce qu’un renforçateur selon Skinner?
Un renforçateur est tout stimuli qui augmente la réponse qui le précède
Qu’est-ce que l’extinction?
Lorsqu’un comportement renforcer ne reçoit plus de renforcement (ça augmente la variabilité du comportement et la fréquence du comportement émotionnel comme l’agressivité)
Qu’est-ce que l’extinction burst?
C’est lorsque après l’extinction, le sujet a une augmentation brute du comportement
ex. parent qui ignore son enfant qui veut des bonbons –> enfant se met a crier
Qu’est-ce que la resurgence?
Lorsqu’un comportement appris dans le passé refait surface lorsque le comportement actuellement renforcé arrête d’être renforcé
Qu’est-ce que le spontaneous recovery?
Lorsque le comportement revient sans renforcement (la fréquence du comportement baisse mais il peut réapparaître à l’improviste)
Qu’est ce qu’un plan à durée fixe (FD)?
Donnez un exemple
Le comportement doit être effectué de façon continue sur une période de temps et le renforcement est donné à la fin de la durée
ex. enfant qui pratique le piano pendant 30mins et à la fin, sa mère lui donne un cookie pour le féliciter
Qu’est ce qu’un plan à durée variable (VD)?
Donnez un exemple
Le comportement doit être effectué de façon continue sur une période de temps qui varie et le renforcement est donné à n’importe qui moment
ex. enfant qui pratique le piano pendant 30/40/45min et à la fin, sa mère lui donne un cookie n’importe quand
Qu’est ce qu’un plan à temps fixe (FT)?
Donnez un exemple
Le renforcement est donné après une période de temps, peu importe si le comportement a été effectué ou pas
ex. pigeon reçoit de la nourriture chaque 10sec peu importe s’il picore le disque ou pas, recevoir un cadeau à son anniversaire
Qu’est ce qu’un plan à temps variable (VT)?
Donnez un exemple
Le renforcement est donné périodiquement à intervalles irréguliers, peu importe si le comportement a été effectué ou pas
ex. fleurs qui poussent à n’importe quel moment (pas besoin de l’arroser constamment)
Qu’est ce qu’un plan à ratio progressif (PR)?
Donnez un exemple
Le nombre de réponse pour obtenir une récompense augmente progressivement après chaque renforcement
ex. appuyer sur un levier un nombre déterminé de fois, qui augmente
Nomme les différents plans composées
Le plan multiple, le plan mixte, le plan en chaîne, le plan tandem, le plan coopératif et le plan simultané
Quels sont les plans à renforcement non contingent (NCR)?
Le plan à temps fixe et le plan à temps variable
Quels sont les plans à renforcement qui dépendent de la réponse
Le plan à ratio fixe et le plan à ratio variable
Quels sont les plans à renforcement qui dépendent du passage du temps
Le plan à intervalle fixe et le plan à intervalle variable
Qu’est ce qu’un plan multiple?
2 plans ou + qui alterne et influence le comportement, chaque plan est associé à un stimuli particuliers
Qu’est ce qu’un plan mixte?
2 plans ou + qui alterne et influence le comportement, mais il n’y a pas de changement apparent de plan
Qu’est ce qu’un plan en chaîne?
Le renforcement arrive seulement lorsque la dernière série de plan est complété, changement apparent (couleur/son)
Qu’est ce qu’un plan tandem?
Le renforcement arrive seulement lorsque la dernière série de plan est complété, pas de changement apparent
Qu’est ce qu’un plan coopératif?
Donnez un exemple
2 individus ou +, le renforcement qu’un individu reçoit dépend du comportement de l’autre individu
ex. travail d’équipe
Qu’est ce qu’un plan simultané?
2 plans ou + disponible simultanément, le sujet doit alors faire un choix
Que signifie l’effet de renforcement partiel?
C’est lorsque les comportements renforcer avec le renforcement partiel sont plus résistant à l’extinction qu’un comportement renforcé de manière continue
Quels sont les théories qui expliquent l’effet de renforcement partiel?
Discrimination hypothesis
Frustration hypothesis
Sequential hypothesis
Response unit hypothesis
Expliquez the discrimination hypothesis
Lorsque le renforcement est partiel, il est plus difficile de détecter l’arrêt total de récompense (extinction) VS avec un renforcement continu c’Est facile de détecter l’extinction car l’absence de récompense devient évidente
ex. une personne qui reçoit des compliments manière irrégulière aura du mal à remarquer immédiatement l’absence totale de compliments
Expliquez the frustration hypothesis
Lorsque le renforcement n’est pas constant, l’individu éprouve de la frustration lorsqu’une récompense attendue n’est pas donnée. Au fils du temps, il apprend à tolérer sa frustration et à persister dans son comportement malgré l’absence de récompense
ex. rat qui continue à appuyer sur un levier même lorsqu’il ne reçoit pas systématiquement une récompense
Expliquez the sequential hypothesis
L’individu apprend une séquence où les comportements non récompensés sont souvent suivis de comportements récompensé
ex. un pigeon reçoit une récompense après une série de pression sur un levier (3 essais infructueux), continuera à essayer même sans récompense immédiate
Expliquez the response unit hypothesis
Expliquez la loi de l’appariement
Lorsqu’un organisme répartis ses réponses entre plusieurs options en fonction du taux de renforcement par option