Examen final Flashcards
Programme à durée fixe
Donne le renforcement après une certaine période de temps fixe où on fait le comportement non stop
DFXX
Programme à durée variable
Donne le renforcement après une période de temps imprévisible et variée (temps moyen) où on fait le comportement non stop
DVXX
Ne tient PAS compte de la variance
Caractéristiques programme à durée fixe et variable
Imprécis dans leur capacité à faire produire des comportements (travailler fort ou lentement pendant 1 heure)
DONC besoins de plus de spécifications sur les comportements attendus
Déf. programmes de débit de réponse
En fonction du débit de réponse (lent, rapide ou rythmé)
Un SEUL type de réponse renforcé
Programme de renforcement différentiel du débit rapide (RDDR)
Donne renforcement si fait le au moins un certain nombre de réponse en une certaine période de temps
Débit assez rapide pas débit plus lent
X nbre en y temps
Programme de renforcement différentiel du débit lent (RDDL)
Donne renforcement si fait au plus (plus petit ou égal) un certain nombre de réponse en une certaine période de temps
Tout comportement trop fait élimine chance d’obtenir renforçateur contrairement à intervalle fixe
Programme de renforcement différentiel du débit rythmées (RDRR)
Renforcement en fonction d’un débit préétabli (ni trop lent, ni trop rapide)
Ex: Appuyer un bouton min. 5 et max 10
Slow
Vitesse de conduite
Programme non contingents et utiliser avec qui
Renforcement apparait peut importe la réponse
Surtout avec animaux et enfants pour conserver attachement
Programme à temps fixe
Renforcement apparait après un temps prévisible et fixe peut importe le comportement
TFXX
Programme à temps variable
Renforcement apparait après un temps imprévisible et variée peut importe le comportement (moyenne)
TVXX
Prend pas en compte la variance
Programme non contingent caractéristique
-Maintien de comportement superstitieux
-Apparait souvent dans contexte TV, imprévisible
-Tendance innée à être intolérant à l’incertitude et vouloir prévoir celle-ci
Ex: objet qui porte “chance”, pigeon pensait qu’il obtenait nourriture seulement en faisant un mouvement
Qu’arrive-t-il si programme non contingent ajouté à un programme contingent
Débit de réponse ralenti
Ex: Joueur baseball avait meilleur performance quand il était payé selon sa performance que avec un contrat permanent
Déf. programme complexe
Combinaison d’au moins deux programmes simples
Programme conjonctif
Exigences d’au moins 2 programmes simples doivent être satisfaites avant de recevoir le renforçateur
Ex: rat doit courir 2 min + appuyer 10 fois sur un levier pour de la nourriture
Programme ajustable
La demande de réponse change en fonction de la performance
Utile pour façonner le comportement que l’on veut
-Ajuste critères pour rendre plus semblables à ce qu’on veut
Ex: Quand on apprend la musique, passer de faire la gamme lentement à rapidement
Programme en chaîne
Suite d’au moins 2 programmes simples où chacun à son propre Stimulus discriminatif (SD) et dont le dernier produit un renforçateur terminal
Chacun est un stimuli discriminatif + renforçateur terminal pour celui avant
Ex: pigeon a besoin de la lumière rouge pour avoir la lumière bleue pour avoir la lumière orange pour avoir la bouffe
Différence entre programme en chaîne et programme conjonctif
Programme en chaîne = Programmes doivent être complétés dans un ordre précis
Caractéristiques programme en chaîne
Réponses aux premiers maillons sont plus faibles que celles plus près du renforçateur terminal (le dernier)
Causes:
-Renforcement immédiat + efficace que renforcement différé
-Plus il y a d’étapes, moins le lien est fort
-Principe de l’effet gradient
Comment établir programme en chaîne
Utiliser enchaînement à rebours
- Établir programme en débutant par le maillon terminal et finissant par le maillon initial
Définition apprentissage social et 2 exemples
Modification du comportement par moyens indirects
Ex: apprentissage par observation, langage pour formuler les règles (comme les règles de déontologie)
Inventeur apprentissage social
Bandura et Walter
Large proportion de l’apprentissage chez l’humain se fait par observation
Déf. Apprentissage vicariant et par observation
Vicariant : on observe le comportement et les conséquences de ceux ci chez les autres
Observation : on est déjà entrain de faire le comportement et on le modifie après avoir observé le comportement de quelqu’un
très efficace chez les humains
Exemple d’apprentissage par observation
Modification de l’exécution d’une tâche en regardant d’autres personnes le réaliser
(Marche mieux avec un autre humain qu’un robot)
Rétention vs transfert
Rétention: pratique physique meilleure que pratique observée
Transfert: pratique physique et observé font les mêmes erreurs (transfert dans une autre tâche)