Cours #7 Flashcards

1
Q

Théorie de la réduction des pulsions (Clark Hull)

A

Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique
Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation)

Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés

Ex: La privation de nourriture amène une pulsion de faim. L’animal va donc produire des comportements (ex: exploration) qui pourraient lui permettre de diminuer de cette pulsion (la faim). Si l’animal trouve de la nourriture et la consomme, la pulsion de faim va diminuer et les comportements qui lui ont permis d’obtenir la nourriture seront renforcés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Théorie de la réduction des pulsions : renforçateurs

A

On sait qu’il existe des renforçateurs primaires qui sont définis comme ceux qui relèvent de besoins (pulsions) physiologiques primaires (nourriture, eau, comportements sexuels, etc.)

Selon la théorie de la réduction des pulsions, tous les renforçateurs peuvent être reliés directement ou indirectement au besoin de réduire une pulsion physiologique

Ex: Étudier pendant 20 ans-obtenir un bon emploi-gagner de l’argent-manger chez votre resto pref.-réduire ses pulsions de faim

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Théorie de la réduction des pulsions : certains compos associés à aucun type de réduction des pulsions

A

Cependant, certains comportements semblent n’être associés à aucun type de réduction des pulsions

Ou le lien entre le comportement et le besoin physiologique est très mince
Ex: aller voir une pièce de théâtre-donne un sujet de conversation pour un rdv galant- excuse pour manger chez Sushi Momo-réduire ses pulsions de faim

Souvent, l’aspect important semble plus être en lien avec l’aspect renforçant du stimulus en soi plutôt qu’au fait qu’il nous permet de diminuer une pulsion physiologique

On parle ici de motivation incitatrice:
motivation issue d’une certaine propriété du renforçateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Théorie de la réduction des pulsions : compos mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions

A

Nos comportements sont beaucoup mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions

Ex: j’ai faim, je vais
Cuire du steak haché et le manger, ouvrir une boîte de maïs en crème et la manger, bouillir des pommes de terre et les manger
Cuire du steak haché, ouvrir une boîte de maïs, bouillir des pommes de terre, les organiser en étage et les manger

Abandon graduel de cette théorie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Principe de Premack : CTP px servir à renforcer CPP

A

Un comportement très probable peut servir à renforcer un comportement peu probable

Pour comprendre le principe de Premack on doit concevoir qu’un renforçateur peut être envisagé comme un comportement plutôt que comme un stimulus
Ex: renforçateur = nourriture vs. = manger

Ainsi le processus de renforcement passe du lien entre une réponse et un stimulus à une suite de deux réponses (ou comportements)

L’accent est mis sur les probabilités relatives (ou fréquences relatives) des comportements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Principe de Premack : deux catégories de comportement

A

Un comportement très probable peut servir à renforcer un comportement peu probable

Deux catégories de comportements
Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement
Ex: si j’ai faim, manger est un CTP

Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
Ex: si j’arrive du buffet all you can eat, manger est un CPP

Un comportement très probable peut servir à renforcer un comportement peu probable

Offre une façon d’identifier facilement des renforçateurs dans l’environnement
Temps mis pour X, temps mis pour Y

Ex: Jonathan met 2h pour se coiffer le matin, il met 1h pour faire ses lectures pour le cours d’apprentissage
étudier (CPP) (R)  coiffer (CTP) (SR)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hypothèse de la dépravation de réponse

A

Un comportement peut servir de renforçateur à deux conditions (Timberlake et Allison, 1974):

L’accès à ce comportement est restreint

Sa fréquence se situe sous son niveau préférentiel

Niveau préférentiel: niveau de référence lorsque le sujet peut librement faire ce comportement

Ex: Ma petite sœur qui aurait pu visionner 24h par jour sa cassette préférée.

Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hypothèse de la dépravation de réponse

A

Permet de comprendre pourquoi les contingences de renforcement sont efficaces

Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront renforcés

Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera sous le niveau préférentiel

Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel

Permet d’explique un plus grand nombre de situations (avec deux CTP par exemple)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Approche comportementale axée sur le point de satiété

A

Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global (Allison, 1983)

La durée de chaque activité représente leur renforcement optimal (le point de satiété comportemental)

Cependant, dans des contingences de renforcement ces points de satiété peuvent devenir inatteignables

Puisque la plupart de nos comportements sont imbriqués dans des contingences de renforcement (ex: travailler vs. faire de la musique), nous devons ajuster notre temps afin d’atteindre un point qui nous rapproche de nos points de satiété (sans vraiment les atteindre)

Ainsi, les organismes vont tenter de répartir leur comportement de façon à maximiser le renforcement global

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Programme de renforcement : définition

A

La demande de réponse à satisfaire pour obtenir un renforcement

Ce qui doit être fait pour s’assurer d’obtenir un renforçateur

Ensemble de règles à suivre pour obtenir un renforçateur

Ex: Rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture?

Combien de temps dois-je attendre au McDo avant d’obtenir ma commande?

Combien de fois devez-vous dire à votre coloc de faire sa vaisselle?

Différents programmes (demandes) vont produire différents effets sur le comportement

Ces effets sont nommées «effets de programme»

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Programme de renforcement continu

A

Programme où chaque réponse est renforcée

Ex: Chaque fois que le rat appuie sur le levier le choc cesse

Chaque fois que je vous pose une question, vous répondez

Très efficace

Facile à comprendre

Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose

Ex: Votre conjointe s’empresse de souligner qu’elle appréciait que aviez appelé pour dire que vous rentrez tard, à chaque fois que vous le faites

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Programme de renforcement intermittent

A

Aussi appelé partiel

Programme où seules certaines réponses sont renforcées

Ex: Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau

Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau

Dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence

Le plus courant dans la vie

L’environnement renforce rarement tous nos comportements

Relations amoureuses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

4 types de programmes intermittents de base

A

Programme à proportion fixe

Programme à proportion variable

Programme à intervalle fixe

Programme à intervalle variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Programme à proportion fixe

A

Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE

Ex: Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Vous devez copier 200 fois un texte portant sur le respect des règles avant de sortir de votre retenue

Il faut compter 3 buts avant de se faire dire que l’on a fait un tour du chapeau

Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
En lien avec les exemples plus haut on a: PF3, PF200,

PF3
PF1=programme continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Programme à proportion fixe : engendre généralement …

A

Ce type de programme engendre habituellement

  • Un débit de réponse rapide
  • Une courte pause après l’obtention de chaque renforçateur
  • Nommée pause après renforcement
  • Le retour rapide des réponses après la pause
  • Ex: Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Programme à proportion fixe : après une pause de renforcement…

A

Après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long

Ex: Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….

Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement

Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce

Commencer par quelque chose de facile

PAS COMMENCER par le découpage

Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
Pause pour PF25 < pause pour PF100

17
Q

Programme à proportion fixe : dense vs frugal

A

On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE

On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL

Ratio = nb de comportements/renforçateur

18
Q

Programme à proportion fixe : problème

A

Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux

Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion

Ex: Féliciter son enfant d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 3 fois

L’étirement de la proportion engendre parfois une dégradation dans le comportement
Tension du ratio: perturbation de la réponse causée par une demande trop exigeante

Ex: Féliciter son enfant d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
À chaque 100 fois
Entrer au Doctorat

19
Q

Programme à proportion variable

A

Programme où le renforcement est en fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ

Ex: Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit

Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission

La plupart des sports ou des jeux

Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur

En lien avec les exemples plus haut on a: PV3, PV10

Le programme est fonction d’une moyenne donc on peut avoir un PV10

Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois

Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois

Ex: 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance

20
Q

Programme à proportion variable : engendre habituellement…

A

Ce type de programme engendre habituellement

  • Un débit de réponse rapide et stable
  • Peu de pause après l’obtention de chaque renforçateur
  • Peut aller à aucune pause si le nombre minimum de réponses est très bas

Ex:PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10

Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement

Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec PV10 avec renforçateur après 8 à 12 réponses

Ces types de programmes peuvent engendrer des comportements mal adaptés
Ex: Jeu compulsif
LA crise de bacon qui marche…

21
Q

Programme à intervalle fixe

A

Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE

Ex: Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture

Si je vous dis que les notes seront disponibles 5 jours après l’examen vous devez attendre 5 jours avant que le fait d’aller sur StudiUM vous donne accès à vos notes

Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur

En lien avec les exemples plus haut on a: IF30 sec, IF5 jours

22
Q

Programme à intervalle fixe : engendre habituellement…

A

Ce type de programme engendre habituellement
un mode de réponse ondulatoire

Courbe orientée vers le haut

Pause après l’obtention du renforçateur

Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne

Le temps est un SD qui devrait indiquer à l’organisme quand le renforçateur devient disponible

3 minutes (SD) : Ouvrir le micro-ondes (R)  Pizza Pocket (SR)

Important: tout comportement fait avant l’intervalle n’est pas efficace

23
Q

Programme à intervalle variable

A

Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE

Ex: Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture
Si je vous dis que les notes seront disponibles en MOYENNE 5 jours après l’examen vous devez attendre autour de 5 jours avant que d’aller sur StudiUM vous donne accès à vos notes
Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
En lien avec les exemples plus haut on a: IV30 secondes, IV5 jours

Le programme est fonction d’une moyenne donc on peut avoir un IV10
Renforçateur obtenu après la première réponse faite entre 1 et 20 minutes mais en moyenne après 10 minutes
Ex: 2, 18, 16, 4, 10,
Renforçateur obtenu après la première réponse faite entre 8 et 12 minutes mais en moyenne après 10 minutes
Ex: 12, 8, 9, 11, 10,
Ne tient donc pas vraiment compte de la variance

24
Q

Programme à intervalle variable: engendre habituellement…

A

Ce type de programme engendre habituellement
un débit de réponse stable et modéré

Peu de pause après l’obtention de chaque renforçateur

Peut aller à aucune pause si l’intervalle minimum est très court

Ex:IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10

Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est «tenté» de ne jamais arrêter de faire le comportement

Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes

Puisqu’il s’agit de temps ici, le comportement devient très régulier

Ex: pour un IV10 minutes avec renforçateur après 1 min à 20 min on aura souvent un patron de réponse d’un comportement par minutes

Ce patron permet de maximiser les chances de l’organisme d’obtenir le renforçateur (de ne pas le manquer)

Façon de faire produire des comportements réguliers sans avoir besoin d’utiliser beaucoup de renforçateurs

Ex: Pour obtenir un comportement à chaque minute
IV 10 minutes vs. IF 1 minutes

25
Q

Résumé

A

Différences au niveau des modes de comportements en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible

  • Débit de réponse
  • Pause

Les programmes à proportion

Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites

Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses

Ex: efficacité de donner des bonus à la performance ($ par vente)

Différences au niveau des modes de comportements en fonction de ce qui va maximiser nos chances d’obtenir le plus de renforçateurs possible

  • Débit de réponse
  • Pause

Les programmes à composante fixe ont tendance à engendre des pauses après le renforçateur

L’organisme sait qu’avant d’obtenir le prochain il devra nécessairement attendre (un délai, ou de faire un certain nombre de comportements)

26
Q

Motivation incitatrice

A

Motivation issue d’une certaine propriété du renforçateur.

Aspect important = + en lien avec aspect renforçant du stimulus en soi qu’au fai qu’il ns permet de diminuer une pulsion physio