Final Flashcards

1
Q

Quelle loi est à l’origine du conditionnement opérant , expliquez.

A

La loi de l’effet. La 1e à postuler que le comportement se renforce ou s’affaiblit suivant ses conséquences

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un essai discret

A

Une condition expérimentale qui a un début et une fin identifiable. Plus efficace, mais requiert une plus grande implication du chercheur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une situation opérante libre

A

il n’y a pas d’essaie particulier, la réponse est disponible en tout temps mais pour une période déterminée d’avance, plus réaliste que l’essai discret. Le comportement cible ne met pas fin à l’essaie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les contributions de skinner

A

La boîte de skinner
la standardisation des méthodes
L’efficacité (plancher grillage)
Ordinateur pour automatisation

Le vocabulaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquer la terminologie du paradigme instrumentale

Sd -> R -> Sr

A

Sd = Stimuli discriminatif
R= réponse
Sr= Stimuli de renforcement

Situation de stimulation , une réponse est suivi d’un stimulus renforçant. (conséquence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Est-ce que le paradigme S-S peut être appliqué au conditionnement instrumental

A

Non, car la réponse est apprise dans le conditionnement instrumentale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Est-ce que la curiosité existe dans le modèle instrumentale

A

Non, la pathologie non plus. La réponse sert à obtenir la récompense elle est instrumentale. Mais elle est volontaire, ce n’est pas un réflexe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les similitudes du l’apprentissage instrumentale avec le conditionnement classique

A

Loi de la pratique
Loi de l’intensité des stimuli
Blocage et masquage
Extinction + récupération spontanée
Contiguïté
Contingence
Généralisation et discrimination

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qui différencie le conditionnement classique du conditionnement opérant

A

La RC est automatique et prépare pour la RI.

Dans le conditionnement instrumentale la réponse est apprise et émise, elle nous amène à Sr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’un renforcement

A

Toute situation Sd - R - C dans laquelle l’effet de C sur R est d’augmenter la probabilité de R

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’une punition

A

Situation Sd - R - C dans laquelle C sur R diminue la probabilité de R,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

3 caractéristique d’une expérience pour qu’elle soit considérée comme un renforcement

A
  1. le comportement doit avoir une conséquence
  2. Le comportement doit augmenter en force (plus de répétition)
  3. L’augmentation de la force doit venir de la conséquence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’une punition positif

A

Situation Sd- R - C pour laquelle la conséquence est l’apparition d’un stimuli aversif qui diminuera la probabilité de fréquence d’un comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Est-ce que le renforcement positif aide la motivation intrinsèque

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que le apprentissage par récompense

A

Le renforcement positif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Est-ce que le renforcement négatif a un impact sur la motivation intrinsèque

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que l’apprentissage de l’évitement

A

Un renforcement négatif (on enlève un sentiment désagréable telle l’anxiété en évitant une situation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les effets nocifs de la punition positive

A

Agressivité passive (bouderie, procrastination)

Intensification de l’agressivité chez le punisseur (le punisseur est renforcé d’avoir punit et le punit est renforcer d’avoir arrêter les comportements)

Apprentissage de l’agressivité par le puni

Comportement d’évitement de la punition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Les effets de renforcement

A

Augmentation force (probabilité ou fréquence)

Tendance d’un comportement à persister malgré disparition du renforcement

Tendance à se produire malgré un conséquence aversive

Tendance à persister malgré un effort supplémentaire requis

Tendance à persister malgré la disponibilité de renforçateur pour d’autre comportements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que l’inertie comportementale

A

La tendance d’un individu à maintenir un comportement actuel, même en présence d’Autres renforçateur pour d’autre comportements. Le comportement renforcé plusieurs fois est plus propice à persister malgré les obstacles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que le façonnement

A

Le renforcement d’approximation d’un comportement pour mener plus rapidement au comportement souhaité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment faire du façonnement

A

Débuter avec un critère large , renforcer successivement, augmenter graduellement le critère.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quest-ce qu’un renforcement primaire

A

Ne dépend d’expériences d’apprentissage, ils sont innés phylogénétiques. Nourriture, eau, sommeil, sexe, stimulation électrique du cerveau, chaud, froid, contact social.

Certains renforçateurs primaires peuvent perdre de leur efficacité, le pouvoir de renforcement se perd graduellement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce qu’un renforçateur secondaire

A

Pas innés, résultent de l’apprentissage. Acquiert leur force par le biais d’association avec d’autres stimuli. Ses propriétés renforçatrice viennent de avec quoi il est paré.
Raconnaissance , applaudissement,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Est-ce que les renforcements secondaires sont plus facile à arriver à satiation

A

Non, ils arrivent à satiation moins rapidement que les renforçateurs primaires, mais leur efficacité dépends de la force d’association avec le primaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Est-ce que les renforcements secondaires sont plus flexible

A

Oui, car les renforçateur primaire dépendent du besoin. Si le rat n’a pas faim ne pourra pas faire un comportement tandis que si associé avec un clicker ou une lumière, fera le comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Qu’est-ce qu’un renforcement généralisé

A

Un renforcement secondaire qui a été associé à plusieurs renforcement spécifique, qui va renforcer un large éventail de comportements (Argent)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Qu’est-ce qu’un renforcement naturel

A

Suit naturellement un comportement, pédaler sur un vélo, brosse ses dents (bonne haleine)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Qu’est-ce qu’un renforcement artificiel

A

Quelque le donne dans le but de modifier un comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Des quoi dépendent les effets de renforcements

A

La contingence (degré de corrélation entre le comportement et sa conséquence)

La contiguité (délais entre comportement et réponse)
Le renforcement différé signalé marche mieux que le renforcement différé seul

Caractéristiques des renforcements (la magnitude, différence qualitative)

Caractéristiques des comportements (affecte la facilité avec lequel peut être renforcé)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Comment on fait l’apprentissage d’une chaîne de comportements

A

Commencer par la dernière étape et à chaque étape l’étape précédente renforcée doit être visible. En ordre inverse. Peu de validité écologique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Quels sont les deux type d’opération de motivation

A

Opération motivantes établissantes (augmente l’efficacité de la conséquence, la valeur d’un renforçateur : privation de nourriture)

Opération motivation abolissantes. diminue l’efficacité de la conséquence : drogues réduisent efficacité de la nourriture.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Qu’est-ce que des contingence concurrentes

A

Plusieurs contingences (relations entre conséquences et comportements) en même temps. ces contingences peuvent être en concurrence les unes avec les autres )

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Toute punition est une agression

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Qu’est-ce que le renforcement continu

A

Chaque réponse est suivit d’une renforcement. Augmentation rapide du débit de réponse. Très rare dans l’environnement naturel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Qu’est-ce que le Renforcement partiel

A

Chaque réponse n’est pas nécessairement suivi d’un renforcement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Quels sont les effets du renforcement partiel

A

Ralentissement de la courbe d’apprentissage

Résistance à l’extinction (changement moins facilement détectable)

Apprend la persistance car la 1. discrimination est difficile :
contraste moins clairs
ambiguïté de contingence
Incertitude quant à l’obtention peut mener à + de persistance.

  1. La frustration : primitivisassion des comportements, réponse instinctive, névrose expérimentale quand la tache est trop complexe. Dans un plan de renforcement partiel l’animal est habitué à la frustration qui est éventuellement renforcé. La frustration est un indication qu’un renforcement viendra
36
Q

Qu’est-ce qu’un plan à ratio fixe

A

Un nbr déterminé de réponse = renforcement

FR 3:1 FR 2:1

FR 1:1 = renforcement continu

37
Q

Qu’est-ce qu’une pause post-renforcement et dans quel type de plan de renforcement

A

Une pause suivant l’obtention des renforcements ( fatigue ou consommation)

La longueur de la pause dépend du ratio, peut faire d’autres comportements renforçants pendant la pause (se laver, aller au toilettes)

Plan à ratio fixe et plan à ratio variable.

38
Q

Qu’est-ce qu’un plan à ratio variable

A

Le nombre de réponse varie d’un renforcement à l’autre, peut arriver entre tant et tant de réponse mais varie autour d’une moyenne

Effort élevé et constant, pause post-renforcement moins fréquente + courte. Dépendance (machine à sous)

39
Q

Qu’est-ce qu’un plan à intervalle fixe

A

L’intervalle est une période réfractaire dans laquelle le renforcement n’est pas disponible déclenchée par la 1e réponse.

Une seule réponse est nécessaire après l’intervalle. La durée de l’intervalle ne change pas. Effort élevé à la fin de l’intervalle, réponse isolées et espacées dans le temps (scalloped graph)

40
Q

PLan à intervalle variable

A

La longueur de l’intervalle varie autour d’une moyenne mais change d’un renforcement à l’autre.

Rythme de réponse lent mais constant,, quand la récompense n’est pas un besoin urgent les réponses sont plus lentes. Le niveau de désir régule le rythme de la réponse

41
Q

Dans quel type de plan de renforcement voit on une réponse à haute fréquence et suivi d’une pause post-renforcement?

A

Plan à ratio fixe

42
Q

Dans quel type de plan voit ont un effort élevé constant et peu de pause post-renforcement

A

PLan à ratio variable

43
Q

Dans quel type de plan voit-on un effort élevé à la fin d’une période et des réponses isolées et espacées dans le temps

A

Plan à intervalle fixe

44
Q

Dans quel type de plan voit on un rythme de réponse lent et constant, linéaire et stable.

A

Plan à intervalle variable

45
Q

Dans quel type de plan le niveau de désir régule le rythme de la réponse

A

PLan à intervalles variables

46
Q

Qu’est-ce que le façonnement permet de faire

A

Rendre un comportement peu probable, probable en quelques minutes

47
Q

Est-ce que Thorndike connaissait le façonnement

A

Non , boite de thorndike = essaie erreur (essaie discret)

48
Q

Est-ce que le façonnement peut se produire dans l’environnement naturel ?

A

Oui, éducation des enfants. Certains comportement sont plus adaptés à l’environnement et ce dernier les sélectionnera et d’autres s’éteindront. C’Est le moyen par lequel de vieux comportement en forment des nouveaux

49
Q

Comment bien façonner un comportement

A

Renforcer le plus petits pas et donner des renforcements immédiats. Renforcer la meilleure approximation disponible. Être prêt à descendre le standard des fois (step back)

50
Q

Quels sont les deux formes de chaînes d’apprentissage

A

Forward and backward

51
Q

Est-ce que les chaînes d’apprentissage sont dans l’environnement naturel

A

Oui, forme la plupart des routines établies

52
Q

Qu’est-ce que l’augmentation de la fréquence de la réponse immédiatement après l’arrêt du renforcement

A

Un pic d’extinction

53
Q

Qu’est-ce qu’un plan à ratio fixe qui nécessite un nombre infini de réponse ?

A

Extinction en situation opérante libre

54
Q

Que pourra-t-on observer si on cesse les renforcements suite à une réponse au préalable renforcées. Nommez des comportements

A

L’extinction.

  • Augmentation de la variabilité du comportement

-Augmentation de L’agressivité

  • Résurgence d’autres comportements auparavant renforcés
  • Récupération spontanée (plus il y a de temps entre deux sessions d’extinction)
55
Q

De quoi dépend l’extinction

A

Combien de fois le comportement a été renforcé

Effort que prend le comportement

Le type et la taille du renforcement

Le plan de renforcement

56
Q

Est-ce que le renforcement est plus puissant que l’extinction

A

oui, plus de réponse non-renforcées que de réponses renforcées nécessaire. Pas 1:1.

57
Q

Est-ce que l’apprentissage est plus rapide que l’extinction

A

Oui

58
Q

Qu’est-ce qu’un plan progressif

A

À chaque réponse le requirent augmente d’un façon prédéterminée. Arithmétique = ajouter des nombre

géométrique = multiplier

59
Q

Qu’est qu’un plan de renforcement complexe

A

Plusieurs plans simples mis ensemble.

Multiple, mixte, en chaîne, tandem, coopératif, simultané

60
Q

Qu’est-ce que la tension de ratio

A

La tendance à performer va diminuer si le ratio est étiré trop brusquement. Les plans de ratio progressif en produisent inévitablement et atteignent un point de cassure

61
Q

Qu’est-ce que stretching the ratio

A

Un plan continu (FR 1:1) puis on étire progressivement le ratio FR3 , FR5. Entraînement à travailler beaucoup pour peu (rajout progressif de reponsabilité) C’est le façonnement de la persistance. Peut fonctionner avec plans intervalles, durées temps. Stretching de la contingence

62
Q

Qu’est-ce que la loi de la concordance

A

La proportion de réponses d’un individu à une option particulière correspond à la proportion de renforcements qu’il reçoit de cette option par rapport à l’ensemble des renforcements disponibles. Si le rat a le choix entre deux plans de renforcement il va alterner entre les deux. Tous les comportements sont une fonction de leurs conséquences.

63
Q

Quel est l’expérience et l’hypothèss de Tinklepaugh

A

Les organismes apprennent à attendre des renforçateurs particuliers.

Les singes qui s’attendent à des bananes sont déçus d’Avoir de la salade.

Explique les attentes, les stimuli (Sd) décide des attente que nous avons envers la conséquence

64
Q

Expliquer l’expérience d’Hammond et ses phases

A

Design ABAB

Tous les rats apprennent à utiliser la boîte et niveau de base.

  1. On récompense 5% des réponse (taux de réponse élevé) 3000 pression/ heure

2.Récompense 5% des réponses et 5% des non-réponses
Taux de réponse diminue graduellement presque 0.

3-4 : répétition 1 et 2

Les rats changent de réponse en fonction de la situation, ne passe pas par l’extinction . On peut apprendre de deux façon pas besoin d’éteindre le comportement, car une seule contingence est dispo comme disait Rescorla

65
Q

Qu’est-ce qu’un renforçateur pour pavlov

A

Un SI sont associés avec des SC. L’effet de prédiction, un attente ( Contingence et contiguïté) = apprentissage

66
Q

Qu’est-ce qu’un renforçateur pour Thorndike

A

les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli

La loi de l’effet est ce qui permet l’apprentissage. Dépend de ses conséquences

67
Q

QU’est-ce qu’un renforçateur pour Skinner

A

“un renforçateur est tout stimulus qui augmente la réponse qui le précède”.

Il pense que la conséquence fait par elle-même apprendre, la prédiction n’existe pas. On pourrait apprendre sans contingence selon lui.

68
Q

Qui est Clark Hull et quel est son apport

A

Vient de la psychométrie et l’hypnose. Béhavioriste modéré

Il assume existence des comportements non-observable.

propose S- x- R- C
La variable intermédiaire.

69
Q

Quelles sont les exigences de la variables intermédiaire de Hull

A

Hypothétique (non-observable)

Directement liée à. S et R

S doit permettre de faire des prédiction concrète sur le comportement. Elle ne doit pas nécessite l’ajout d’autre variables. Stabilité même dans la manipulation

70
Q

Qu’est-ce que la Tendance (drive)

A

Un déséquilibre de l’homéostasie crée un besoin, ce besoin a un corollaire psychologique (la tendance). Certains renforçateur primaires réduisent la tendance

71
Q

Quelle est la formule complète de Hull

A

E = ( H x D x K) - (nlc + Ic)

E= force du comportement o
h= Habit
D= Tendance
k= Incentive ( par le renforçateur lui-même)

nlc = inhibition non-conditionnée (fatigue)

Ic = inhibition conditionné (peur)

72
Q

Qu’est-ce que le passage du temps augmente selon Hull

A

La drive

73
Q

Est-ce que K (inventive) selon Hull peut être inhibiteur

A

Non ,aura simplement une faible valeur mais pas 0

74
Q

Qu’est-ce la trace interne du stimulus provoque selon Hull et sa théorie de la boîte noire

A

Une Récupération d’une habitude positive auquel on multiplie par la motivation (D) ainsi qu’un récupération d’une inhibition conditionnée auquel on ajout Ic (fatigue)

On calcule ensuite la différence

75
Q

Quelle est le principe de Premarck (relative value théorie)

A

Béhavioriste progressif puis cognitiviste. Théorie strictement empirique pas hypothétique

Les comportements eux même peuvent être des renforçateurs et certains comportements ont des valeurs relatives entre elles à un moment donné.

Expérience sur les cochons et leur préférence.

  1. En situation de libre choix les préférence contrôle
  2. Les exigence contrôle en situation contrôlée
76
Q

Quelle est la théorie de Timberlake et Allison

A

ce qui constitue un renforçateur change avec le contexte. Si on ne peut pas faire un comportement qu’on aime habituellement pas pendant un certain temps, on sera en deçà du niveau optimal et on pourra se servir de l’écart pour renforcer un autre comportement

77
Q

Expliquer l’expérience de Crespi

A

Tolman (père de la psycho cognitive)

L’expérience prouve que la loi de la pratique est la seule loi de l’apprentissage.

Phase 1 ; les rats sont séparés par trois groupes différents de la taille de la récompense

Phase 2: On met tous les rats à une récompense moyenne. les rats n’aillant pas eu de renforcement ont quand même appris. =

Apprentissage latent. (on ne le voyait pas avant, presque pas d’amélioration et puis BOOM gros pic lors du renforcement)

Cause un vide théorique car on n’apprend pas par la loi de l’effet (conséquence, contingence)

78
Q

Expliqué le Modèle de Mackintosh

A

V = a ( lambda - V)

Apprentissage est égale a l’attention multipliée par le maximum d’apprentissage possible moins l’apprentissage déjà. fait.

L’attention n’est pas une constante, diminue et augmente. Explique inhibition latente = attention diminue si stimuli présenté seul avant le pairage.

79
Q

De quel conditionnement fait objet l’expérience de Pearse & Hall 1

A

Conditionnement classique (lumière, choc)

80
Q

Expliquez le modèle de Pearce and Hall

A

Les stimuli non-compris attirent l’attention. AU contraire de Mackintosh qui propose que l’attention est attiré par les stimuli utiles.

DV = a ( I - V)

a = attention et dépend du degré de surprise. ci-bas.

I- V = la quantité de surprise.

81
Q

Expliqué L’expérience 1 de Pearce and Hall

A

Un groupe contrôle choc aléatoire et un groupe expérimentale lumière et choc, conditionnement retardé. 20 x pairage. Deuxième phase 20 pairage tous lumière et choc. Les rats contrôle ont plus appris et sursaute plus que les rats qui avait déjà appris = attention baisse, stimuli compris.

82
Q

Qu’est-ce que le modelage

A

Apprentissage vicariant, par observation

83
Q

Qui est Max Wertheimer

A

Fondateur de la Gestalt, le tout est plus grand que la somme des parties

84
Q

Qui est Noam Chomsky

A

Il a contribué à l’émergence de la psychologie cognitive, car elle est indissociable du langage. Le langage est universel, la grammaire est universelle.

Le langage s’appuie sur des règles de représentation mentales *processus cognitif.

85
Q

Qu’est-ce que la cognition?

A

L’acquisition, le maintien, la transformation et l’utilisation de l’information

86
Q

Les mesures de la mémoire

A

Rappel libre
Rappel indice
Le réapprentissage (revenir au niveau)
Reconnaissance
Appariement différé au modèle
Extinction
Gradient de dégradation (aplatissement de la généralisation)

87
Q

Les sources de l’oubli

A

Le degré de l’apprentissage (overlearning se dégrade moins vite)
(Fluency - bonne réponse/minute)

Apprentissage précédent
(peut avantager selon l’importance des apprentissages déjà fait ou désavantager selon interférence proactive)

Subsequent learning
(Remplacer le vieux par le nouveau = interférence rétroactive)

Changement dans le contexte

88
Q

Vrai ou faux ; Plus longue est la période entre l’apprentissage et le ré-apprentissage le plus d’oubli ?

A

Vrai

89
Q

Expliquer le modèle Atkinson et Shiffrin

A

Registre sensoriel communique avec mémoire à court terme (processus de contrôle, autorépétition, encodage, décision) et le comportement émane de la MCT

La MCT va vers la MLT à double sensé. La MLT a des réseaux sémantiques, expériences et images

90
Q
A