Final Flashcards
Quelle loi est à l’origine du conditionnement opérant , expliquez.
La loi de l’effet. La 1e à postuler que le comportement se renforce ou s’affaiblit suivant ses conséquences
Qu’est-ce qu’un essai discret
Une condition expérimentale qui a un début et une fin identifiable. Plus efficace, mais requiert une plus grande implication du chercheur
Qu’est-ce qu’une situation opérante libre
il n’y a pas d’essaie particulier, la réponse est disponible en tout temps mais pour une période déterminée d’avance, plus réaliste que l’essai discret. Le comportement cible ne met pas fin à l’essaie
Quelles sont les contributions de skinner
La boîte de skinner
la standardisation des méthodes
L’efficacité (plancher grillage)
Ordinateur pour automatisation
Le vocabulaire
Expliquer la terminologie du paradigme instrumentale
Sd -> R -> Sr
Sd = Stimuli discriminatif
R= réponse
Sr= Stimuli de renforcement
Situation de stimulation , une réponse est suivi d’un stimulus renforçant. (conséquence)
Est-ce que le paradigme S-S peut être appliqué au conditionnement instrumental
Non, car la réponse est apprise dans le conditionnement instrumentale
Est-ce que la curiosité existe dans le modèle instrumentale
Non, la pathologie non plus. La réponse sert à obtenir la récompense elle est instrumentale. Mais elle est volontaire, ce n’est pas un réflexe.
Quelles sont les similitudes du l’apprentissage instrumentale avec le conditionnement classique
Loi de la pratique
Loi de l’intensité des stimuli
Blocage et masquage
Extinction + récupération spontanée
Contiguïté
Contingence
Généralisation et discrimination
Qu’est-ce qui différencie le conditionnement classique du conditionnement opérant
La RC est automatique et prépare pour la RI.
Dans le conditionnement instrumentale la réponse est apprise et émise, elle nous amène à Sr.
Qu’est-ce qu’un renforcement
Toute situation Sd - R - C dans laquelle l’effet de C sur R est d’augmenter la probabilité de R
Qu’est-ce qu’une punition
Situation Sd - R - C dans laquelle C sur R diminue la probabilité de R,
3 caractéristique d’une expérience pour qu’elle soit considérée comme un renforcement
- le comportement doit avoir une conséquence
- Le comportement doit augmenter en force (plus de répétition)
- L’augmentation de la force doit venir de la conséquence
Qu’est-ce qu’une punition positif
Situation Sd- R - C pour laquelle la conséquence est l’apparition d’un stimuli aversif qui diminuera la probabilité de fréquence d’un comportement
Est-ce que le renforcement positif aide la motivation intrinsèque
Non
Qu’est-ce que le apprentissage par récompense
Le renforcement positif.
Est-ce que le renforcement négatif a un impact sur la motivation intrinsèque
Non
Qu’est-ce que l’apprentissage de l’évitement
Un renforcement négatif (on enlève un sentiment désagréable telle l’anxiété en évitant une situation)
Quelles sont les effets nocifs de la punition positive
Agressivité passive (bouderie, procrastination)
Intensification de l’agressivité chez le punisseur (le punisseur est renforcé d’avoir punit et le punit est renforcer d’avoir arrêter les comportements)
Apprentissage de l’agressivité par le puni
Comportement d’évitement de la punition
Les effets de renforcement
Augmentation force (probabilité ou fréquence)
Tendance d’un comportement à persister malgré disparition du renforcement
Tendance à se produire malgré un conséquence aversive
Tendance à persister malgré un effort supplémentaire requis
Tendance à persister malgré la disponibilité de renforçateur pour d’autre comportements
Qu’est-ce que l’inertie comportementale
La tendance d’un individu à maintenir un comportement actuel, même en présence d’Autres renforçateur pour d’autre comportements. Le comportement renforcé plusieurs fois est plus propice à persister malgré les obstacles.
Qu’est-ce que le façonnement
Le renforcement d’approximation d’un comportement pour mener plus rapidement au comportement souhaité.
Comment faire du façonnement
Débuter avec un critère large , renforcer successivement, augmenter graduellement le critère.
Quest-ce qu’un renforcement primaire
Ne dépend d’expériences d’apprentissage, ils sont innés phylogénétiques. Nourriture, eau, sommeil, sexe, stimulation électrique du cerveau, chaud, froid, contact social.
Certains renforçateurs primaires peuvent perdre de leur efficacité, le pouvoir de renforcement se perd graduellement
Qu’est-ce qu’un renforçateur secondaire
Pas innés, résultent de l’apprentissage. Acquiert leur force par le biais d’association avec d’autres stimuli. Ses propriétés renforçatrice viennent de avec quoi il est paré.
Raconnaissance , applaudissement,
Est-ce que les renforcements secondaires sont plus facile à arriver à satiation
Non, ils arrivent à satiation moins rapidement que les renforçateurs primaires, mais leur efficacité dépends de la force d’association avec le primaire
Est-ce que les renforcements secondaires sont plus flexible
Oui, car les renforçateur primaire dépendent du besoin. Si le rat n’a pas faim ne pourra pas faire un comportement tandis que si associé avec un clicker ou une lumière, fera le comportement
Qu’est-ce qu’un renforcement généralisé
Un renforcement secondaire qui a été associé à plusieurs renforcement spécifique, qui va renforcer un large éventail de comportements (Argent)
Qu’est-ce qu’un renforcement naturel
Suit naturellement un comportement, pédaler sur un vélo, brosse ses dents (bonne haleine)
Qu’est-ce qu’un renforcement artificiel
Quelque le donne dans le but de modifier un comportement
Des quoi dépendent les effets de renforcements
La contingence (degré de corrélation entre le comportement et sa conséquence)
La contiguité (délais entre comportement et réponse)
Le renforcement différé signalé marche mieux que le renforcement différé seul
Caractéristiques des renforcements (la magnitude, différence qualitative)
Caractéristiques des comportements (affecte la facilité avec lequel peut être renforcé)
Comment on fait l’apprentissage d’une chaîne de comportements
Commencer par la dernière étape et à chaque étape l’étape précédente renforcée doit être visible. En ordre inverse. Peu de validité écologique
Quels sont les deux type d’opération de motivation
Opération motivantes établissantes (augmente l’efficacité de la conséquence, la valeur d’un renforçateur : privation de nourriture)
Opération motivation abolissantes. diminue l’efficacité de la conséquence : drogues réduisent efficacité de la nourriture.
Qu’est-ce que des contingence concurrentes
Plusieurs contingences (relations entre conséquences et comportements) en même temps. ces contingences peuvent être en concurrence les unes avec les autres )
Toute punition est une agression
Vrai
Qu’est-ce que le renforcement continu
Chaque réponse est suivit d’une renforcement. Augmentation rapide du débit de réponse. Très rare dans l’environnement naturel
Qu’est-ce que le Renforcement partiel
Chaque réponse n’est pas nécessairement suivi d’un renforcement
Quels sont les effets du renforcement partiel
Ralentissement de la courbe d’apprentissage
Résistance à l’extinction (changement moins facilement détectable)
Apprend la persistance car la 1. discrimination est difficile :
contraste moins clairs
ambiguïté de contingence
Incertitude quant à l’obtention peut mener à + de persistance.
- La frustration : primitivisassion des comportements, réponse instinctive, névrose expérimentale quand la tache est trop complexe. Dans un plan de renforcement partiel l’animal est habitué à la frustration qui est éventuellement renforcé. La frustration est un indication qu’un renforcement viendra
Qu’est-ce qu’un plan à ratio fixe
Un nbr déterminé de réponse = renforcement
FR 3:1 FR 2:1
FR 1:1 = renforcement continu
Qu’est-ce qu’une pause post-renforcement et dans quel type de plan de renforcement
Une pause suivant l’obtention des renforcements ( fatigue ou consommation)
La longueur de la pause dépend du ratio, peut faire d’autres comportements renforçants pendant la pause (se laver, aller au toilettes)
Plan à ratio fixe et plan à ratio variable.
Qu’est-ce qu’un plan à ratio variable
Le nombre de réponse varie d’un renforcement à l’autre, peut arriver entre tant et tant de réponse mais varie autour d’une moyenne
Effort élevé et constant, pause post-renforcement moins fréquente + courte. Dépendance (machine à sous)
Qu’est-ce qu’un plan à intervalle fixe
L’intervalle est une période réfractaire dans laquelle le renforcement n’est pas disponible déclenchée par la 1e réponse.
Une seule réponse est nécessaire après l’intervalle. La durée de l’intervalle ne change pas. Effort élevé à la fin de l’intervalle, réponse isolées et espacées dans le temps (scalloped graph)
PLan à intervalle variable
La longueur de l’intervalle varie autour d’une moyenne mais change d’un renforcement à l’autre.
Rythme de réponse lent mais constant,, quand la récompense n’est pas un besoin urgent les réponses sont plus lentes. Le niveau de désir régule le rythme de la réponse
Dans quel type de plan de renforcement voit on une réponse à haute fréquence et suivi d’une pause post-renforcement?
Plan à ratio fixe
Dans quel type de plan voit ont un effort élevé constant et peu de pause post-renforcement
PLan à ratio variable
Dans quel type de plan voit-on un effort élevé à la fin d’une période et des réponses isolées et espacées dans le temps
Plan à intervalle fixe
Dans quel type de plan voit on un rythme de réponse lent et constant, linéaire et stable.
Plan à intervalle variable
Dans quel type de plan le niveau de désir régule le rythme de la réponse
PLan à intervalles variables
Qu’est-ce que le façonnement permet de faire
Rendre un comportement peu probable, probable en quelques minutes
Est-ce que Thorndike connaissait le façonnement
Non , boite de thorndike = essaie erreur (essaie discret)
Est-ce que le façonnement peut se produire dans l’environnement naturel ?
Oui, éducation des enfants. Certains comportement sont plus adaptés à l’environnement et ce dernier les sélectionnera et d’autres s’éteindront. C’Est le moyen par lequel de vieux comportement en forment des nouveaux
Comment bien façonner un comportement
Renforcer le plus petits pas et donner des renforcements immédiats. Renforcer la meilleure approximation disponible. Être prêt à descendre le standard des fois (step back)
Quels sont les deux formes de chaînes d’apprentissage
Forward and backward
Est-ce que les chaînes d’apprentissage sont dans l’environnement naturel
Oui, forme la plupart des routines établies
Qu’est-ce que l’augmentation de la fréquence de la réponse immédiatement après l’arrêt du renforcement
Un pic d’extinction
Qu’est-ce qu’un plan à ratio fixe qui nécessite un nombre infini de réponse ?
Extinction en situation opérante libre
Que pourra-t-on observer si on cesse les renforcements suite à une réponse au préalable renforcées. Nommez des comportements
L’extinction.
- Augmentation de la variabilité du comportement
-Augmentation de L’agressivité
- Résurgence d’autres comportements auparavant renforcés
- Récupération spontanée (plus il y a de temps entre deux sessions d’extinction)
De quoi dépend l’extinction
Combien de fois le comportement a été renforcé
Effort que prend le comportement
Le type et la taille du renforcement
Le plan de renforcement
Est-ce que le renforcement est plus puissant que l’extinction
oui, plus de réponse non-renforcées que de réponses renforcées nécessaire. Pas 1:1.
Est-ce que l’apprentissage est plus rapide que l’extinction
Oui
Qu’est-ce qu’un plan progressif
À chaque réponse le requirent augmente d’un façon prédéterminée. Arithmétique = ajouter des nombre
géométrique = multiplier
Qu’est qu’un plan de renforcement complexe
Plusieurs plans simples mis ensemble.
Multiple, mixte, en chaîne, tandem, coopératif, simultané
Qu’est-ce que la tension de ratio
La tendance à performer va diminuer si le ratio est étiré trop brusquement. Les plans de ratio progressif en produisent inévitablement et atteignent un point de cassure
Qu’est-ce que stretching the ratio
Un plan continu (FR 1:1) puis on étire progressivement le ratio FR3 , FR5. Entraînement à travailler beaucoup pour peu (rajout progressif de reponsabilité) C’est le façonnement de la persistance. Peut fonctionner avec plans intervalles, durées temps. Stretching de la contingence
Qu’est-ce que la loi de la concordance
La proportion de réponses d’un individu à une option particulière correspond à la proportion de renforcements qu’il reçoit de cette option par rapport à l’ensemble des renforcements disponibles. Si le rat a le choix entre deux plans de renforcement il va alterner entre les deux. Tous les comportements sont une fonction de leurs conséquences.
Quel est l’expérience et l’hypothèss de Tinklepaugh
Les organismes apprennent à attendre des renforçateurs particuliers.
Les singes qui s’attendent à des bananes sont déçus d’Avoir de la salade.
Explique les attentes, les stimuli (Sd) décide des attente que nous avons envers la conséquence
Expliquer l’expérience d’Hammond et ses phases
Design ABAB
Tous les rats apprennent à utiliser la boîte et niveau de base.
- On récompense 5% des réponse (taux de réponse élevé) 3000 pression/ heure
2.Récompense 5% des réponses et 5% des non-réponses
Taux de réponse diminue graduellement presque 0.
3-4 : répétition 1 et 2
Les rats changent de réponse en fonction de la situation, ne passe pas par l’extinction . On peut apprendre de deux façon pas besoin d’éteindre le comportement, car une seule contingence est dispo comme disait Rescorla
Qu’est-ce qu’un renforçateur pour pavlov
Un SI sont associés avec des SC. L’effet de prédiction, un attente ( Contingence et contiguïté) = apprentissage
Qu’est-ce qu’un renforçateur pour Thorndike
les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli
La loi de l’effet est ce qui permet l’apprentissage. Dépend de ses conséquences
QU’est-ce qu’un renforçateur pour Skinner
“un renforçateur est tout stimulus qui augmente la réponse qui le précède”.
Il pense que la conséquence fait par elle-même apprendre, la prédiction n’existe pas. On pourrait apprendre sans contingence selon lui.
Qui est Clark Hull et quel est son apport
Vient de la psychométrie et l’hypnose. Béhavioriste modéré
Il assume existence des comportements non-observable.
propose S- x- R- C
La variable intermédiaire.
Quelles sont les exigences de la variables intermédiaire de Hull
Hypothétique (non-observable)
Directement liée à. S et R
S doit permettre de faire des prédiction concrète sur le comportement. Elle ne doit pas nécessite l’ajout d’autre variables. Stabilité même dans la manipulation
Qu’est-ce que la Tendance (drive)
Un déséquilibre de l’homéostasie crée un besoin, ce besoin a un corollaire psychologique (la tendance). Certains renforçateur primaires réduisent la tendance
Quelle est la formule complète de Hull
E = ( H x D x K) - (nlc + Ic)
E= force du comportement o
h= Habit
D= Tendance
k= Incentive ( par le renforçateur lui-même)
nlc = inhibition non-conditionnée (fatigue)
Ic = inhibition conditionné (peur)
Qu’est-ce que le passage du temps augmente selon Hull
La drive
Est-ce que K (inventive) selon Hull peut être inhibiteur
Non ,aura simplement une faible valeur mais pas 0
Qu’est-ce la trace interne du stimulus provoque selon Hull et sa théorie de la boîte noire
Une Récupération d’une habitude positive auquel on multiplie par la motivation (D) ainsi qu’un récupération d’une inhibition conditionnée auquel on ajout Ic (fatigue)
On calcule ensuite la différence
Quelle est le principe de Premarck (relative value théorie)
Béhavioriste progressif puis cognitiviste. Théorie strictement empirique pas hypothétique
Les comportements eux même peuvent être des renforçateurs et certains comportements ont des valeurs relatives entre elles à un moment donné.
Expérience sur les cochons et leur préférence.
- En situation de libre choix les préférence contrôle
- Les exigence contrôle en situation contrôlée
Quelle est la théorie de Timberlake et Allison
ce qui constitue un renforçateur change avec le contexte. Si on ne peut pas faire un comportement qu’on aime habituellement pas pendant un certain temps, on sera en deçà du niveau optimal et on pourra se servir de l’écart pour renforcer un autre comportement
Expliquer l’expérience de Crespi
Tolman (père de la psycho cognitive)
L’expérience prouve que la loi de la pratique est la seule loi de l’apprentissage.
Phase 1 ; les rats sont séparés par trois groupes différents de la taille de la récompense
Phase 2: On met tous les rats à une récompense moyenne. les rats n’aillant pas eu de renforcement ont quand même appris. =
Apprentissage latent. (on ne le voyait pas avant, presque pas d’amélioration et puis BOOM gros pic lors du renforcement)
Cause un vide théorique car on n’apprend pas par la loi de l’effet (conséquence, contingence)
Expliqué le Modèle de Mackintosh
V = a ( lambda - V)
Apprentissage est égale a l’attention multipliée par le maximum d’apprentissage possible moins l’apprentissage déjà. fait.
L’attention n’est pas une constante, diminue et augmente. Explique inhibition latente = attention diminue si stimuli présenté seul avant le pairage.
De quel conditionnement fait objet l’expérience de Pearse & Hall 1
Conditionnement classique (lumière, choc)
Expliquez le modèle de Pearce and Hall
Les stimuli non-compris attirent l’attention. AU contraire de Mackintosh qui propose que l’attention est attiré par les stimuli utiles.
DV = a ( I - V)
a = attention et dépend du degré de surprise. ci-bas.
I- V = la quantité de surprise.
Expliqué L’expérience 1 de Pearce and Hall
Un groupe contrôle choc aléatoire et un groupe expérimentale lumière et choc, conditionnement retardé. 20 x pairage. Deuxième phase 20 pairage tous lumière et choc. Les rats contrôle ont plus appris et sursaute plus que les rats qui avait déjà appris = attention baisse, stimuli compris.
Qu’est-ce que le modelage
Apprentissage vicariant, par observation
Qui est Max Wertheimer
Fondateur de la Gestalt, le tout est plus grand que la somme des parties
Qui est Noam Chomsky
Il a contribué à l’émergence de la psychologie cognitive, car elle est indissociable du langage. Le langage est universel, la grammaire est universelle.
Le langage s’appuie sur des règles de représentation mentales *processus cognitif.
Qu’est-ce que la cognition?
L’acquisition, le maintien, la transformation et l’utilisation de l’information
Les mesures de la mémoire
Rappel libre
Rappel indice
Le réapprentissage (revenir au niveau)
Reconnaissance
Appariement différé au modèle
Extinction
Gradient de dégradation (aplatissement de la généralisation)
Les sources de l’oubli
Le degré de l’apprentissage (overlearning se dégrade moins vite)
(Fluency - bonne réponse/minute)
Apprentissage précédent
(peut avantager selon l’importance des apprentissages déjà fait ou désavantager selon interférence proactive)
Subsequent learning
(Remplacer le vieux par le nouveau = interférence rétroactive)
Changement dans le contexte
Vrai ou faux ; Plus longue est la période entre l’apprentissage et le ré-apprentissage le plus d’oubli ?
Vrai
Expliquer le modèle Atkinson et Shiffrin
Registre sensoriel communique avec mémoire à court terme (processus de contrôle, autorépétition, encodage, décision) et le comportement émane de la MCT
La MCT va vers la MLT à double sensé. La MLT a des réseaux sémantiques, expériences et images