College 5: Reinforcement, stimuli van discriminatie en generalisatie Flashcards
continous reinforcement
Wanneer gedrag aangeleerd wordt, is het van belang om bij iedere keer dat het gewenste gedrag vertoont wordt te belonen (consequent)
Als het gedrag eenmaal is aangeleerd is, is het van belang om gebruik te maken van een variabel schema van bekrachtigen. (voorkomen van extinctie)
fixed-ratio schema
wordt na een vast aantal responsen een beloning gegeven
FR1: elke keer op het potje plassen is een knuffel
FR3 elke 3 sommen een compliment
FR30 elke 30 dagen gewerkt salaris
variabele-ratio schema
na een gemiddeld aantal responsen een beloning gegeven. Hierdoor wordt het onvoorspelbaarder voor degene die beloond wordt.
VR1: soms na 1, soms na 2 keer een knuffel
VR3: na 1, 2, 3, 4, of 5 sommen lof, dus gemiddeld na drie sommen belonen
VR30, na 29, 30, 31 dagen werken salaris
duratie schema
gekeken naar de duur van de RESPONS. Hierij moet het gedrag gedurende een periode van tijd constant aanwezig zijn. Een voorbeeld hiervan is wanneer iemand 30 minuten moet studeren, om daarna 15 minuten piano te mogen spelen. Hij moet dan wel eerst x aantal minuten (in dit geval 30) hebben gestudeerd
Interval schema
gedrag dat wordt bekrachtigd na een bepaalde tijd ongeacht hoe vaak het gedrag heeft plaatsgevonden
Limited hold (LH)
tijdsbestek waarbinnen een reactie moet plaatsvinden. BV. binnen 10 minuten moet kamer opgeruimd zijn
Stimulusdiscriminatie (Sd) en stimulusextinctie (Sdelta)
gekeken naar niveau van antecedenten.
Aan de hand van de Skinnerbox: Rat kreeg eten bij groen licht, geen eten bij rood. Antecedent was dus rood/groen licht en obv kon de rat voorspellen of het wel of geen eten kreeg.
Groen licht is dus de stimulusdiscriminatie en stimulusextinctie was het rode licht want rat leerde dat dan het eten niet kwam.
Stimulus extinctie is het weten of het gedrag bekrachtigd gaat worden of niet. (NIET HETZELFDE ALS STRAF) gaat over de juiste tijd en plaats (inschatten wanneer je het dus wel krijgt)
Absolute stimulus controle
meeste kans op respons bij een getrainde stimuluswaarde. Het gaat om leren obv ervaring. Zo is het stoppen bij rood licht aangeleerd gedrag
Relatieve stimuluscontrole
reageren op verschillen tussen stimuli. Soms kan iets niet goed worden aangeleerd, omdat het een nieuwe situatie is, waardoor je niet kan vertrouwen op die aangeleerde ervaring.
In dat geval ga je vooral reageren op de verschillen tussen de (vaak nieuwe) stimuli, zoals gezichten en lichaamshouding om te bepalen met wie je een praatje gaat maken. Je kan dan niet terugvallen op wat je hebt aangeleerd, maar wel wat je weet over aardige en niet-aardige gezichten.
stimulusgeneralisatie
op het moment dat gedrag voldoende is aangeleerd, is vaak te zien dat er sprake is van stimulusgeneralisatie: als men een beetje verschillende stimuli laat horen die net verschilt dan wat is aangeleerd kan het nog steeds gekoppeld worden aan hetzelfde gedrag.
transfer van getrainde gedrag naar de natuurlijke omgeving
responsgeneralisatie
ontwikkeling van nieuw gedrag dat nog niet eerder getraind is. Maar wel zelfde respons bij een andere stimulus. Denk aan de flesjes en baby’s. Baseert op eerdere ervaring bij dingen waarmee wel is geoefend.
ofwel gewoon het generaliseren van de reactie op verschillende situaties.
behaviour maintenance
het getrainde gedrag blijft bestaan na verloop van tijd
establishing operation
tijdelijke reinforcer effectiever en maaktk dat gedrag dat in het verleden tot de reinforcer leidde (tijdelijk) meer waarschijnlijk.
BV. als iemand lang niet mag gamen, wordt het aantrekkelijker om te gamen en heeft hij er waarschijnlijk ook meer voorover om die beloning te bereiken. Sprake van meer motivatie
abolishing operation
maakt (tijdelijk) de reinforcer minder effectief en maakt gedrag dat in het verleden tot de reinforcer leidde (tijdelijk) minder waarschijnlijk. Hierbij wordt motivatie weggenomen. Als je heel veel toegang hebt gehad tot de bekrachtiger, wordt deze minder aantrekkelijk en heb je er minder voor over om daar iets voor te doen
Intermittent reinforcement
een methode waarbij een gedrag met tussenpozen positief wordt versterkt in plaats van telkens wanneer het zich voordoet
reactiesnelheid verwijst naar het aantal keren dat een gedrag zich voordoet in een bepaalde periode.
schema van versterking is een methode die specificeert welke voorvallen van een bepaald gedrag, indien aanwezig, moeten worden versterkt.