XIV - instrumentalno učenje Flashcards
R ili ponašanje koje se uči
predstavlja sredstvo ili instrument za postizanje nekog cilja - isključivo zbog toga je i bilo naučeno.
Zakon efekta
R i ponašanja bivaju učvršćena ako dovode do +ef. ili eliminisana ako dovode do -ef.
karakteristike IU
1) Organizam mora da bude motivisan
2) Organizam vrši raznovrsne radnje pokušavajući da postigne određeni cilj – zadovoljenje motiva
3) Jedna od slučajno izvršenih radnji dovodi do postizanja cilja – objekta ili situacije koja može da zadovolji postojeći motiv
4) Radnja koja je dovela do ostvarenja cilja se učvršćuje, dok ostale bivaju eliminisane.
razlike KU i IU
1) Kod KU, R koja se usl. je povezana sa BD, a kod IU organizam spontano emotuje tu reakciju.
2) Redosled davanja D je različit: kod KU prvo ide BD pa reakcija koja se uči, a kod IU prvo ide reakcija koja dovodi do BD (nagrada, potkrepljenje) - nagrada se dobija tek po izvršenoj radnji.
3) Razlika u funkciji R: kod IU naučena R je sredstvo dolaženja do cilja, što kod KU nije slučaj (salivacija nije sredstvo za dobijanje hrane).
Torndajk, učenje putem pokušaja i pogrešaka
pokušaji slepi i da se slučajno dolazi do uspeha, pa je potpunije nazvao: “učenje putem slepih pokušaja i slučajnih uspeha”.
Skiner, razlika između respodentnog i operantnog
respodentno - (klasično, jer BD soigurno izaziva odgovor)
operantno - (instrumentalno, jer je tačna R operativna u odnosu na sp. sredinu)
Skiner, S-usl. i R-usl.
S-usl. - S od KU
R-usl. - R od odgovor za IU.
Skiner o IU
organizam spontano emotuje određene R, jedna bude tačna - to njemu ne znači da te R nemaju nikakav uzrok, već samo da u sp. sredini ne možemo da nađemo D za koje bi se reklo da izazivaju tu R.
Pavlov
otkrio uslovni refleks tipa II.
oblici IU, Grantova klasif, zasnovana na logickoj analizi S i R varijabli
- Učenje putem nagrađivanja
- Sticanje R bežanja
- Sticanje R izbegavanja
- Učenje putem kažnjavanja
- Diskriminatorno operantno učenje
- Omisiono učenje - uobičajena radnja izostaje ako organizam izvrši specifičnu R.
Razranova klasifikacija IU
pokušaj da utvrdi principijelno nezavisne oblike instrumentalnog učenja - on svoje klasifikacije zasniva na filogenetskim i fiziološkim podacima.
najjednost. - Uč putem kažnj.
Uč putem nagrađivanja, viši je oblik od klasičnog,
sticanje R bežanja i izbegavanja se ne razlikuje od Uč nagrađivanjem.
uč putem nagrađivanja, Torndajkov exp.
Kavez, unutra mačka, sačinjen je od letava mačka može da vidi hranu.
Ideja je bila da mačka otvori vrata aktivirajući određeni mehanizam (pritiskajući pokugu, povlačenjem omče itd.).
Ponašanje mačaka: Prvo pokušava šapom kroz letve da dohvati hranu, pa da se probije između letava. Često se nakon toga javlja agresivno ponašanje. Nekad posle toga seda u jedan deo kaveza i posmatra situaciju, pa se diže i ponavlja se situacija.
U nizu pokušaja, mačka ponekad dolazi do mehanizma za otvaranje, nekad ga glavom dodiruje i napušta. Najzad se desi da ona uspe da aktivira mehanizam i vrata se otvaraju.
Ponekad, u početku, mačka to ni ne primeti. Pokušaj je završen izlaskom životinej iz kaveza i dolaženjem do nagrade. Mačka kada se ponovo stavi u kavez, ponavlja ponašanje iz prethodnog pokušaja. ALI, iz pokušaja u pokušaj, broj pogrešnih R je sve manji i brže se dolazi do tačne R. Na kraju niza pokušaja, mačka rešava problem neposredno i direktno.
Objašnjenje učenja putem pokušaja i pogrešaka; uzroci učvršć. tačne i elimin. pogrešne R
Torndajk: poziva se na dva postojeća zakona asocijacije (postavio Tomas Braun): zakon svežine i zakon učestalosti i postulira novi zakon - zakon efekta.
zakon učestalosti
tendencija da se Repr. one ideje koje su u prošlosti najčešće bile međusobno povezane.
U Torndajkovom exp, najFr bi bila tačna R– mora se izvršiti na kraju svake seanse.
PRIMEDBA: na početku exp. se neke pogrešne R ponavljaju veoma često, a tačna R se izvrši samo jednom. -> postoji značajniji faktor od učestalosti.
zakon efekta
nagrađivanje tačne R je bitno za Uč, a ona se učvršćuje, jer neposredno dovodi do cilja.
Torndajk: zakon ima automatsko dejstvo na Uč.
Šematski prikaz zakona efekta (ZE)
ovaj prikaz predlaže Maurer. ZE obuhvata i dejstvo nagrade i dejstvo kazne.
Postoji neki S koji izaziva određenu R.
Ako ta R dovede do nagrade - biće učvršćena u sledećoj fazi.
Ako ta R dovede do kazne – biva oslabljena.
Učenje putem nagrađivanja, Skinerova kutija
unutra je mala poluga i činija za hranu. Kada se poluga pritisne, akt. se magacin sa hranom, pušta zrno hrane u činiju. Nekad je tu i izvor svetlosne ili zvučne draži - tada pritisak poluge oslobađa hranu samo ako je prethodno dat zvučni ili svetlosni signal (diskriminatorno operantno učenje).
pacovi i golubovi – pacovi pritiskaju polugu, a golubovi obično kljucaju dugme koje je na pozadini određenog oblika ili boje.
ponašanje Ž: slično kao kod Torndajkovog exp. Posle niza neuspešnih radnji, životinje slučajno pritisnu polugu i dobiju hranu. Fr pritisaka govori o jačini stečene navike.
Prednosti Skinerovog kaveza:
Radnje u kavezu su automatizovane. Eksperimentator ne mora sve vreme da nadgleda životinju.
Učenje se takođe ne deli na pojedine pokušaje koje kontroliše eksperimentator.
Pritisak poluge automatski dovodi do zapisivanja izvršene reakcije.
Posle svakog pritiska, pero koje vrši zapisivanje se podiže i dobijamo kumulativnu krivu.
Što je nagib krivulje veći, životinja brže pritiska polugu.
Skinerova metoda apsoksimacije i oblikovanja
postupak: čekanje da životinja načini tačnu R, pa da onda bude nagrađena - ovo je u priličnoj meri neuspešno.
eliminisao, Skiner je osmislio metodu aproksimacije ili oblikovanja.
ne čeka da Ž izvrši u potpunosti željenu R, već nagrađuje prvu aproksimaciju željenom odgovoru.
Postepeno se taj kriterijum nagrađivanja povišava i tako se postepeno oblikuje željeno ponašanje. Tako je Skiner postepeno naučio goluba da pravi osmice kretanjem.
Dresura životinja
Skinerova metoda aproksimacije uspešno primenjena
Metoda aproskimacije i programirano učenje
Umesto da se čeka da učenik pročita veći deo gradiva, pa ga tek onda ponovi, Skiner predlaže da se gradivo podeli na sitne jedinice gradiva, predaje logičkim redosledom, i da se obaveštenja o tačnosti odgovora daju neposredno. -> nastaje moderno programirano učenje
Značaj IU za čoveka
- Motorne veštine i navike se većinom stiču ovom metodom
- Veliki broj crta i osobina ličnosti
- Nagrada je oduvek bila najmoćnije sredstvo vaspitanja…
UČENJE, STICANJE R BEŽANJA
Organizam nalazi način da se ukloni, da pobegne iz situacije koja je bolna ili neprijatna na bilo koji način.
exp, Dolard i Miler, sticanje R bežanja
dve spojene komore, između njih je mali prolaz. Podovi obe komore sastoje se od rešetkaste žice koja može da bude elektrificirana (može svaka komora pojedinačno).