第十三章 学习 Flashcards
学习的一般概念
首先,行为以行为或行为潜能的改变为标志。学习是有机体获得个体行为经验的过程。经过学习,有机体将出现某些可观察的行为变化,可以完成一些以前无法完成的事情。
行为的改变有时是明显的、外在的,而有时是隐性的、潜在的。后者就是我们所说的“行为潜能”的改变。
个体行为的变化可能是由经验引起的,也可能是由成熟、疲劳或疾病引起的。前者是学习,而后者不是学习。
其次、学习引起的行为变化是相对持久的。无论是外显的行为变化还是行为潜能的变化,只有行为改变的持续时间较长,才可以称为学习。
正常的有机体来说,敏感化或习惯化都可能是短暂的,因而不能叫学习。但当敏感化和习惯化是由复杂刺激引起的,而行为改变成为持久的改变时,也可以称为学习。
最后,学习是由练习或经验引起的。经验(experience)有两个含义,既可以指个体通过活动直接作用于客观现实的过程,也可以指在这一过程中所得到的结果,如个体学会的知识、技能和形成的人生观等。
学习是在个体与环境的交互作用过程中产生的。有机体必须通过练习或经验才能使行为发生改变。有些行为的改变需要较长的时间、需要系统而反复的练习或经验,如学习某种动作技能;有些学习事先难以预料,也不需要多次重复。例如,在马路上看到有人由于闯红灯而造成车毁人亡的惨剧,仅仅一次经历就可以是你学习到遵守交通规则的重要性。
学习理论——经典条件反射的形成——无条件反射
食物吃到嘴里,引起唾液分泌增加,这是自然的生理反应,不需要学习,这种反应叫无条件反射(unconditioned reflex,UR);引起这种反应的刺激是食物,称为无条件刺激(unconditioned stimulus,UCS)。
学习理论——经典条件反射的形成——条件反射
研究助手的脚步声与狗的唾液分泌增加本来没有必然的联系,是一种无关刺激,或称为中性刺激(neutral stimulus,NS);当脚步声与食物同时、多次重复后,狗听到脚步声,唾液分泌就开始增加,这时中心刺激由于与无条件刺激结合而变成了条件刺激(conditioned stimulus,CS),由此引起的唾液分泌就是条件反射(conditioned reflex,CR)。
学习理论——经典条件反射的规律——习得
在条件刺激(CS)的与无条件刺激(UCS)之间建立联结的过程叫做条件反射的习得过程。在这个过程中,根据条件刺激与无条件刺激呈现的时间关系,条件作用可以分为同时性条件作用、延迟性条件作用和痕迹条件作用。
在同时性条件作用中,条件刺激与无条件刺激在时间上是完全同步出现的;在延迟性条件作用中,条件刺激先出现一段时间,在它还未消失时,无条件刺激开始出现,然后两种刺激同时消失;在痕迹条件作用中,条件刺激先出现,消失一段时间后无条件刺激才开始出现。在这三种不同的时间关系中,延迟性条件作用(条件刺激先出现0.5秒)最易形成条件反射;其次是同时性条件作用;最后是延迟时间增加的延迟条件和痕迹条件作用。如果条件刺激在无条件刺激之后才出现,即使有条件反射形成,其效果也是微弱的。
学习理论——经典条件反射的规律——消退
条件反射形成以后,如果得不到强化,条件反射会逐渐减弱,直至消失。例如,狗对铃声形成唾液分泌的条件反射后,得到了食物(强化),条件反射将进一步巩固;如果只给铃声不给食物,已经形成的条件反射就会消退。
学习理论——经典条件反射的规律——泛化和分化
泛化是指条件反射形成的初期,另外一些类似的刺激也会引起条件反射。例如,狗形成了对三声铃声的条件反射(唾液分泌)后,也会对一声或两声铃声作出相同的反应。新刺激越接近原来的条件刺激,泛化现象就越容易发生。
与泛化作用互补的是分化作用。它是指对事物的差异的反应。例如,狗可以学会只对三声铃声作出唾液分泌的条件反射,而对一声或两声铃声没有唾液分泌的反应。实现分化的手段可以是选择性强化或消退。
学习理论——经典条件反射的规律——二级条件作用
在已经形成的条件反射(如铃声引起唾液分泌)的基础上,能建立一种新的条件反射,称为二级条件作用(secondary conditioning)。例如,当铃声与唾液分泌的联结建立起来以后,将灯光与铃声反复伴随(无食物)出现,经过学习,灯光也会引起狗的唾液分泌。
在二级条件作用中,有机体在建立条件反射时不再需要借助于具有生物学力量的无条件刺激(如食物)。有机体可以在已有的条件反射的基础上建立新的、更复杂的条件反射。研究二级条件作用有助于我们理解人类的许多复杂行为。
学习理论——操作性条件反射——桑代克的尝试-错误学习理论
通过对动物学习行为的研究,桑代克提出了 尝试-错误(trial and error)学习理论。这一理论认为,学习的实质是通过“尝试”在一定的情景和特定的反应之间建立某种联结。在尝试中,个体会犯很多错误,通过环境给予的反馈,个体放弃错误的尝试而保留正确的尝试,从而建立起正确的联结,这就是学习。
桑代克认为,在尝试-错误的学习中,行为的后果是影响学习最关键的因素,如果行为得到了强化,证明尝试是正确的,行为就能保留下来,否则就会作为错误尝试而被放弃。总之,正强化会促进行为,而负强化或惩罚会消弱行为,桑代克称之为效果率(law of effect)。桑代克认为,效果率是学习的基本定律。
学习理论——斯金纳的操作性条件作用
通过研究,斯金纳认为存在两类学习,一类是由刺激情景引发的反应,斯金纳称之为应答性反应,与经典条件作用类似;另一类是操作性反应(operant conditioning),它不是由刺激情景引发的,而是有机体的自发行为。在日常生活中,人的绝大多数行为都是操作性行为。影响行为巩固或再次出现的关键因素是行为后所得到的结果,即强化(reinforcement)。
斯金纳区别了两种类型的强化——正强化和负强化。当环境中某种刺激增加而行为反应出现的概率也增加时,这种刺激物就是正强化物,这种现象就是正强化。例如,饥饿的白鼠按压杠杆得到食物,食物就是正强化物。当环境中某种刺激减少而行为反应出现的概率增加时,此种刺激就是负强化物,这种现象就是负强化。负强化物通常是一种厌恶刺激,是有机体力图回避的。例如,白鼠处于轻微的电击中,一旦按压杠杆,电击接触,停止电击就是负强化物,它同样能增加动物的压杆反应。需要注意的是,无论是正强化还是负强化,其结果都是增加行为再次出现的概率,促进行为的发生。
斯金纳认为,在行为实验中,强化方式是最容易控制的、最有效的变量。在精确控制的实验情景中,实验者可以精确地决定使用什么类型的强化,怎样给予强化和何时给予强化。强化的类型多种多样,包括连续强化和间隔强化、固定比例强化和变化比例强化、固定时间强化和变化时间强化。
其中连续强化是指每次行为之后都给予强化;间隔强化指间隔一定时间或比例才给予强化。固定比例强化指间隔一定的次数给予强化,如隔5次给予1次强化;而变化比例强化指每两次强化之间间隔的反应次数是变化不定的。固定时间强化指间隔一定的时间给予强化,如每隔5分钟给予一次强化;而变化时间强化指两次强化之间间隔的时间是变化的。
强化既能影响行为的习得速度与反应速度,也能影响行为的消退速度。
学习理论——班杜拉的社会学习理论
班杜拉提出了观察学习(observational learning)的概念,即通过他人的行为从而掌握运动技能、习得态度和其他行为,这一学习又可以称为榜样化(modeling)。
儿童模仿他人的动作、通过观察真实世界中的成人行为或通过看电视,既可以学习到攻击行为,也可以学习到友善与仁慈。同时,儿童也会从行为者的行为结果——强化与惩罚中进行学习,班杜拉将这种强化称为替代强化(vicarious reinforcement):当儿童观察到他人的行为受到奖励时,自己更倾向于表现出这种行为;当行为受到惩罚时,更倾向于较少地表现这种行为。
班杜拉还提出了内在强化(intrinsic reinforcement)的概念,也就是说强化不仅可以来自外界,也可以来自个体内心。儿童学会怎样画一颗五角星时体验到的喜悦、与同伴尽情玩耍时的畅快,都和来自外界的强化一样会增强儿童的行为。班杜拉认为,个体的任何人格特质,都是在社会环境中通过耳濡目染地向他人学习获得的,学习的主要途径是观察和模仿。对行为及其结果的观察使儿童作出某些行为,而这些行为本身得到的奖励或惩罚(内在的与外在的)又塑造着儿童未来的行为。