身边的心理学-第16节
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
克拉克·赫尔(Clark ;Hull)提出了另一个原因。
他觉得联接实际上是先在条件刺激和无条件反应之间建立,然后变成了条件刺激和条件反应的连接。
这一次,科学家们表现出了他们最大的创造性,他们想到了一个实验,通过让两种理论预测实验的结果,来对两种理论进行对比。
我们需要他们的创造性,来设计一个关键的实验测试。
霍兰德和史韬布开始了对这个理论的印证,他们利用噪音和食物粒对老鼠做了实验。
按照巴甫洛夫的理论,老鼠所学会的是在噪音和食物之间建立连接。
霍兰德和史韬布要让巴甫洛夫的理论和赫尔的理论能够对比。
两个人的实验是这样的:他们让食物成为没有吸引力的无条件刺激。
他们把老鼠放到一个唱机转盘上,把老鼠转得头晕恶心。
之后,他们又呈现噪音,这时老鼠没有反应。
巴甫洛夫认为,最开始的联系是在噪音和食物之间的。
但是赫尔预测,降低无条件刺激的效果,并不会使老鼠的反应有什么区别,因为他认为最关键的连接是在噪音(条件刺激)和进食(无条件反应)之间。
这的确有区别。
赫尔的理论认为,连接是在噪音和反应之间,即噪音和进食之间。
他认为把老鼠放在唱机上转晕使得食物没有吸引力以后,实验的结果不应该有什么变化。
赫尔错了。
在条件刺激和无条件刺激之间一定有某种联系。
我们不能忽略这个联系在反应链中的作用。
所以,还是巴甫洛夫伟大!他的理论不是僵化的,相反,他的理论很灵活,有预测性。
但是学习的过程远没有终止。
请阅读第9章来学习更多关于学习的知识。
第9章
桑代克的猫和斯金纳的老鼠本章提要
'68'第68节:第四部分 向正确的目标进攻(8)
接受条件刺激
强化行为
惩罚犯人
和消退作斗争
按时奖励
运动员也许是我们周围最迷信的人,只有赌博的人比他们更迷信。
我在大学打棒球时,有一个队友,是个投手,一直穿着同样的汗衫,只要赢球,就不洗这件衣服。
因此我有点希望我们输球,这样他就能洗洗衣服。
还有些运动员很幸运,无需付出太多的努力,或者只是按照详细的日程表训练就可以保持持续的高分纪录或者不断夺取胜利。
我也有些迷信的地方。
我总是不能用棒球杆把其中一只防滑鞋的脏东西弄掉。
我不得不清理两只鞋,即使其中一只是干净的。
在场地奔跑的时候,我从来都不踩到粉笔划的线上。
其他队员也从来不问我这是什么迷信做法;他们也有自己的怪僻。
当我开始学心理学时,我想:我那些迷信的思想是怎么来的?我怎么能知道如果踩在画线上比赛就会不顺?一定是有时候当我踩在画线上时我输球了。
我看到了自己的行为(踩到了画线上)和后果(我输球了)的联系。
我在自己的行为和后果之间建立了联系。
这个例子中,是行为和负面结果的联系。
心理学家把这称作迷信式学习。
无论联系是正面的还是负面的,当我在所做的事和随后产生的后果之间建立起实际的联系时,我就学到了一种特殊的学习方法。
我们已经学会了如果我们做A,结果就会是B。
行为心理学家或者学习心理学家把所有的学习都看作是一种条件作用,一种在不同事件之间建立联系的学习。
第8章介绍了经典条件反射,一种在两个事件间建立相互联系的学习方式。
本章我将介绍操作性条件反射,学习重要的事件必然会导致某种特殊的反应。
我知道——这听起来有些太理论化了。
想象这样一种情况:我每个月都领工资。
难道付给我工资只是让我坐在那儿占地方吗?不,付给我工资是因为我尽到了我的责任,是因为我工作了。
我做了什么事,就得到什么结果。
我工作,别人付我工资。
如果不挣钱,我还会工作吗?很可能不。
原因有二。
首先,比起免费工作,我有更好的事情去做。
(我的信用卡债主也不会乐意我这么做。
)其次,按照操作性条件反射理论,我工作是因为有人付钱。
我的工作行为背后的那种“东西”就是回报,一个正面的结果。
大卫·利波曼在1993年提出,操作性条件反射之所以得名,是因为反应就是要操作环境来产生结果。
更多热门小说,请访问宜搜小说搜索(b。easou)
'69'第69节:第四部分 向正确的目标进攻(9)
第9章桑代克的猫和斯金纳的老鼠第四部分向正确的目标进攻操作性条件反射随处可见,家里有,上班的地方也有。
父母使用奖赏或者操作性条件反射使他们的孩子做功课。
下面我们来详细了解操作性条件反射。
拥抱桑代克颤抖的小猫从前面的介绍,你已经知道,我们做了什么事,就得到什么结果。
那是什么样的结果呢?我每个月都去工作,所以手里的工资条肯定对我有影响。
回到1911年,爱德华·桑代克创立了一个理论,叫做效果律,这个定律阐明,我们对结果的看法会影响我们的行为。
桑代克决定用猫做实验来研究这个现象。
他用木板和石板建了一个叫迷笼的箱子,门可以用一个特殊的装置打开。
他在箱子里放了一只饿猫,然后关上门,再在箱子外面的碟子里放些食物,猫可以通过箱子的空隙看到食物。
有点残忍,是吧?猫想穿过板子够食物,可是够不着。
唯一的方法是桑代克或者猫能把门打开。
我们知道桑代克是不会开门的;他在做实验。
猫必须自己想办法来把门打开。
不知道你有没有见过,反正我很少见过猫开门的样子。
它怎么办?有些悬念,是吧?我们题目中的主角英雄的猫会怎么做?它会打开门扑向刚刚还够不着的食物吗?或者它会因此命丧这位残忍的心理学家之手?且听下回分解……无论如何,这只猫必须自己想办法,桑代克也是个耐心的人。
他等啊瞧啊,等啊瞧啊。
猫在笼子里到处走动,伸出它的小爪子,喵呜喵呜,跳起来,又被墙弹回来,在箱子里无目的地尝试各种出去的方法。
但是,奇怪的事发生了。
猫无意中碰到了门闩,门奇迹般地开了!哇!猫有得吃了,大家皆大欢喜。
桑代克从他的实验中学到了什么?什么都没学到,实验还没有结束呢。
他把那只可怜的猫又放回笼子里,重新进行实验。
没问题,对吧?猫肯定知道怎么做——只需碰一下门闩即可。
但是当回到笼子里时,猫的行为就好像根本不知道必须要碰门闩才能开门。
它把刚才胡乱找出口的行为又进行了一遍。
别担心,因为我们忠实的小猫最终还是无意碰到了门闩,又一次受到奖赏,吃到了食物。
桑代克一次次地重复这个实验,做了大量的观察。
随着不断地尝试,小猫用来找出门闩是开门的关键这个结论所花的时间越来越短。
为什么它越来越快地发现解决问题的办法?桑代克说,食物帮助小猫找到了碰门闩和逃跑之间的联系。
桑代克的效果律表明,“如果一个动作跟随着情境中一个满意的变化,则该反应与情境之间的联结便加强,在类似的情境中这个动作重复的可能性将增加……满意度越高……联结越牢固。
'70'第70节:第四部分 向正确的目标进攻(10)
”实际上,得到食物这个结果是学习开门的一个奖赏。
开门的行为就像我的工作,食物就好比我的工资。
我们回到最开始的问题上:我的工资是否对我有影响——我不停地工作,就像桑代克的猫不断地开门去获取食物一样。
因此,我行为的结果事实上导致我不断地出现相同的行为。
强化刺激下奔跑的老鼠当行为或者事件的结果使得行为或者事件出现的可能性增加,我们就把这个结果叫做强化刺激。
它就像奖赏,我们知道,当我们做了事情受到奖赏时,我们通常还会再做这样的事情,希望再次得到奖赏。
操作性条件反射讲的就是强化刺激对行为的影响。
斯金纳,最著名的行为主义心理学家之一,跟随桑代克的脚步,继续使用动物来研究操作性条件反射。
他做了一个箱子,里面有一根杆,称为斯金纳箱。
当动物压杆时,喂食者会把食物粒放到箱子里。
斯金纳想看看箱中的老鼠为了获取食物,能不能学会去压杆。
这个任务比想象的要困难很多。
老鼠不习惯压杆来获取食物。
为了促成这个结果,斯金纳不得不增加一个步骤,叫做塑造,用来奖励那些成功接近目标的行为。
对那些接近目标,但还没有达到预期的反应行为,斯金纳都给予食物奖励。
塑造过程有序地进行,这样老鼠就能最终到达按压杠杆、获取食物作为强化刺激的那一步。
当老鼠渐渐熟练后,它们就掌握了按压杠杆来获取食物的方法,这与桑代克的猫学习开门所用的方法一样。
不管出现什么样的行为,说明的是一个道理:老鼠学会了压杆的动作,是因为食物的奖赏“教”会了它们怎么去压杆。
桑代克的猫和斯金纳的老鼠的学习过程,都是因为它们受到了食物的奖赏。
食物对于动物是十分有力的奖赏,但食物只是一类强化刺激,任何能够增加行为再次出现的可能性的东西,都可以用来作为奖赏或者强化刺激。
食物,钱,休息或者假期都可以用做强化刺激。
强化物的类型有两种基本的强化物:正强化是使用强化物增加行为出现的可能性。
负强化减少不良刺激,增加正确行为出现的可能性。
操作性条件反射的基本观点是,经过强化(无论是正强化还是负强化)后,行为更可能再次出现。
但是所有的强化物都是这样吗?所有的强化物效果都一样吗?如果老鼠每次按压杠杆斯金纳都给它5美元,老鼠还能学会同样的反应吗?很可能不会。
强化物不同,对反应的影响也不同。
不是所有的东西都能达到奖赏或者强化的效果。
更多热门小说,请访问宜搜小说搜索(b。easou)
'71'第71节:第四部分 向正确的目标进攻(11)
两种有效的正强化是:原强化物:无需塑造过程或者提前培训就能发挥作用的奖赏物。
可以是食物,也可以是愉悦的身体体验。
大卫·普里马克在1971年提出一个很有意思的观点,他说,观察人们大部分时间里所做的事情,就可以找出他的原强化物。
如果他们花很多时间看电视、骑自行车或者睡觉,这些活动就是他们的原强化物。
他的普里马克原则说明,可能性很高的反应可以用来强化可能性较低的反应,即高频的活动作为低频活动的强化物。
这就像用冰激凌来让孩子吃蔬菜。
如果他们想要冰激凌(高可能性的反应),他们就得吃蔬菜(低可能性的反应)。
次级强化物:是通过学习和经验得以强化的事物。
应用经典条件反射(见第8章)的原理,把次级强化物与原强化物相联系,同样可以出现期望的反应。
海豚训练员在给海豚喂鱼时吹响口哨。
最后,由于海豚把口哨和食物相联系,口哨可以单独作为强化物。
但是也有人提出质疑说,按照大卫·利波曼的观点,口哨只是一个信号,不能替代食物。
目前这个问题仍然没有定论。
当我们找出可以强化某人或者某事的事物时,我们就可以着手通过奖赏来影响对方,使其表现出期望的反应。
比如,一个办公室管理人员总是很难在午饭后让他的手下按时回来工作。
怎么办?首先,她得找出这群人或者每一个人的强化物。
然后,她要奖赏每一个达到她所期待的行为、能够按时回来工作的人,可以给他们小礼物、钱或者画着笑脸的贴纸。
我们先回到负强化上来。
很多人不明白这个问题。
拿走某种东西或者取消不良刺激如何能够增加行为出现的可能性?你家里是不是曾经有条小狗,你想睡觉,它却不停地嗥叫?如果你把它关在另一个屋子里或者车库里,因为它还是叫,所以你很可能还得再起来看看怎么回事。
当你看见它的时候,它不叫了。