Skip to content

2022 05 07 《别毙了那只狗》读书笔记 七

2082 字
   

语音播客


文字内容

大家好,我是陈德文。

今天我们继续《别毙了那只狗》这本书的分享。

我们说,要让「不!」产生效果的诀窍在于必须让它称为制约负增强物(conditioned negative reinforcer) 。

举例来说,如果你觉得有必要使用收缩链,就应该在狗犯错的同时说出「不!」, 然后在拉扯链条之前先稍等一会儿,给它机会修正行为以避免处罚。

如果你只是直接拉扯链条但没有给予它警告,这个拉扯的动作就只是纯粹沦为处罚,将无可预期它对未来行为的影响,而且这个处罚的累积效应可能会影响狗子的工作欲望。

另一个常见错误是,当狗子回到位置上的时候继续猛扯链子,这使他的两个行为都受到处罚。

如果纠正式训练方法缺乏了制约负增强物,实际用到厌恶刺激的机会将会增加,也将使学习速度变慢。

有时候传统训练师为了获得可靠稳定的行为,必须比应用增强训练的训练师花费更多时间进行训练。

也许花上数个月,甚至数年以上。

这不只是他们所依赖的处罚会使行为消失,也因为他们使用的处罚缺少了制约负增强物,必须重复训练数百遍之后,动物才能归纳出他们应该出现的行为。

还有一种特殊的「制约负增强物」,我们称其为「无奖励标定讯号」,通常是以平淡的语气说出「错」。

概念是,当狗子表现出不同的行为,试图猜测你想要什么时。

你可以利用这个来作为「那个行为不会得到增强」的讯号,以此告诉狗子,哪些行为没有用。

要让这个方法有效,是有一定使用限制的。

也就是训练对象在过去有接受过获得响片,而产生了行为变化或主动尝试新行为时获得增强的经验。

简单来说是,如果训练对象没有经验,这样的方法是很难奏效的。


第二趴 关于「无法预料的奖励」更具吸引力

有个广为流传的错误观念是「当开始以正增强训练某个行为时,便必须在训练对象的余生里一直使用正增强物,如果不这么做,这个行为将会消失。」

这个说法并不正确,事实上只有在「学习」的阶段才需要持续使用增强物。

在教会小朋友使用马桶的行为之前可以经常称赞小朋友,但是当小朋友完成了这个行为的学习,这个行为本身将自行获得增强。

我们应该经常给予初学者增强物,例如教小朋友骑自行车时可能需要不断告诉他「那就对了,现在骑稳,你做到了,很好」

如果当小朋友已经学会骑车,你却依旧不断称赞他,这时候你就很蠢了(小朋友也会以为你是不是不太正常)。

为了使「学成的行为」维持一定的可靠度,非但没有必要每次都增强这个行为,而极为重要的是——「不可以经常增强这个行为,而要改成偶尔增强,而且是随机性(无法预测)的增强。」

心理学家称这个增强方式为「变化增强时制」(variable schedule of reinforcement),它维持行为的效果比起持续性、可预测的增强方式要好。

利用变化性增强时制可以塑造较佳的表现。

变化性增强时制的威力正是赌博的本质,要是每次投一块硬币到老虎机里,就会有十块硬币掉出来,很快就会让玩家丧失兴趣。

虽然你的钱会越来越多,但是这种方式是在很无趣。

人们之所以爱玩老虎机,正是因为他们无法预料将出现什么:可能空空如也、可能掉下一些钱,也可能掉下很多钱。

我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性增强的作用就是让他们上瘾的原因。

变化性增强出现的时间间隔越长,它所维持行为的效果就越强,不过如果你想设法消除某项行为,吧时间间隔拉长的变化性增强就对你很不利。

所有未获增强的行为都有自行消失的倾向,但是如果它不时获得增强,尽管只是偶发事件——抽根烟、喝杯酒或者对不断唠叨或哀求的人稍作让步。

这个行为不仅不会消失,事实上它可能反而被这种间隔拉长的变化性增强时制维持的更好。

这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。

我们都看过一些遭配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人缺执迷不悔的情况。

传统以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其他方式离开恶劣的另一半,他们旋即又会找到同类型的对象来重蹈覆辙。

这些长期称为受害者的人是否具有严重的心理问题呢?有这可能,不过他们也可能是长时间变化性增强时制的受害者。

当你刚开始与对方交往时,认为对方迷人、性感、风趣又无微不至,即使这个人日后会逐渐变得难以相处,甚至施暴,但偶尔还是会对你展现好的一面,即使获得这些美好增强物的时光变得越来越罕见,它却成了你的人生寄托。

从常理来看,这个似乎是十分反常的现象,但是从训练观点的角度来看,却显而易见:这些美好时光出现的越少、越无可预测,它的增强作用越强大,而且你的基本行为也将会越持久。

此外,也不难理解为什么曾经有过这类关系的人会再度寻求同类对象,因为他们与和善正派的人交往时,可能就是少了那种增强物极少出现、令人可盼、因而增强效果加倍所带来的快感。

从操纵者的角度来说,想任意操纵某个人,并且让他随时言听计从,只要偶尔给他他想要的东西,就可以达到目的了。


好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。

大家下周不见不散。