Skip to content

2022 04 24 《别毙了那只狗》读书笔记 五

1580 字
   

语音播客


文字内容

大家好,我是陈德文。

今天我们继续《别毙了那只狗》这本书的分享。

分享的第一趴是 关于「增强物的大小」

刚开始利用食物来增强的训练新手通常搞不清楚食物增强物应该多大。

答案是尽可能的越小越好,增强物越小,动物能越快吃掉它,不但可以减少训练者等待的时间,而且每次练习时还可以增加增强物的使用次数,不会让动物一下子就吃饱吃腻了。

一般来说,一小口增强物就足以让动物保持兴趣,对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,对大象则是半颗苹果,如果是特别喜爱的食物,份量甚至可以更少。

行为的难易程度也与增强物的大小有关。

至于人类,增强物的大小虽然没有一定的规律,但是有时候工作越艰难,报酬将越大,如果我们完成了艰难工作却未获得相对报酬时,我们肯定痛恨不已。

我要分享的第二趴 是关于 「意外的「大奖」」

「大奖」Jackpots 是一个对动物或人类都极为有效的技巧。大奖指的是非常大的增强物,甚至可能比平常大上十倍,而且训练对象没有料到它会出现。

大奖也可以用来标定「突破性的意外进步」。

比如当年轻的马儿首度完成一项困难动作时,训练员随即从马背上跃下,除去马鞍和马勒,然后放它在场里任意奔跑——给予完全的自由便是一个大奖,而这么做似乎把新行为保留下来。

遇到动物不听话、害怕或抗拒而完全不出现好的行为时,偶尔给一次大奖也可能改善动物的反应。

第三趴的内容会比较关键,说的是「制约增强物」。

当动物出现你希望鼓励的行为时,你可能根本无法立刻给予增强物,尤其是使用食物增强时更是如此。

以训练海豚跳跃为例,当他跃入空中时,我不可能马上拿条鱼喂它,这么一来,每次奖励他跳跃而赏他鱼吃的时间势必延误。

但事实上,久而久之海豚终究还是会把跳跃动作和吃鱼联想在一块儿,于是跳跃动作还是会增加,只是关键在于它无法得知我到底是喜欢它跳跃的哪一点,是高度?还是水花四溅的入水动作?于是它必须跳跃许多次,才能找到我心中期望的跳跃动作是什么。

遇到这种情况时,我们便可以利用「制约增强物」(conditioned reinforcers)。

「制约增强物」是指原本不具意义的信号(可能是声音、光线或动作),刻意让它在增强物出现之前或期间出现。

学校老师常使用「那个很不错哟!」和「非常好!」等具有形式意义且谨慎运用的赞美也出于此里,学童总是会迫不及待把事情做完,等着听到这些赞美。

讲求实效的正增强动物训练几乎都应该先从建立制约增强物开始,在正式展开训练前,趁动物尚未刻意出现行为,先教导它们制约增强物的重要性。

做法是让这个「制约增强物」与食物、拍抚或其他真正的增强物产生连结,随后你可以在动物身上看出他们是否已经理解这是你示意「很好!」的讯号,通常他们接收到制约增强物时会出现停格一下的反应,然后开始寻找真正的增强物。

有了制约增强物,你将拥有一个能够真正与动物沟通的方式,告知它你到底喜欢它哪一点行为。

人类当然也会为了钱不停工作,说穿了「钱」就是一种制约增强物,是用来买东西的代换品,而钱赚得根本花不完的人甚至特别爱赚钱,他们对这个制约增强物已沉迷的无法自拔。

可以连结到多种初级增强物的制约增强物将更具威力。

我家里猫咪听见「好乖!」时,就会看见晚餐出现、被人拍抚、得以进出门口或领取表演把戏的奖赏,于是我现在便可以轻易利用「好乖」增强他们跳下餐桌的行为,而不必给予真正的增强物。

然而金钱之所以具备极大增强作用,或许正是因为它几乎可以与所有东西连结,是一种连结甚广的制约增强物。

制约增强物一旦建立起来了,便必须谨慎的使用它,以免减低了它的效用。

我们应该给予子女(配偶、父母、情人或朋友)很多的爱与关注,不需要在他们出现特定行为时才给予,但我们确实应该慎用赞美,把赞美当成制约增强物,实际出现好行为时才赞美。

即便是幼童,人们对于虚情假意或无意义的赞美都会很快感到厌恶,因而不再具有任何增强作用。

本节完。