Skip to content

2022 05 01 《别毙了那只狗》读书笔记 六

1873 字
   

语音播客


文字内容

大家好,我是陈德文。

今天我们继续《别毙了那只狗》这本书的分享。


第一趴是「响片训练」

海洋哺乳动物训练师通常以哨音作为制约增强物,用来训练鲸豚、海豹和北极熊。

响片训练者使用响片除了是制约增强物,以及介于「赚取」和「实际获得」食物之间的刺激外,他还有多种未获研究的功能。

首先,最重要的功能是奥登·林兹博士所称的「事件标定器」作用,响片让训练对象明确知道被增强的行为是什么,它甚至把主控权交到训练对象的身上,过了一阵子之后训练对象不再只是重复行为,而是显露意愿:「嘿,我让你按下响片了!你看看!我再做一次!」

响片训练者把这种转变称为「灯泡亮了」,比喻浑然开窍、豁然开朗的时刻,不管对训练者或训练对象都有极大的增强效果。

响片训练者使用的制约增强物也是一个代表「完毕了」的终结讯号,诚如需训练师盖瑞·威尔克斯所言:「响片终结了行为」。


第二趴,分享的是关于增强「继续加油」的行为。

当受训者在搜寻目标物,但尚未找到时,响片声并不是作为一个终结讯号,而是一个「继续加油」的讯号,由于受训者尚未发现目标物件,响片的适时出现不但是增强了寻找的行为,也让受训者继续出现搜寻的行为。

我们可以多次使用制约增强物但不给予真正的增强物,直到最后再给予即可。

之所以这样说,是有时候在训练海豚时,出现长时性行为,或连锁行为时会这么做,实际上使用了至少两种的制约增强物或标定讯号:一种是正常音量的哨音,代表「这就对了!食物随后就到,过去那边取食,完毕了!」

另一种则是较轻的哨音,代表「这就对了,但是还没达到目标!」

我们必须强调,唯有遵循「按一次响片,给一次零食」的通则才能教会人们如何塑造行为。

在许多现实状况中,有些「过渡性的增强刺激」可能非常好用。

另择一个增强刺激,并籍由这个刺激告知训练对象「那就对了,继续加油!」是个解决办法。

「继续加油!」的讯号并不需要直接连结初级增强物,只要在响片终结声出现之前插入这个讯号即可,学习者很快就可以理解到,它只是一个引领至最终增强物的讯号。

接下来你便可以好好运用这个「过渡性增强刺激」,在连锁行为当中利用它作为蕴含讯息的标定讯号,不必让进行中的行为停下来。

举例来说,我们在B站有看过狗狗的敏捷赛,狗儿进行障碍竞速,主任必须在狗儿迅速移动之下指示它下一个障碍是什么,曾见过狗儿在达成某项障碍后,表现出不知所措的样子,仿佛没听清楚指示,不知道该穿入隧道还是跨栏,它的头在两项障碍之间来回摆动着,当狗儿超跨栏望过去,主人大喊「没错!」时,狗儿才立刻跑向正确的障碍项目。

如同最终才出现的响片声一样,这种过渡性的讯号可以时任何刺激(响片、哨音、大喊一声或挥一下手),但要注意的是,这个刺激并不能只是怀抱希望的鼓励或加油打气(这么做很可能使动物分心或不小心增强其他行为),它也必须是一种意义明确、精确使用的制约增强物。


第三趴的内容会比较复杂,也比较难掌握和领悟,这里说的是「习得厌恶增刺激」

及时发出的「习得正面讯号」是告知接受者「你现在的行为很好,将为你带来好处,所以多出现这个行为吧!」

而你也可以建立「习得厌恶刺激」(conditioned aversive singals),或称为「处罚物」(punisher),它告诉接受者的讯息是「你现在的行为不好,你要是不停止这个行为的话,不好的事就会发生。」

对一些动物来说,习得厌恶刺激毙威胁更有效。

我们举例来说,还是猫咪,猫咪对大喊大叫与责骂没有反应。

不过有一个例子和大家分享,就是某次意外事件治好了猫咪爱抓沙发的毛病,结论是人喊出的「不!」字,成为了习得厌恶刺激。

有一天,主人在厨房里失手掉落一个铸铜的大托盘,正好掉在猫咪身旁,这里有个很关键的讯息,大家要仔细听

当托盘掉下时,主人大喊了「不!」,下一秒托盘即落地发出巨响

猫咪被吓得跳起来,全身毛都竖了起来。

之后当猫咪抓沙发时,主人一喊「不!」猫咪便看来一副惊吓样,立即停止动作,在重复两次之后抓沙发的这个行为就永久消失了。

训斥是生活中必要存在的一部分,以正增强为教导的主要工具,这并不代表必要时不能说「不!」(例如幼儿拿东西戳入插座时),然而一些训练者拿这种现实状况为例

他们认为,无论什么状况,教导时经常做「纠正」是很合理的

事实上他们犯了两个错:

第一、他们似乎认为纠正的好处和正增强一样多,却没考虑到它对学习者产生的其他影响,这块我们会在后面的内容里分析。

第二、他们使用训斥和处罚,但并未建立警告讯号(习得厌恶刺激)。


好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。

大家下周不见不散。