狗狗不听话?来看看科学家是怎么训练实验动物的(上)
2020/5/24 11:47:25 生物流BioStream

     人人都希望家里的狗狗乖巧懂事,能听得懂人话。让它站起来,嗖一声它就站起来。让它蹲下,它夹着尾巴立刻就蹲下。

     想想就倍有面子。

     然而,大多数时候,你在发号施令,狗狗却一脸无辜地看着你,不知所以然,狗狗当然听不懂人话。

     但你可知道,实验室里的老鼠远不比狗狗聪明,但老鼠却能乖乖地服从科学家的命令,做一些普通人听起来就头晕脑胀的行为学实验。

    

     大鼠在做压杆实验

     其实,早在上一世纪,科学家就发展出了一套关于训练动物行为理论——操作性条件学习。

     什么是操作性条件学习?

     操作性条件学习是一种通过奖励来强化动物行为,惩罚来弱化动物行为的学习模式。这里的奖励称为强化刺激,而惩罚称为惩罚刺激。

     例如,如果大鼠每次踩到感应杆会有食物奖励,那么,大鼠的压杆行为就会得到强化,小鼠会增加压杆行为。如果大鼠每次踩到感应杆都会遭到电击,那么,大鼠肯定会躲着感应杆走。

    

     训练狗狗做一个动作,对狗狗来说,也是一种操作性条件性学习,需要通过奖励来强化。

     对于操作性条件学习,最常见的行为强化策略为连续强化策略。

     连续强化策略

     例如大鼠,如果它每一次正确的压杆都会得到奖励,那么,这种强化策略称为连续强化(Continuous reinforcement)。当实验动物刚开始学习某一行为时,连续性强化是最快的训练方法。连续强化会让动物很快在行为和奖励之间建立因果关系。

     怎么将连续强化策略运用到你的训狗大业中呢?其实,狗狗是很希望配合主人的,但在语言不通的情况下,你和它之间缺少一种有效的沟通方式。而给正确的行为以奖励,是让狗狗理解你复杂意图的最高效、最准确的方式,很可能是唯一的方式。

     假如,你想训练狗狗握你的手。

    

     首先要准备好狗狗最爱吃的牛肉。伸出你的右手,用另一只手将狗狗的前爪放到你的左手里,然后摇晃握手。之后迅速奖励狗狗一块牛肉,越快越好。间隔时间越短,狗狗越能将握手和奖励联系起来。经过一段时间的训练后,你就会发现,每当你伸出手掌时,狗狗会主动把爪子放进你的手心。因为狗狗知道这样做会得到最爱吃的牛肉。

    

     需要注意的是,训练期间,牛肉只能在握手时给狗狗,其他任何时间都不能给。只有这样,才能让狗狗在握手和牛肉奖励之间建立一条清晰的因果链。如果在不握手的时间也给狗狗牛肉,狗狗就会迷惑,误以为其他动作也能获得牛肉奖励,这会削弱握手和牛肉之间的因果关系。

    

     但你也不可能每次握手都给狗狗块肉,太败家,也失去了训练狗狗的本意。你的本意是让狗狗跟你握手,不是喂狗狗吃肉。因此,我们需要在狗狗学会握手后,减少甚至停止奖励,但仍能让狗狗保留和你握手的习惯。

     幸运的是,科学家早就发展出一系列的间歇强化策略,来稳定和坚固实验动物的操作性条件反应。

     连续强化后,如果正确的行为不再有奖励,实验动物的动作就会消退。通常,不到50次的空手套白狼,实验动物就不再理你。

     而采用了间歇强化策略的动物,在奖励消失后,还会心甘情愿地做上千次、甚至上万次的行为。

     什么样的强化策略拥有如此强大的魔力呢?下篇文章,我们一起来揭开它神秘的面纱。

     (生物流系头条号签约作者)

    源网页  http://weixin.100md.com
返回 生物流BioStream 返回首页 返回百拇医药