狗狗不听话？来看看科学家是怎么训练实验动物的（上）

狗狗不听话？来看看科学家是怎么训练实验动物的（上）
2020/5/24 11:47:25 生物流BioStream

     人人都希望家里的狗狗乖巧懂事，能听得懂人话。让它站起来，嗖一声它就站起来。让它蹲下，它夹着尾巴立刻就蹲下。

     想想就倍有面子。

     然而，大多数时候，你在发号施令，狗狗却一脸无辜地看着你，不知所以然，狗狗当然听不懂人话。

     但你可知道，实验室里的老鼠远不比狗狗聪明，但老鼠却能乖乖地服从科学家的命令，做一些普通人听起来就头晕脑胀的行为学实验。

     大鼠在做压杆实验

     其实，早在上一世纪，科学家就发展出了一套关于训练动物行为理论——操作性条件学习。

     什么是操作性条件学习？

     操作性条件学习是一种通过奖励来强化动物行为，惩罚来弱化动物行为的学习模式。这里的奖励称为强化刺激，而惩罚称为惩罚刺激。

     例如，如果大鼠每次踩到感应杆会有食物奖励，那么，大鼠的压杆行为就会得到强化，小鼠会增加压杆行为。如果大鼠每次踩到感应杆都会遭到电击，那么，大鼠肯定会躲着感应杆走。

     训练狗狗做一个动作，对狗狗来说，也是一种操作性条件性学习，需要通过奖励来强化。

     对于操作性条件学习，最常见的行为强化策略为连续强化策略。

     连续强化策略

     例如大鼠，如果它每一次正确的压杆都会得到奖励，那么，这种强化策略称为连续强化(Continuous reinforcement)。当实验动物刚开始学习某一行为时，连续性强化是最快的训练方法。连续强化会让动物很快在行为和奖励之间建立因果关系。

     怎么将连续强化策略运用到你的训狗大业中呢？其实，狗狗是很希望配合主人的，但在语言不通的情况下，你和它之间缺少一种有效的沟通方式。而给正确的行为以奖励，是让狗狗理解你复杂意图的最高效、最准确的方式，很可能是唯一的方式。

     假如，你想训练狗狗握你的手。

首先要准备好狗狗最爱吃的牛肉。伸出你的右手，用另一只手将狗狗的前爪放到你的左手里，然后摇晃握手。之后迅速奖励狗狗一块牛肉，越快越好。间隔时间越短，狗狗越能将握手和奖励联系起来。经过一段时间的训练后，你就会发现，每当你伸出手掌时，狗狗会主动把爪子放进你的手心。因为狗狗知道这样做会得到最爱吃的牛肉。

需要注意的是，训练期间，牛肉只能在握手时给狗狗，其他任何时间都不能给。只有这样，才能让狗狗在握手和牛肉奖励之间建立一条清晰的因果链。如果在不握手的时间也给狗狗牛肉，狗狗就会迷惑，误以为其他动作也能获得牛肉奖励，这会削弱握手和牛肉之间的因果关系。

     但你也不可能每次握手都给狗狗块肉，太败家，也失去了训练狗狗的本意。你的本意是让狗狗跟你握手，不是喂狗狗吃肉。因此，我们需要在狗狗学会握手后，减少甚至停止奖励，但仍能让狗狗保留和你握手的习惯。

     幸运的是，科学家早就发展出一系列的间歇强化策略，来稳定和坚固实验动物的操作性条件反应。

     连续强化后，如果正确的行为不再有奖励，实验动物的动作就会消退。通常，不到50次的空手套白狼，实验动物就不再理你。

     而采用了间歇强化策略的动物，在奖励消失后，还会心甘情愿地做上千次、甚至上万次的行为。

     什么样的强化策略拥有如此强大的魔力呢？下篇文章，我们一起来揭开它神秘的面纱。

     (生物流系头条号签约作者)

    源网页   http://weixin.100md.com
返回生物流BioStream 返回首页返回百拇医药