看见你,脑子里群星闪耀
2020/1/1 13:11:53 生物流BioStream
在之前的文章里,我们了解了祖母细胞理论zhuanlan.zhihu.com/p/92。简单的说,祖母细胞假说表达的思想是神经元和概念或事物(比如祖母)具有一对一的关系。就像电脑键盘,一个按键只表示一个字母。

祖母细胞假说就像键盘,一个键编码一个字母
跟祖母细胞理论针锋相对的是分布编码理论(distributed coding)。分布编码依据参与编码的神经元数量又可分为稀疏编码(sparse coding)和密集编码(dense coding)。
稀疏编码和密集编码
祖母细胞理论其实是另外一种编码理论——稀疏编码-——的一个极端表现形式。稀疏编码认为,在某些脑区,当一个特定刺激呈现时,大脑内的绝大多数神经元是不放电的,只有稀疏的一小撮神经元在放电。当这一小撮神经元的数目是1时,就是祖母细胞假说。

祖母细胞理论(Local code)、稀疏编码和密集编码
当这一小撮神经元走另一个极端,即等于整个神经元群体时,便是密集编码。密集编码认为,对于任意一个刺激,比如一张人脸,大脑会动用所有相关的神经元去编码。不同的脸引发神经元群体反应的模式不一样。
假设猕猴face patch内一共有5个神经元,克林顿的脸引发的神经元群体反应模式是,0,1,2,3,4(分别对应5个神经元的反应),而Jerzy Konorski引发的模式却是1,4,2,5,1。密集编码依据神经元群体反应模式的不同来区分人脸刺激。
密集编码的编码容量是巨大的。假如把神经元的反应简化成二元的(binary),即神经元只有两种状态, 0和1,分别对应着反应和不反应。对于一个神经元数目为N的”二进制”神经网络,它的可能状态是2的N次方。随着神经元数目N的增加,这个数会爆炸。只需要266个神经元,密集分布式编码的能力就超过了全宇宙的原子数目(约10的80次方)。如果再考虑神经元发放状态不止两种,比如100毫秒的时间窗口内,如果神经元最多可以放电10次,那么神经元的状态就有11种(另外一种为不发放状态),神经网络的编码能力将会是11的N次方。这个数字对我们来说几乎是无穷的。

只需266个神经元,神经网络的信息容量就超过宇宙原子总数
这也说明密集分布式编码具有极大的冗余性。
冗余性有好处也有坏处。好处是编码容量大,容错率高,几个神经元不小心挂掉了也没关系,还有其他神经元顶着。坏处也是显而易见的,神经元放电不是免费的,密集编码需要消耗大量能量。
与之相对的稀疏编码和祖母细胞理论则刚好相反。即容量相对小,容错能力低,但效率高,计算量少,还节能。
那么,大脑到底会采取哪种编码策略呢?我们先来看看“兵家必争之地”———面部识别领域的实验结果。
面部编码的新机制
2017年,加州理工的科学家Le Chang和Doris Tsao在面部识别的脑机制方面取得了重大发现。在猕猴看人脸图片的同时,科学家记录了200个下颞叶face patch内的神经元。

神经科学家美女Doris Tsao
face patch内的神经元不止对一张人脸反应,而且这几张人脸差异很大。这就直接否定了祖母细胞理论一对一的假设。如果祖母细胞理论是错误的,那么每个神经元到底编码了什么东西?或者说神经元到底在对什么放电?

一个神经元对三张不同的人脸都有强烈的反应
Doris经过分析发现,其实每个神经元都在对人脸的某个组合特征反应。比如,如果一个神经元对浓眉大眼和络腮胡这个特征组合反应,那么越是浓眉大眼,络腮胡越明显,细胞反应越强烈。相反,如果眉毛胡子比较淡,神经元反应就比较弱。
并且,该神经元只对浓眉大眼和络腮胡反应,但不对脸型、唇形、肤色等其他特征反应。也就是说,如果保持人脸的浓眉大眼和络腮胡特征不变,就算你把人脸整得面目全非,神经元的反应也不会变的。
这就解释了祖母细胞无法解释的现象,即,一个神经元为什么可以对相差很大的几张脸都有强烈反应。因为这几张人脸中,只有少数脸部特征才是细胞真正关心的。

对高发际线反应的细胞不对性别特征反应
Doris称这种编码模式为轴编码(axis coding),一个轴表示一个脸部特征组合。每个神经元代表一个轴,200多个神经元就构成了一个200多维的脸空间。每张脸都可以在这个空间中用一个点表示。依据此模型,Doris不但可以根据神经元群体的反应很好地预测出给猴子看的脸是什么样的,还可以根据面部图片预测每个神经元的反应。

真实的脸和不同face patch内神经元预测的脸
Doris的研究结果表明,大脑识别人脸的原理不符合祖母细胞假说,而符合分布式编码。
进一步,稀疏编码还是密集编码呢?Doris的计算发现,神经元越多,预测的越精确,似乎这200神经元每个都在起作用。但由于科学家无法得到所有神经元的数据,理论上来说,无法证明是不是所有神经元都参与了编码。只能说,面部识别更倾向于密集编码。

神经元越多,区分人脸的能力越强
总结
从某种程度上说,祖母细胞假说,稀疏编码,密集编码没有本质区别。祖母细胞假说和密集编码在绳子的两端,而稀疏编码则在绳子中间区域。
大脑会采取什么策略来编码外界刺激也许没有标准答案,可能是顺势而为,灵活变动。
比如,当一个外界刺激频繁出现时,大脑可能会采取稀疏编码的策略,这样避免了频繁激活大量神经元的能耗。而对于一些不常见的刺激,大脑可能会投入更多的神经元来编码。
再比如,在大脑的某个角落,也许真的存在祖母细胞。而在另一些角落,所有的神经元都参与每一个外界刺激的编码。而在绝大数地方,大脑可能采取的是一种中间策略。
当然,本文只对稀疏编码和密集编码做了一个浅显的介绍,喜欢深度烧脑的朋友不妨纵情欣赏以下参考资料:
Questioning the role of sparse coding in the brain. Trends in Neurosciences
The Code for Facial Identity in the Primate Brain. Cell
源网页 http://weixin.100md.com
返回 生物流BioStream 返回首页 返回百拇医药