汉柏 CTO 王博:做人脸识别,我们是认真的 | 浅谈·汉柏科技(一)
2017/11/24 14:17:04 浅黑科技

     《浅谈》由科技新媒体浅黑科技出品,是对科技企业的深度报道系列。

     世界太大,我们自顾不暇。但那些疯狂的试图用科技改变世界的人,或许值得你驻足凝望。

     我们会探访那些执着的技术人和科技企业,并试着用简单的笔触书写下他们心中的技术和未来,希望这些真实的解读,可以帮你理解这个世界。

     《浅谈·汉柏科技》,是对人工智能企业汉柏科技的深度报道,此为第一篇对 CTO 王博的专访。

     是为《浅谈·汉柏科技》的第1篇文章,也是《浅谈》总第3篇文章。

     汉柏CTO王博:做人脸识别,我们是认真的

     文 | 史中

     西部某火车站,列车缓缓驶入。

     人们行色匆匆,从站台涌向出口通道。

     通道只有20米长,却是所有人的必经之路,每天从这里经过的人有十万之众。在人流上方,安静地架设着五路摄像头。一切波澜不惊。

     一个旅客混杂在人群中,衣着普通,神色淡然。然而,就在他刚刚进入通道2秒左右,出站口外民警手上的“警务通”猛然震动,警告:一名逃犯正在通过通道!文字旁边显示着一张刚刚抓拍的头像。

     民警马上行动,仅仅十秒后,就在出口处截捕了这名嫌犯。一个成功流窜多个城市的逃犯,在这一站终于“栽了”。

    

     我刚刚描述的,是真实场景。每周都有两三名逃犯在这个20米长的通道中落网。而这么精准的判断,是人工智能做出的。

     在那2秒钟里,到底发生了什么呢?

     简单说来,这些摄像头只有一个任务,那就是:把所有出现在视频里的脸,用最快的速度和逃犯库里二十万张照片进行人脸比对,一旦发现匹配,马上通知民警。

     这个技术的核心,就是现在炙手可热的“人脸识别”——人工智能重要的应用方向之一。

     傍晚,国贸桥上车流如织。在立交桥旁的大厦里,我见到了这套系统的设计、生产者,汉柏科技的 CTO 王博。他给我讲了不少研发过程中的趣事。

    

     汉柏科技 CTO 王博

     一、算法不是“人脸识别”的全部

     进入汉柏的大门,是要刷脸的。

     刷脸设备是站在门口的一根柱子,上面顶着阳极氧化材质的金属屏幕,看起来有一种 iPhone 的质感。

     “没错,这和 iPhone 外壳的工厂是同一家。”王博说。他坐在沙发上,金丝眼镜、目光犀利,像是刚从《西部世界》里走出来。

     我旁边,有一个巨大的展厅,里面排列着适应各种场景的人脸识别系统,很有科幻电影的味道。

     我试着在一个闸机上刷了一下自己的身份证,屏幕上出现我的名字和此刻我的人脸图像,显示身份验证成功。分列两边的,是酒店入住认证系统、公安追逃系统、办公室门禁系统等等。

     王博说,人脸识别技术在各个行业内的应用还算是比较早期,所以汉柏的“人脸识别系统”主要选择了四个市场空间比较大的方向部署:

     交通:布置在机场、车站、交管局,用于安全监控。

     教育:布置在学校住宿、考场或图书馆,用于人员管理。

     地产:布置在酒店或写字楼,用于认证核查来访者身份。

     公安:布置在公共场所,用于动态监控。追逃。

     成都火车站、鄂尔多斯机场、北京语言大学、阿里双11晚会等等,这些汉柏的客户名录,大概可以把它和我们印象中的“互联网企业”区分开来。这些客户需要的智能安防系统的非常复杂,但也是示范效应很强的。

     每套系统的部署都是一个不小的工程,而每个车站、酒店的经验,未来可以在更多的车站、酒店中推广开。

     王博说。

     这大概宣示了他对人脸识别市场的“野心”。

    

     ▲2017年的天猫“双11”晚会在上海梅赛德斯奔驰文化中心举办,现场入场使用了汉柏的人脸识别系统,图为一名民警正在“刷脸”进入。

     在我的预设里,一个好的“人脸识别”系统,很可能是以一个核心“算法”作为秘密武器。我猜王博和团队肯定在算法上铺了最大的心血。

     不过,他马上纠正了我的看法:

     虽然我们也做了很多独特的算法优化。但是,最终能拿出满足这些大客户需要的设备,人工智能算法也许只占到10%,而超过90%的技术挑战在于你的工程化能力——包括产品设计能力加上生产、施工、售后能力。

     主流的算法各个厂家都类似,准确率差距最多在三五个点之内。而真正帮我们做到“变现”的,是花费巨大精力去做的解决方案。

     他说。

     敢于强调“工程化”这三个字,起码说明两点:1、王博对自家企业调度生产资源的能力非常自信。2、汉柏拥有很多合作紧密的大客户。

     说到这,我有必要多介绍一下汉柏。

     炒股的同学可能更熟悉这家公司。2016年,从财务上看有可能独立上市的汉柏最终选择了和上市公司工大高新重组,成为了工大高新旗下的子公司。根据公开资料,工大高新的实际控制人是哈尔滨工业大学,而哈工大是工信部直属高校,可谓“根红苗正”。

     王博加入汉柏,是在2006年,那是他从北邮研究生毕业后的第三年。早在被国资合并之前的2008年左右,汉柏科技就开始为各大公司提供私有云计算服务。这个时点,居然比现在公有云计算龙头阿里云还要早。从那时能坚持到现在的公司寥寥无几,所以汉柏能积累如此多大客户,也就不稀奇了。

     二、把人脸识别技术”工程化“要踩多少坑?

     由于汉柏的主营业务很长一段时间是安全硬件和云计算服务。所以做人工智能很容易给人一种“半路出家”的感觉。

     不过王博告诉我,其实早在这一轮人工智能热潮到来前的2012年,他们就已经开始“琢磨”这项技术了。

     他为我介绍了汉柏的“人工智能简史”:

     因为汉柏是天津的明星企业,所以在2012年的时候,我们和天津大学合作成立了”应用数学中心“,这是国家级的。著名数学家陈永川院士领导几十位博士开始了对神经网络的基础研究。

     当时也不是很有把握,但我们觉得,数学应该是技术公司的核心竞争力。于是就尝试在这个基础上进行能够变现的工程化设计。

     2012年的时候,人工智能技术非常不成熟,只有一些最核心的算法。直到2014年底,各种 Paper 才开始出来,数据积累比较完整,这项技术算是可以商用了。于是2015、2016年我们都在打磨自己的产品,到16年下半年才推出去,也就是你看到的这一套人脸识别系统。

     我注意到一个细节:15、16年,那时汉柏的年营业额已经达到了10亿级别。但就是这样的一家大公司,把人脸识别技术工程化都耗费了两年时间。这件事情的难度可见一斑。

     王博回忆起这两年的事情,仰天长叹,可谓踩坑无数。

     1、开发人脸识别系统的第一类坑,是有点出乎我意料的“外观”。

     其实倒不难理解,所谓“外观”,实际上指的是“硬件设计”。设计一个兼顾性能和美观的硬件,曾难倒了很多野心勃勃的公司。普通人比较熟悉的例子就是锤子手机。

     为了搞定这件事,他从摩托罗拉、索爱、乐视、小米搞来了上百名顶尖的硬件设计工程师。设计出二十多个版本,最终才进化成现在这个小巧的“识别头”。难怪我最开始看到汉柏门口的识别头时,王博的语气里充满自豪。

    

     ▲汉柏的人脸识别头,照片是我拍摄的。

     这个识别头,看起来像一个小的平板电脑。不过,人脸识别所需要的计算单元都在里面,所有运算都是在本地完成的。

     既然要做到这么小,我们显然不能使用监控级摄像头。但手机级的摄像头又没有那么大的像素点,没有那么广的感光度。于是我们和生产厂商一起,针对监控这个场景磨合了好久,最后又在自己的软件算法层面做了好多优化,才算是达到了满意的标准。

     解决了效果的问题,又发现如果把体积做到这么小,功耗和散热又超过了预期,而一旦选用低功耗芯片,人脸识别的速度又会降低,用户体验下降。

     总之,我们用了很长时间,就是反复解决这些非常细致的工程问题,最后终于实现了把手机摄像头做到了满意的外观中,还在发热可控的情况下,纯人脸识别 0.5秒,人证核查1秒以下完成。

     王博长出一口气。

     “你们已经积累了很好的大客户资源,为什么还会这么在乎产品的外观?”我不太理解,就像很多人结婚之后,就不会再注意自己的形象了。

     不过他的经验告诉他一个正相反的事实:

     “对于这些高端用户,人脸识别系统算是很新的产品。新产品尤其需要培育市场。这些年的经验告诉我,糟糕的用户体验很可能会抑制高端需求。尤其是一个想做领导者的企业,最重要的任务之一就是优化高端用户的体验。”他说。

     2、汉柏开发人脸识别系统遇到的第二类坑,是现场的部署。

     “我们去年底在某个城铁站布置了一套系统,进行“人证核查”(人脸和系统中的证件信息进行比对)。本来觉得把设备架设在上面就行了,但事实证明,之前考虑得再周全,也不如经过实践的考验。“王博说。

    

     ▲从这张屏幕里可以看出,监控探头的设置高度、方向等对于人脸识别的准确性有很大的影响。

     那个城铁站,白天和晚上的光线差异特别大。而且在一天当中的某段时间,会进入太阳直射的范围,也就是“大逆光”状态,根本没法用。于是工程师又加班加点,根据现场的情况开发出了一套逆光补偿系统,这样就适应了现场一天到晚一年四季的光线变化。

     这套系统的好处在于,以后其他项目再遇到同样的场景,它就可以直接发挥作用了。正所谓李宗盛的歌:“人生没有白走的路,每一步都算数。”

     类似这样的改进还有很多,例如在现场部署中,机械结构如何设计才能保证各种型号的识别头既不掉下来,还能灵活转动。门禁系统设计多高才能让人感觉最舒适,等等等等。

     3、汉柏开发人脸识别系统遇到的第三类坑,更严格来说是挑战,它来自客户的“脑洞”。

     1)例如车管所。

     你可能想象不到车管所为什么需要部署一大套人脸识别系统。

    

     ▲图为深圳某车管所部署的汉柏人脸识别系统。

     其实,车管所有一个很头疼的问题,那就是黄牛“刷分”。他们的做法是:用别人的驾照,来缴纳另一辆车的罚分。这里面涉及违规代办、罚分买卖等各种问题。

     由于交管局是汉柏其他产品线的老客户,所以王博和团队对他们的需求有比较深刻的了解,于是就针对“反黄牛”这种需求,开发了这套人脸识别系统:

     首先,进入交管局需要进行一次认证比对,持证人和身份证符合,才能进入;缴纳罚款时,再进行一次人脸识别,驾照上的照片要和现场的人对应才能进行。

     其次,对于交管局甚至交管局周边几百米都进行视频采集,定位出那些很多天都频繁出现在视频里的人员。正常人当然不可能每天都去交管局,所以每天在周围出现的人,就是黄牛“嫌疑人”。他们再办理业务的时候,交管局就可以“重点审查”。

     这些用户特别的痛点,听上去新鲜有趣,仔细一想确实在情理之中。

    

     ▲这是在车管所人脸识别系统上显示的实时比对画面。

     2)再比如文章开头所说的火车站。

     利用人脸识别系统在火车站出口通道“追逃”,实际操作中就面临一个很大的问题:

     门口警察手持的“警务通”上显示了提醒,嫌疑人马上要从通道出来,并且配了人脸照片。但是出口涌出来的人那么多,一时间很容易对不上号,有一种“看花眼”的感觉。

     王博说,只要找到了问题所在,最终解决方案其实不难。

     他们的方案是,在嫌疑人大头照的旁边,再推送一张刚刚抓拍的嫌疑人“全身照”,根据他衣服的颜色和款式,民警在人流中发现这个人的难度就大大降低了。

     如果对用户的使用场景不够了解,有时候很难想象出他们会有怎样的需求。

     3)下面这个例子发生在新疆某地。

     公安局出于反恐的需要,在一个小区布控。每天这个小区进出可以达到50-80万人次,如果持续几个月,数据就达到了上亿的级别。公安希望在这些人中快速找到和照片匹配的嫌疑人。

    

     ▲图为一套某地已经投入使用的“警用系统”,用于匹配出入人员和犯罪嫌疑人。

     当然,仅仅是这个需求,并不困难。但是同时公安为了调查安检,还希望系统可以分析出每次和嫌疑人一起进来的人是谁;这还不够,还需要找出有谁又曾经和嫌犯的朋友一起进入。用专业术语,这叫做“三度关系”。

     王博说,这些需求虽然用算法都能解决,但问题出在:这么大量的数据,如果不进行优化,计算出结果所需要的时间是长到难以想象的。

     为了运行这种“关系网运算”,技术团队甚至修改了底层数据存储的结构,调整冷热数据的分配,针对这种计算简化算法。幸好他们的“老本行”就是云计算,所以这些改进对于他们来说可能实现。

     我们进行了测试,有一个1.2亿数据量的样本,查询一个人的三度关系,最开始需要80秒。最后我们尽了全力,把需要的时长优化到了5秒,算是稳、准、狠。只有做到这么快,才能让公安在办案的时候可以把这套系统当做工具来用。

     王博说。

     三、“孤胆英雄”和“实用主义”

     在聊天中,王博经常提到“工程化”“变现”这样的词汇。相比很多人熟悉的互联网公司“孤胆英雄”式的情怀,好像更为实用主义。

     最初在和公安口的同事沟通的时候,因为交流比较少,对方觉得汉柏拿来的系统,应该和《碟中谍》《疑犯追踪》里那种差不多。其实我们最初也是这样想的。但是现实告诉我们,科幻电影害死人啊。

     他笑着说。

     王博的实用主义,用一句话概括就是:他在不断寻找和构筑“壁垒”。

     不久前,我从很多人工智能方面的创业者和投资者那里获得了他们对行业最新的看法,他们的认识高度一致:

     ToB 端人工智能产品的要素有四点:算法、算力、数据、行业理解。在这四个要素里:

     “算法”不构成壁垒,因为论文公开、大公司平台开源;

     “算力”不构成壁垒,因为云计算的迅速普及;

     “数据”构成壁垒,它的产生依赖于你的客户生态;

     “行业理解”的壁垒同样很高,因为它要求用时间来观察,并且亲身参与行业的发展。成本很大。

     这个认知恰和王博的思路大致相同。汉柏十多年的经验告诉他,要改变一个行业,需要尊重商业逻辑。而商业逻辑中,首先要思考的就是“壁垒”。

     真正的场景下,对于误报的敏感是很大的。

     角度、光线、遮挡,每个因素都会影响算法的误报率。而布控的位置选择,是在人流发散的位置还是通道集中的位置,是布置在上楼的场景,还是下楼的场景,每秒取多少帧画面进行解析,都会严重影响识别效率。这些问题不仅需要思考,还需要经验。如果没做过,就得把我之前说的那些坑都要踩一遍。

     我觉得针对这些工程化问题的专业性,才我们最坚固的壁垒。

     他说。

     根据他的观察,在“泛安防”领域,中国的市场环境和场景丰富度都是最好的。最终中国的人脸识别市场,应该是千亿级别的。

     在这个市场下,原来安防领域的巨头、专做人脸识别算法的创业公司,都在研发类似于汉柏的“适应具体场景的人脸识别系统”。作为一个严谨的技术人,王博并不否认汉柏会遭遇竞争。但是他判断,如果竞争者认真地进入这个领域,汉柏过去两年在工程化上踩过的坑,其他人也必须一个不少地踩一遍。而这需要时间。

     ToB的市场非常细分,很大程度上说,某个企业如果先发占领特定的市场,就能基本决定之后的竞争格局。

     目前来看,例如火车站、机场这类场景,我们已经在华北、华东、华中、中西部有了五六个成功案例,还有很多机场和车站在洽谈中。因为这类项目往往需要报批、做预算,所以预计明年就能大面积铺开。这一点上的先发优势可以帮助我们进一步提高壁垒。

     例如交管局的例子。我们一开始在深圳“武装”了两三个交通队,结果其他交通队纷纷找到我们,要求也部署这套系统。理由是:其他交通队防范黄牛很到位,黄牛都纷纷跑到了自己这里了。

     也许到明年,市场格局就会更加清晰。

     他很有信心。

     四、小结

     “人工智能”这四个字生来散发着光辉。

     它寄托了你我对这个世界的想象和诘问。

     很多人误以为人工智能诞生于几年前。但翻开历史能够看到,从上个世纪60年代开始,无数计算机学家、数学家、逻辑学家就已经利用刚刚诞生的计算机挑战人工智能。

     七十年中,无数科学家青丝白首,我们才经历了屈指可数的几次算法跃迁。而这些算法远远不够,我们需要在此之上填补进巨大的数据和算力,才能让我们的造物看起来具有智能。

     必须承认,人类何时能够在算法技术上做出下一次突破,也许只有上帝知晓;

     而在此之前,我们却能靠自己的勤恳,把现有的技术变成有血有肉的现实。

     据此,汉柏的努力价值非凡。

    

     ▲图为一个黑人哥们在试用汉柏科技的人脸识别系统

     end

     ---

     对了,作为文章作者我再自我介绍一下。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以加我微信,fungungun。

     不想走丢的话,你也可以关注我的自媒体公众号“浅黑科技”。

     ---

     浅黑科技,让技术被读懂

    

    

    http://weixin.100md.com
返回 浅黑科技 返回首页 返回百拇医药