【顶会论文】自动化所生成对抗网络GAN研究在人脸识别领域再获新进展
2018/9/20 10:06:28 中国科学院自动化研究所

CASIA点击蓝字关注我们↑↑↑↑

GAN缘何入选2018年"全球十大突破性技术"?
日前,《麻省理工科技评论》正式公布了2018年“全球十大突破性技术”(10 Breakthrough Technologies 2018),涵盖:实用型金属3D打印、人造胚胎、智慧传感城市、面向每一个人的人工智能、对抗性神经网络/生成对抗网络、巴别鱼实时翻译耳塞、零碳天然气、完美的网络隐私保护、基因占卜、材料的量子飞跃。这也是这份指南第17次发布。

来自网络
回看过去几年的上榜技术,越来越多的人工智能相关技术入选榜单,其中包括:2008 年机器学习、2009 年的 Siri、2013 年的深度学习、2014 年的神经形态芯片、2016 年的语音接口与知识分享型机器人,以及 2017 年的自动驾驶卡车与强化学习。
2018年,最具突破性的人工智能技术之一就是对抗性神经网络(Dueling Neural Networks) / 生成对抗网络(GAN)——通过两个AI系统的竞争对抗,极大化加速机器学习的过程,进而赋予机器智能过去从未企及的想象力。
自动化所改良后的GAN,性能更优越
Ian Goodfellow发明出GAN后,获得Yann LeCun、黄仁勋、吴恩达等人的赞赏,吸引了诸多的机构及企业开始研究。在中国,部分学术机构致力于研究GAN理论的近一步改良及优化,其中中科院自动化所孙哲南、赫然研究团队已经取得了一系列进展,受人类视觉识别过程的启发,提出了双路径GAN(TP-GAN)用于正面人脸图像合成,已发表于2017年国际计算机视觉大会(ICCV)。随后又提出了基于姿态信息指导的共轭判别器GAN(CAPG-GAN),用于多姿态人脸图像合成,并进一步提高了跨姿态识别精度,已发表于2018年IEEE国际计算机视觉与模式识别会议(CVPR)。
近日,自动化所曹杰、胡一博、张鸿文、赫然、孙哲南在论文Learning a High Fidelity Pose Invariant Model for High-resolution Face Frontalization中提出了高保真度的姿态不变模型(High Fidelity Pose Invariant Model, HF-PIM)来克服人脸识别任务中最为经典的姿态不一致问题。
实验结果表明,该方法在多个基准数据集的视觉效果和定量指标都优于目前已有的最好方法。此外,HF-PIM所支持的生成图像分辨率也在原有方法的基础上提升了一倍。该论文已被人工智能领域顶会神经信息处理系统大会(NIPS)收录。

高保真度的姿态不变模型示意图
论文解析
在该论文中,作者总结了先前工作中存在的一些限制,例如,过于依赖低维信息约束,不能很好地保持原图的语义信息等。为了解决这些问题,作者对其具体做法进行如下总结:
②设计了一种全新的纹理扭曲(warping)过程,可以有效地把人脸纹理映射到图像域,同时又可以最大程度地保持输入的语义信息。
③提出了一种对抗残差字典学习过程,从而可以在不依赖三维数据的情况下更有效地学习人脸纹理特征。
④实验表明,该方法不仅在定量和定性指标上明显地超过了已有方法,并且把生成图像的分辨率提高了一倍。

来自论文
上图是在CelebA数据库的HQ子集上的可视化结果,第一行为输入图像,第二行为通过HF-PIM模型进行人脸正面化后的结果。HF-PIM是首个支持生成256*256可视化结果的模型。

来自论文
上图在IJBA数据库上的可视化结果,第一行为输入图像,第二行为通过HF-PIM模型进行人脸正面化后的结果。

在LFW(左图)数据库和IJB-A(右图)数据库上和已有方法的对比结果。ACC: 准确率。AUC:ROC曲线下面积。FAR:错误接受率。Rank-1:第一次命中识别率。

在Multi-PIE数据库上在不同的视角下对第一次命中识别率的对比。
更多精彩内容,欢迎关注
中科院自动化所官方网站:
http://www.ia.ac.cn
欢迎后台留言、推荐您感兴趣的话题、内容或资讯,小编恭候您的意见和建议!如需转载或投稿,请后台私信。
作者:曹杰
审稿:赫然
排版:史梦婷
编辑:鲁宁
中科院自动化研究所
微信:casia1956
欢迎搭乘自动化所AI旗舰号!
点击"阅读原文"下载全文
源网页 http://weixin.100md.com
返回 中国科学院自动化研究所 返回首页 返回百拇医药