腾讯:用AI唤醒聋人
2021/3/3 19:36:14 卢泓言
“行善”二字,可以有无数下手处,比如扶助弱者也是行善。若能帮一个无力无助的弱者改变命运,其能力何其大?其意义何其大?
弱者之所以弱,是因为他们无力发出自己的声音,声音不被听到,就被遗忘。中国有8500万残疾人,但在生活中,我们很少感知到他们的存在,就像很少见到盲道上有盲人行走。而强者之所以强,就是要主动关注到弱者,传播出那些没有被发出来的“声音”。
聋哑群体,就是很难自己发出声音的一个人群。
在2019年定下“科技向善”为愿景的腾讯,也确实在做实事,2020年“天籁行动”发起,面向公益开发者、设备厂商、相关机构,免费开放腾讯多年积累的天籁AI音频技术,给人工耳蜗消除噪音,帮助聋人从“听得见”到“听得清”。
今天3月3号是全球爱耳日,腾讯天籁联合新华社·声在中国、中国听力语言康复研究中心、中国听力医学发展基金会等,推出了线上听力筛查工具。
世卫组织的最新数据,目前全球1/5的人听力受损,超过15亿人,到2050年,预计1/4的人将会听力受损,超过25亿人。在听力损失刚发生时,一般生活只会受到轻微影响,老年人通常对听力变化并不在意。但听力衰退初期,是干预的最佳时机,而此阶段往往被99%的人忽视。
所以大面积的免费的听力筛查,就可以让很多人及时的发现自己的听力问题,及时的扭转。
? ? ?
长按上图识别二维码,测试听力
而不管15亿还是25亿,都只是冰冷的数字,必须讲出来一个真实的故事,切身的走入一个鲜活的生活。
恰好,这里有一个已经把我打动的故事,可以讲出来给大家听听。
时间回到17年前,一个佛山普通家庭的小女孩出生,她叫宋晓婷。
宋晓婷一出生就听不清楚声音,但没人发现。她喜欢跳舞,一岁多就会跟着音箱上的灯光闪烁舞动。
直到两岁,她还不会说话。去医院检查才发现,她是先天失聪。
鼓声成为她和舞蹈世界的连接方式。她听不清楚音乐,只能通过脚尖感觉音乐鼓点的震动,努力记忆动作。有时候,连音乐的震动声都感觉不到,她就在心里默默数拍子,跟上节奏。
尽管如此,却又很快得知一个更艰难的事实:随着晓婷长大,听力将继续衰减,这仅有的鼓声,也将从她的听觉里消失。
2018年,转机出现了。
广东把人工耳蜗纳入社保,晓婷拿到其中一个免费名额。手术一个月后,晓婷的人工耳蜗开机了。她第一次从妈妈翕动的嘴唇里,听到了自己的名字,“你叫宋晓婷”。
戴上耳蜗后的晓婷,第一次自己下楼去超市、过马路、坐公交……一个有声的世界,在她面前徐徐展开。
那一年,晓婷登上了中央电视台少儿春节联欢晚会的舞台。晓婷穿着碧绿长裙,在舞台中央露出了灿烂笑容。
? ?
? ?

晓婷
戴上人工耳蜗,听见声音,似乎已经改变了这个女孩的命运。她变得自信,未来开始充满无限可能。但事实并非如此。
“我能听到,但我听不懂。”
就像晓婷跟妈妈说的,“听得见”不意味着“听得清”。她听到的声音,仍然与正常人有着很大差距。人工耳蜗传到她耳朵里的声音,大部分都是噪音,没有细节。
你可以想想一个雾气朦胧的澡堂里,一切都是烟雾缭绕的,你看不清、摸不透。这种像被一层布阻隔、无法确定的声音,就是听障人群听到的世界。
2020年,晓婷离开佛山,前往广州念高中。同一年,这个小女孩的命运和一群工程师发生了交汇。
“对我们健全人来说,一直在雾气弥漫的场景里看东西,可以想象多么痛苦。对于听障人士而言,他们一辈子,每天24小时,都被困在了这样的环境里。如果我们的技术能够为他们提供一些帮助,让他们听的更清楚,那真是一件非常有意义的事情。”
因为工作需要,常年和噪声打交道的商世东接触到“听障人群”后,萌生了这个想法。商世东和晓婷,两个陌生人的命运从此联系到一起。
商世东曾是腾讯多媒体实验室音频技术中心高级总监,2020年12月担任腾讯天籁实验室负责人。加入腾讯前,商世东在2010年组建了杜比北京工程团队,任职杜比北京和悉尼工程团队高级总监9年。加入腾讯后,带领音频团队,负责音频的框架设计和开发工作,支持腾讯内多个实时音视频产品,比如腾讯会议。
商世东的职业生涯目睹了音频技术迭代的历史。“科技可以改善生活 ,也可以弥补缺陷”,这一次,他将目光投向了听障人士。
“公开资料显示中国有8500多万残疾人,但在生活中,你很少感知到他们的存在,就像你很少见到盲道上有盲人行走”,商世东认为,“这是因为我们的‘无障碍建设’做得还不够好”。
萌生了这个想法后,商世东和团队针对听障人群做了大量调研,也分析了国内外很多关于降噪技术在听障方面的应用的研究,发现“噪声”确实是困扰听障人群的一大障碍。
商世东找到了国内人工耳蜗厂商诺尔康,所谓人工耳蜗,就是一个电子装置,把声音信号变成电信号,电信号经过计算机编程,告诉它怎么刺激神经,人就可以产生听觉。

商世东
双方一拍即合,决定研发由AI降噪技术加持的新一代的人工耳蜗,也就是把噪音自动过滤掉,让人直接听见清晰的有意义的声音。
晓婷,成为了新一代人工耳蜗的早期试用者。
“她非常兴奋,整个人的状态非常好,她本就是一个活泼的小姑娘。”商世东回忆起看到晓婷戴上新一代人工耳蜗之后的场景。
用上AI降噪技术之后,晓婷不仅能够听清鸟叫、风声、甚至能透过嘈杂的环境声听到妈妈的声音。这时她的眼睛就发亮了,从一个世界到了另外一个世界。
过去,晓婷只能粗略地分辨男女声,听到妈妈的声音像是“老人家说话的沙哑的声音”;刚戴上新耳蜗,她对妈妈说:你的声音原来更尖细,和爸爸不一样。
一次,妈妈骑着摩托车送晓婷上课,风声吹过,女儿拍了拍她的后背,“妈妈,你的手机响了”。妈妈当时差点哭出来,这几乎是这些年来最幸福的时刻。
AI降噪技术,唤醒了晓婷沉睡的耳朵,细腻鲜活的声音细节涌入了她的世界。她说,“好像施展了魔法,我耳中的噪音被猎人带走了。”
当然,施展魔法的噪音猎人,其研发并不顺利。
消除噪音一直是一个难题。电话早在一百多年前就发明了,但是人类却一直没有解决通话噪音的问题。放眼人类一百多年的语音通话史,也是一段对抗噪音的历史。
比如在嘈杂的菜市场,之所以我们能清晰地听到对面菜贩子的说话,是因为耳朵选择性屏蔽了比如剁肉、吆喝等等的嘈杂声。而商世东团队要做的,就是让机器设备也能像人一样。
想要消除噪音,就需要识别噪音,再主动干预。这个看似简单的方法困扰了技术人员上百年,因为其难点在于识别哪些是噪音。声音处理是最难的,声音数据是一维、图像是二维、视频是三维,维度越少难度越高。
幸运的是,有了AI的加持。商世东团队在菜市场、在办公室、在马路上,在一切存在噪音的地方采集了海量的声音数据,做裁剪和清洗、提取特征,再加入模型训练,如果模型准确率达不到99%,就持续收集,一直做到标准为止。
目前,基于机器学习的AI降噪模型,商世东团队将识别率提升到了96.2%,超过了大多数开源模型。
跟诺尔康的技术团队的合作,从想法提出到算法验证,及产品落地,用了近一年,经历无数次版本迭代。
人工耳蜗芯片体积有限,兼容差、计算能力弱,不足以承载大量的运算。经历了反复探讨和验证,他们找到了解决方案:手机伴侣+人工耳蜗。
简而言之,就是将计算处理过程转移到手机上,由手机对信号进行处理、过滤,再通过蓝牙设备,将信号发送到人工耳蜗。
而手机伴侣的解决方案,对延迟要求极高,一旦超过200毫秒人将会感到不适。就像看电影一样,声音如果延迟视频画面,观众就能明显感到不舒服。
面对挑战,商世东带领团队连续熬夜攻坚,试图找到一种更快速的AI算法。最终,结合腾讯会议上的经验和配置数据,将延迟控制到150毫秒以内。
2020年9月27日,国际聋人日,新一代人工耳蜗的试戴者晓婷和妈妈一起来到了深圳,终于见到了捉走她耳朵中噪声的“猎人”,商世东和他的团队。
当天,腾讯天籁实验室宣布联合深圳市无障碍信息研究会、腾讯公益基金会等机构,面向行业开放天籁音频AI降噪技术,发起“天籁行动”,希望更多像诺尔康这样的厂商和开发者加入到关注听障人群的行列。
“过去我们的工作更聚焦在算法突破和产品研发,没想到我们的技术还可以给听障人群的生活带来一些改变,这让我和团队受到非常大的鼓舞。”商世东从晓婷身上看到了技术的无限可能性。
“接下来我们希望把算法做得更好,在帮助更多听障人士听得更清楚的同时,也可以探索AI降噪技术的更多应用场景,比如五六十岁的老年人,他们的听力退化之后,也可以通过我们的技术提升。”
今天爱耳日上线的听力筛查工具,就是一个大过滤器的入口,要让大量的有听力障碍的人群自动浮出水面。
想要解决这一问题的这群噪音猎人,也是腾讯“不务正业”产业人的一个缩影,他们在街巷之间捕获噪音,也狙击噪音,唤醒沉睡的耳朵。
他们正在用技术不断改善这个世界,让世界对于每一个弱者都更加清晰,充满希望,改变命运。
现实中,很多听障孩子的家长会早早放弃孩子,“认命了”,等孩子长大成人随便安排进工厂作劳力。但晓婷和她的妈妈不这样想。
考上当地最好的特殊高中后,晓婷决心学计算机,她想,自己完全能成为一名文职工作者。戴上人工耳蜗后,她又有了更明确的目标:要考上北京一所大学的特殊教育学院,那里被誉为听障人群的清北。她为此每天在宿舍用手电学习到午夜,凌晨5点半起床再学习;课间休息的10分钟,她趴在桌上写作业,顾不上喝水。
此情此景,善莫大焉。
源网页 http://weixin.100md.com
返回 卢泓言 返回首页 返回百拇医药