山东卫视为什么要搞个真人配音的假“数字人”?
2023/3/9 20:20:00 声境界

一个有态度的朗读号
这个是我们之前发过的一篇文章中谈到过的视频,有网友留言说,这个数字人播音有吸气的声音,应该是个假AI。
吸气声其实我也听到了,当时认为是为了更逼真。前两天的文章《播本专业4年直接跪!人工智能语音都发展到这个水平了》中的确认是真正的AI语音,也有轻微的吸气声音,可以证明我这个想法。
而且,我觉得配音多少有点生硬,和正常的评论配音还有些区别。因此认为是AI。只是其中有一个重音的表达方式有点让我出乎意料,当时还想,人工智能都先进到这个水平了?
后来我又上网搜了一下,搜不到到底是不是真人配音,大家都没说。但我看到这样一段话:
在《山东新闻联播》节目中,数字主持人“海蓝”主要是站在一侧以“评论员”的身份播读《本台评论》,而在此之前这个小版块一直都是由女主播尚菲菲来出镜口播的,通过对比可见,数字主持人“海蓝”远远不如尚菲菲的口播效果好,甚至生硬的表情和声音还让这个小版块减色不少!

上图,就是这个数字人幕后的声音,叫“尚菲菲”。网上只说是以她为“原型”,但到底是怎么个“原型”,并没有说。我搜了下她本人的播音视频,确实比这个“数字人”播的要好。
但既然是“原型”,应该不是直接配音。不然直接说用她配音好了,为什么用“原型”二字?所以,可以理解为,以她的配音为基础,做了一些加工。
只是做的是什么加工?是像人工智能AI那样采样后重组组合,还是只做了音频上的润色?
山东卫视并没有说明,但他们用了“超写实数字主持人”这个词。这个词大概率是专有名词,不像是山东卫视发明的新词。
于是,我根据这个关键词,找到了央视的一个视频,该视频比较详细地说明了啥叫个“超写实数字主持人”,我觉得大致上说明白了。
我觉得,大致上是说,这个数字主持人的图像,是数字合成的,完全是电脑创作的,但主持人的声音,是由真人配音后,做了数字化的处理。
好处是无论谁来配音,最终出来的声音的音色是一致的,那就意味着,也许男声配音,也会出来女声的结果。
缺点是,经过处理后,声音听起来确实比真人要生硬。
但是,比较奇怪的是,山东卫视这么一家大户,应该不会太缺钱,重磅推出这么一个数字主持人,图像居然看起来非常不真实。毕竟是卫视啊,难道不比一般的公司有实力?怎么这个数字主持人的视频效果这么差?
这个“超写实”一点儿也不写实呀?现在的技术就这水平?
我从抖音上搜了一下,看了两段现在主流商业化的数字主持人的图像,觉得山东卫视“欺骗”了我们。当今的数字人技术,哪有那么差?
我录了一下,大家对比一下,确实像真人。秒杀山东卫视。大家自己比,看我说的对不对:

当然,声音不能比,声音方面还是山东卫视的要好得多,毕竟人家是卫视,有的是相关的专业人才,但图像技术,差的不止一代吧?所以,山东卫视上新一个“超写实数字主持人”,看起来是一种创新和勇敢的尝试,但他们的图像技术似乎远远落后于当今时代,那么,上这个拉胯的数字主持人,有什么必要呢?并不节省人力,效果还不如人家本人好,就是说既不省钱也不出彩,难道只为了创新而创新吗?领导决策前,不去了解一下现在的主流技术是啥水平?就那么勇敢的用落后技术吗?我们想象一下,如果做一个技术上比抖音中这个数字人效果更好的数字主持人,最起码保持一致吧,24小时值班,随时出图像,背后无论是男女配音,都可以处理成一样的效果,那还真挺牛的!因为在电视台,能配音的远远多于能出图像的主持人。
这下“电视民工”当民工也不容易了,被电脑抢了饭碗。这样一个数字人或几个数字人,绝对能解决日常播出的大问题:不用化妆,不买衣服,不休息,不要加班费,不感冒发烧,随时能换形象……既省人、省钱、省时、省力,真是铁打的年度最佳员工啊!真的不能再好了!所以,虽然山东卫视是第一家,但其实也给其它卫视留下了巨大的机会。只要向主流技术靠拢,超越这个“第一家”岂不是分分钟的事?做不了第一家,就做最好的,看起来很容易!另外,也请现在在岗的主持人们多加注意,早做准备吧。如果台里要用这样的数字人代替你,你有没有实力抗衡?
源网页 http://weixin.100md.com
返回 声境界 返回首页 返回百拇医药