Fraunhofer IIS:音频编解码技术的演进让用户感受更佳的听觉体验

与非网 中字

无论是打电话,还是观看视频内容,音频效果的好坏直接决定着用户体验的好坏,为了满足越来越高的用户需求,音视频编解码公司都在为手机、电脑、电视、VR等电子产品开发新的音视频编解码技术,从而为用户提供劲爆的视听体验。最近,音频及媒体技术研究机构Fraunhofer IIS带来了一系列最新的移动音频技术,包括:增强型语音编解码器EVS技术、xHE-AAC技术、Cingo技术和音频后期制作插件Cingo Composer,以及MPEG-H解决方案。在现场,笔者还亲自感受了新技术所带来的更加清晰、沉浸式的听觉体验。

Fraunhofer IIS:音频编解码技术的演进让用户感受更佳的听觉体验

Fraunhofer IIS中国区业务代表Toni Fiedler先生

Fraunhofer IIS:音频编解码技术的演进让用户感受更佳的听觉体验

EVS技术:让移动通话更清晰

在打电话的时候,你是否遇到过音质不清晰的体验?想必大多数人都遇到过这种问题,那时你不得不让对方再重复一遍,而如今Fraunhofer IIS推出了增强型语音服务 (EVS)有望解决这一问题。Toni Fiedler先生介绍,“EVS技术是下一代3GPP VoLTE编解码器,即AMR-WB的升级版。EVS也是超宽频VoLTE/VoWiFi服务中唯一指定的编解码器,它能够为用户带来全高清语音通话质量,并能媲美当今数字媒体服务的通话保真度,配合EVS先进的鲁棒性和抗丢包功能,楼宇室内信号覆盖得到了显著提升。”

Fraunhofer IIS:音频编解码技术的演进让用户感受更佳的听觉体验

EVS技术体验现场

笔者在现场对采用EVS技术的移动电话做了通话体验,如上图所示,左侧的AMR和AMR-WB技术是现在手机上所采用的音频编解码技术,传输码率可以设置为7.4bit、12.2 bit、12.65 bit、23.85 bit四档,随着传输码率变大,语音越来越清晰;EVS-SWB技术可以设置为9.6 bit、13.2 bit、16.4 bit、24.4 bit,随着传输码率变大,语音传输也越来越清晰。经过对比发现,采用EVS-SWB技术的9.6 bit码率通话比采用AMR-WB技术的23.85 bit通话更加清晰。由此可见,新的音频编解码技术将为用户提供更佳的音频传输效果。

笔者也问了这项技术的目前的使用情况,Toni Fiedler先生解释,“美国T-Mobile,日本NTT DoCoMo,德国Vodafone Germany,德国Deutsche Telekom先后为其用户带来具有EVS技术的VoLTE服务。在中国,中国移动已完成了针对EVS技术的一轮实验室和外场试点测试,而中国移动研究院也已完成测试规范企标制定工作,并在其官方微信上发布了测试结果。”可见,中国用户也会很快用上采用EVS技术的移动通信设备。“EVS技术由12家企业合作研发,其中就包含了重要的中国企业。我认为这是中国技术走向世界舞台的一个典型案例,而这也为EVS走入中国市场奠定了坚实的基础。” Toni Fiedler补充。

Fraunhofer IIS:音频编解码技术的演进让用户感受更佳的听觉体验

xHE-AAC技术:2G用户的福音

在中国,目前大部分移动用户采用的都是4G通信,随着5G技术的研发,不远的未来我们会切换到5G,这也意味着手机通话更清晰,上网更快,人们对5G的愿景是“信息随心至,万物触手及”,Toni Fiedler指出,xHE-AAC技术是为低比特率音视频流媒体应用而开发的,能够轻松满足数字广播和移动音视频流媒体应用的需求,即在极低的比特率下(单声道低至6 kbit/s,立体声低至12kbit/s)传输各式各样的高品质音频内容。因此,在网络发生拥堵时,xHE-AAC流媒体播放器能够按需切换至极低的比特率流,并实现连续不间断的还放效果。当网络环境变好时,xHE-AAC客户端能够获取一个更高的比特率版本,并能在整个比特率范围内实现无缝切换。通过高效的编码效率而节省出的音频带宽能够使视频质量得到进一步提升。

5G时代还需要低比特率音视频流媒体吗?笔者感到大惑不解,Toni Fiedler的解释点醒了笔者,“在印度、印度尼西亚以及非洲国家还有数十亿用户采用2G通信技术,xHE-AAC技术带来了稳定可靠且不间断的音频流媒体服务。凭借该项技术,流媒体服务提供商能够显著降低CDN开销并带来更为简易的编码媒资管理方式,而用户也能够在享受高品质流媒体服务的同时节省月度流量。”

笔者在现场体验了采用xHE-AAC技术的音频播放效果,无论在那种码率下播放,音频效果始终如一,而且可以实现无缝切换,用户感觉不到切换带来的变化。

MPEG-H & Cingo:让用户感受沉浸式VR听觉体验

虽然近来VR市场变得比较平静,Toni Fiedler表示Fraunhofer IIS依然为VR设备提供基于MPEG-H的端到端VR音频系统,他解释,“这个系统囊括了沉浸式声音的制作、传输、还放乃至渲染环节。MPEG-H的先进性能包括:沉浸式声音:MPEG-H包含的3D音频组件能够带来沉浸式声音体验;互动式音频:用户可以根据自身需求调整混音比例;通用传输:MPEG-H能够在任何环境和设备上呈现最佳还放效果。”

笔者在现场体验了法国情景喜剧《Vaudeville》,带上VR头盔,用户可以360度旋转身临其境观看,似乎置身于情景剧中,声音来自四面八方,非常逼真。这是Fraunhofer IIS与法国超媒体创新机构b<>com技术研究所合作的成果,基于MPEG-H中HOA技术的端到端空间音频制作、传输、还放以及渲染系统。为了让VR还放系统端的集成工作变得更加简单,Fraunhofer IIS为其提供了VR音频SDK,从而使其拥有解码MPEG-H 3D音频的能力以及最佳的音频渲染效果,进而打造优质的VR体验。而空间音频工具箱则是全球顶尖的HOA音频前期和后期制作解决方案。

对于VR来说,除了硬件设备,内容制作也非常重要,Fraunhofer IIS为内容制作者提供了Cingo Composer插件,最近更新了BETA版本插件,凭借该插件,声音设计师能够轻松的进行混音,声像定位并实现音频对象的监听。该插件能够输出MPEG-H格式的音频元素和元数据,并为现有平台提供FOA和5.1格式音频内容。只需进行一次混音,便能够输出各种拟定发行的音频格式。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存