沉浸音频产业化新进展 抖音技术团队牵头制定AVS音频团体标准
创始人
2025-07-10 10:11:30
0

近日,AVS(Audio Video Standard) 音频团体标准《信息技术 虚拟现实内容表达 音频》(标准号T/AI 125-2023)发布,标志着国内沉浸音频技术在产业上应用趋于成熟,为多媒体内容多样化与个性化提供了有力的技术支撑。

沉浸音频,也称VR音频,3D音频、空间音频,是新一代音频呈现方式,相比立体声拥有更好的空间呈现效果,能精准地再现每个音源的位置和所处环境的空间信息。当前,沉浸音频带来的沉浸式体验已经在影视、广电、音乐、游戏等场景有广泛的应用。

据了解,AVS 《信息技术 虚拟现实内容表达 音频》标准由抖音视频架构沉浸音频团队牵头制定。在此过程中,该团队先后提交了20余份技术提案,贡献了多项核心技术,参加了两次复合性验证与技术评选,形成十几项前沿技术专利,开源了一套完整的空间音频渲染解决方案,经过三年时间不断完善,建立起了这项国内第三代音频内容表达标准,提供了更加丰富的多媒体呈现能力。

沉浸式音频解决方案示意图

沉浸音频是一种声场重建与还原技术,当声音进入耳朵时,在耳廓、头部附近时传播路线发生变化,到达左右耳的时间上也有微小的差别,所以真正听到的声音与原始音源并不一样,通过沉浸音频渲染,可以使佩戴耳机时与不戴耳机获得一样的听觉感受,具有三维空间感和沉浸感,具备真实环境的房间声学效果。双耳渲染演示如下图:

双耳渲染演示示意图

早在《信息技术 虚拟现实内容表达 音频》标准发布前,沉浸音频技术就得到了新媒体行业的青睐,在众多的场景中崭露头角。2022年9月中央广播电视总台“云听”客户端使用AVS VR音频标准中的耳机渲染技术完成CCTV中秋晚会现场直播;2022年11月世界杯央视转播演示系统使用了AVS VR音频标准中的扬声器渲染技术进行监听;2023年总台春节联欢晚会使用AVS VR音频标准中的耳机渲染技术完成“菁彩声”频道现场直播;2024年杭州亚运会央视体育从制作端生成元数据,按制作者意图生成实时、动态元数据下发,实现了制作、监听与下发数据的完整“菁彩声”流程。

2023年总台春晚使用AVS VR音频技术实现三维菁彩声直播

沉浸音频与VR/MR场景紧密结合。在VR/MR平台上三维视觉、触觉与三维音频现象同步,赋予了用户身临其境的真实感。《信息技术 虚拟现实内容表达 音频》空间音频渲染技术已集成在VR平台PICO上,用户可以使用其制作出具有声源的方位感、环境对声波的反射、透射等声学现象的内容作品,从而为消费者营造符合物理现实的沉浸式音频体验。目前,该项空间音频渲染技术也通过字节跳动旗下的云服务平台火山引擎面向企业客户开放。

随着《信息技术 虚拟现实内容表达 音频》标准的发布,多媒体内容表达有望朝着更沉浸的方向发展,带给用户身临其境的真实体验 。(刘晓慧)

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...