SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

2025年11月14日,SHAC(Spherical Harmonic Audio Codec,球面谐波音频编解码器)开发团队宣布,全球首个交互式空间音频格式正式开源发布。SHAC 由创始人 Clarke Zyz 与 Anthropic 公司的人工智能系统 Claude 历时八个月合作开发而成,用户只需使用标准耳机和 Web 浏览器即可畅游三维音频环境。

SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

不同于将听众固定在参考点的传统空间音频,SHAC 支持六自由度(6DOF)操控,使用户通过 WASD键盘、游戏手柄或触控导航等常规输入设备在三维声场中自由移动。该格式可在任意 Web 浏览器中运行,仅需普通耳机即可体验,无需 VR 头显、专用硬件或软件安装。

从技术角度来看,SHAC采用三阶Ambisonics技术,结合预渲染的双耳音频,通过其优化的文件格式,实现了8.6倍的实时播放性能和低于50毫秒的导航延迟。该格式支持对音乐、对话和音景的交互式探索,让听众体验“音频架构”,即将声音视为一个可导航的空间,而非被动的录音。

此次开源版本包含完整的格式规范、参考实现、SHAC Studio(一款跨平台桌面编辑器)以及基于浏览器的SHAC播放器。这些组件共同构成了一个完整的生态系统,供艺术家、开发者和教育工作者自由地创作和分享空间音频体验。

Zyz表示:“SHAC代表了好奇心与协作相结合所产生的创新。我一开始没有任何正规的编程基础,但有了人工智能这个创意和技术伙伴,我可以将抽象的想法转化为可行的技术。我希望SHAC能够帮助其他人意识到,获得先进工具不应该取决于资质——而只需要想象力。”

SHAC的应用远不止于音乐领域。其精确的声场建模和便携性使其适用于游戏开发、沉浸式教育、视障用户的无障碍设计以及培训模拟。潜在的应用场景包括纯音频游戏、博物馆音景、虚拟学习环境和治疗性声音沉浸体验。

Zyz 独特的开发历程:从自学实验到借助人工智能构建博士级别的空间音频编解码器,引发了人们对软件创作方式变革的关注。他与 Claude 的合作凸显了人工智能系统如何在复杂的技术开发中扮演创意伙伴的角色,从而连接视觉、计算和可访问性。

Zyz 希望通过免费提供 SHAC,培养一个创作者社群,让他们在他 2025 年至 2030 年缺席期间继续推进这一格式的发展。

SHAC 采用 MIT 许可证发布,可免费用于个人和商业用途。

要访问 SHAC 存储库、技术文档和示例文件(用户可以通过在线演示立即测试该技术),请访问https://shac.dev/ 或 https://github.com/clarkezyz。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/63015.html

(0)

相关推荐

发表回复

登录后才能评论