![音频技术](https://www.nxrte.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
![音频技术的头像](https://www.nxrte.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
音频技术认证作者
-
风噪抑制方案解析
风噪,专业名称为空气动力噪声,是由流场中运动的物体与物体之间的作用产生,或者是由流体自身的湍流运动导致的流体之间的相互作用产生。在多种实际应用场景中都可能遇到风噪的问题,常见的比如…
-
2024 年 MLB 全明星赛现场直播:新技术让音频制作变得复杂
FOX Sports 为 MLB 全明星赛制作音频的过程对观众来说可能冗长而不透明,但这对他们充分欣赏比赛绝对至关重要。由于新技术和多样化技术的应用,视频变得越来越复杂,而同步那些…
-
Interspeech2024|基于离散语音单元的流式解码器语音识别
在当今数字化时代,大模型以其强大的数据处理和复杂问题解析能力,正深刻改变着我们的现实生活。以GPT4o等为例,大模型已经具备了令人惊叹的全双工语音交互能力,其中实时交互是语音对话的…
-
牛了!无需 Wi-Fi/手机信号,通过 iPhone 和 AirPods 等设备即可一起语音聊天
苹果公司正在开发一种技术,只需使用 iPhone 和 AirPods 等耳机,无需 WiFi 或手机信号,就能让附件使用相同设备的人开始语音聊天。 这个技术就像 Apple Wat…
-
Cocos Creator 3.x 3D 空间音频解决方案!
最近在用 Cocos Creator 3.8 制作一个 3D 联机坦克大战游戏。因为项目需要,在 Cocos Creator 中实现了 3D 空间音效的方案,在此分享给大家,希望能…
-
语音生成模型整理以及LauraGPT介绍
因为最近做了一段时间的语音生成方向,期间也整理了一些开源项目和相关论文,每个或多或少都有可借鉴的地方,对于了解现阶段语音生成的相关技术还是比较有帮助的,后续也会根据自己的节奏来分享…
-
React.js 中的实时音频流:处理和播放实时音频缓冲区
本文分享在项目中如何使用 React.js 实现实时音频流功能,核心是处理通过 WebSocket 接收到的音频 Blob,将其存储在队列中,并无缝播放。 关键组件 WebSock…
-
实时音频同步(第 2 部分)
多设备音频实时同步是一项引人入胜的挑战,它涉及解决延迟问题和确保播放事件的精确定时。在本系列中,我们将深入探讨此类系统的复杂技术。在第 1 部分中,我们讨论了实现精确定时以确保无缝…
-
论文分享 | 整合音频和视觉特征进行多模态Deepfake检测
本次分享由库比蒂诺高中和纽约州立大学布法罗分校联合投稿在CVPR 2023的一篇论文:《Integrating Audio-Visual Features for Multimod…
-
ActiveRIR:一种有效评估和建模环境声学的新方法
增强现实 (AR) 和虚拟现实 (VR) 旨在人工重现导航特定环境的体验。近年来,视频游戏和娱乐公司一直在可以通过这些技术,制作与访问这些越来越身临其境的内容。 一些计算工具可以帮…
-
实时音频同步(第 1 部分)
实时同步技术错综复杂,它一直是一个令我着迷的课题。今天,我想与大家分享我构建一个系统的方法,这个系统可以在位于不同物理区域的设备之间实时同步音频。 试想一下,我们在一个家庭的多个房…
-
探索单通道语音实时去混响算法
去混响(Dereverberation)是语音会议中常用的算法之一,现在会议室大都采用玻璃幕墙导致会议室混响严重,在距离较远时语音会变得模糊不清,而去混响算法可以减少晚期混响以提升…
-
Meta 系列应用程序如何提升音频通话质量
简介 Meta 先进的回声和噪音抑制解决方案 Beryl,可提高在安卓设备上使用 WhatsApp、Messenger、Instagram 和 Facebook 通话时的音频质量—…
-
机器聆听:使语音识别系统更具包容性
与亚马逊的Alexa、苹果的Siri和Google Assistant等语音技术的交互可以提高效率和生产力来让生活更轻松。但是,在交互过程中生成和理解语音的错误很常见。当使用这些设…
-
混音:打破电子竞技音频的复杂性
电子竞技制作与现场体育有许多共同之处,但音响工程却是一个全新的游戏。IBC365 探索了在噪音的严酷环境中控制谁听到什么的复杂性。 声音在游戏体验中一直扮演着重要角色。枪声、发动机…
-
浅谈音频鉴黄技术
随着互联网的迅猛发展和网络智能化的普及,音视频内容已成为互联网传播的主流形式,各大视频网站、直播平台及短视频应用不断涌现,为亿万用户提供了丰富多样的娱乐和资讯内容。然而,这种繁荣背…
-
谷歌发布基于声学建模的无限虚拟房间增强现实鲁棒语音识别技术
声学室模拟允许在AR眼镜上以最少的真实数据进行训练,用于开发鲁棒的语音识别声音分离模型。 随着增强现实(AR)技术的强大和广泛应用,它能应用到各种日常情境中。我们对AR技术的潜能感…
-
音频调试记录!
本文主要给大家分享一下,最近调试音频的感受!作者:飞一样的成长。 音频调试 我相信大家平时学习和开发,可能接触视频编解码会比较多,对h264和h265会比较熟悉一点! 估计大家平时…
-
音频开发中常见的音频卡顿/杂音类型
在音视频开发的世界中,音频卡顿/杂音是一个常见而又棘手的问题。当我们追求高品质的音频流、实时通信或音乐应用时,这个问题就会频繁出现。 杂音是主观体验的概念,技术上常称为音频卡顿,“…
-
什么是语音商务?语音商务的原理和优势
语音商务,又称 v-commerce,是一种创新的购物方式,越来越受到全球购物者的欢迎。语音商务购物者不使用传统的网上购物工具来购买产品和服务,而是使用语音指令。 语音商务市场虽然…