音频技术
-
MFCCA多通道多说话人语音识别模型上线魔搭(ModelScope)
实验室研发的基于多帧跨通道注意力机制(MFCCA)的多说话人语音识别模型近日上线魔搭(ModelScope)社区,该模型在AliMeeting会议数据集上获得当前最优性能。欢迎大家…
-
语音识别系统在嘈杂的工厂环境中控制机器
如今,我们已经习惯使用语音识别软件来控制智能手机和家用电器,但类似的语音控制系统还没有进入嘈杂的工业场所。 这种情况可能很快就会改变,这要得益于德国奥尔登堡弗劳恩霍夫数字媒体技术研…
-
音频评测之专业音质听音评价的基本概念
专业音质听音评价第二期将为大家介绍一些听音评价的基本概念,以及听音评价过程中包含的重要环节。 相关阅读:第一期——音频评测之专业音质听音评价:听觉生理和心理 声音的基本概念 Sou…
-
音频评测之专业音质听音评价:听觉生理和心理
专业音质听音评价是音频评测中非常重要的环节,以下详细介绍专业音质听音评价中所涉及的听觉生理和心理。 听觉的产生- Acoustic 人的听觉过程是一个复杂的生理及心理过程。声波作用…
-
基于小波和遗传算法的声纹识别
1.什么是声纹识别 声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时,多个发…
-
浅析CTC工作原理及算法、训练过程
CTC应用背景 在语音识别和文字识别的领域,我们的数据集是音频文件和文本,但是,音频文件和文本很难在单位上对齐,比如有人说话快,有人说话慢,有的字符间距离不同,因此这种序列标签的对…
-
语音通话AI降噪技术
在日常生活中,噪声是影响语音通话质量的重要因素之一。语音降噪技术通过消除噪声并提取干净语音,从而提高语音质量和可懂度,在移动通信、耳机、会议系统、语音交互等应用中具有巨大价值。近年…
-
研究人员为低成本轻量级机器人实现基于声音的定位和映射功能
蝙蝠具有在黑暗中行动的能力,即使它们无法在视觉上感知周围环境。这种能力基于它们发射的超声波产生独特的回波模式,提供有关附近感兴趣物体或障碍物位置的信息。 图片源于:Dümbgen …
-
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部…
-
如何把语音识别功能加到你的项目中?
如何用2分钟的时间,把语音识别功能加到你的项目中? 早在十年前,就有一些大厂推出了AI开放平台,这里面就包含语音识别的功能。 用法也非常简单,大概的流程就是,先把你的语音录制成文件…
-
医疗保健领域语音技术的未来
语音人工智能最基本且未充分利用的应用存在于我们的日常活动中。例如,在医疗保健领域,新冠期间语音机器人被用于筛查患者,因为需要尽量减少面对面的接触。医疗领域的语音人工智能还可以减轻医…
-
2023人工智能将为音频时代带来什么?
音频制作领域正在迅速发展,专注于计算机视觉(CV)和自然语言处理(NLP)的工作在前一年显著增加。这促使全球学者考虑大型语言模型(LLM)和深度学习可能对该主题做出贡献。本文讨论最…
-
CTC联结时间分类的实现原理和推导公式
CTC应用背景 在语音识别和文字识别的领域,我们的数据集是音频文件和文本,但是,音频文件和文本很难在单位上对齐,比如有人说话快,有人说话慢,有的字符间距离不同,因此这种序列标签的对…
-
基于柔性压电声学的多功能可穿戴贴片,可集成传感、定位及水下通信功能
流体动力与机电系统国家重点实验室谢金教授团队联合英国诺森比亚大学傅永庆教授开发了一种基于柔性压电声学的具有传感、通信和定位功能的无线平台。在高频(~13 MHz)刺激下,可激发兰姆…
-
美国声学学会 | 声学专利综述4
这些声学专利审查的目的是为期刊读者提供足够的信息,以决定是否从专利本身寻求更多的信息。本文仅代表审稿人个人意见,不属于法律意见。具体专利可在USPTO网站上获得。 本期的审稿人:G…
-
语音识别系列之脉冲神经网络特征工程
人工神经网络(Artificial Neural Network, ANN)中的单个人工神经元是对生物神经元的高度抽象、提炼和简化,模拟了后者的若干基本性质。得益于误差反向传播算法…
-
音频评测之音质主观评测
专业音质听音评价第二期将为大家介绍听音评价过程中包含的重要环节。 一 主观音质评价 音质评价就是运用各种客观和主观的方法对声音的质量做一个科学、广泛、综合的定性和定量分析。 音质是…
-
音频评测-专业音质听音评价的基本概念
专业音质听音评价第二期将为大家介绍一些听音评价的基本概念。 声音的基本概念 Sound & Audio 一 声音的基本要素 声音三要素是响度、音高、音色。人耳对声音能量的感…
-
音频评测-专业音质听音评价的听觉生理和心理
听觉的产生- Acoustic 人的听觉过程是一个复杂的生理及心理过程。声波作用于听觉器官,引起听感细胞的兴奋并导致听神经的电脉冲发放传入信息,经各级听觉中枢分析后便产生听觉。 一…
-
相机录制中如何实现声音采集和声音处理
相机录制的过程除了采集画面,还有采集音频数据的过程,我们今天就主要介绍一下声音采集的过程以及采集的声音是怎么处理的。 相机预览的上面可以“选择音乐”,如果选择音乐了,在真正进行录制…