你的 AI 工具好不好,取决于你的音频质量

AI 在工作场所的应用前景十分诱人。  

会议摘要、行动记录、智能搜索、能够显示发言内容和达成共识的辅助工具。这些工具已经存在,并且正在加速普及。  

但对许多组织而言,这些工具的表现却不尽如人意。并非技术不够好,而是因为输入数据不够好。 

当 AI 需要在充斥着背景噪音、串音、麦克风拾音不稳定或音频中断的会议环境中工作时,输出结果就会受到影响。  

摘要遗漏了细节,行动事项不完整,记录不可靠。  

AI 的水平取决于它听到的信息。 

你的 AI 工具好不好,取决于你的音频质量

Jabra 产品营销经理 Richard Trestain认为,业界需要更公开地进行这样的对话 。 

“我们现在谈论 AI ,都把它当成软件方面的话题了,”他说。  

“但是,AI 捕捉到的声音质量完全取决于输入音频的质量。这两者是无法分开的。” 

混合办公的喧嚣现实 

混合办公模式已经成熟。办公室正在逐渐恢复正常,但这种灵活性已成为常态。白领员工在一周的工作时间内经常需要在办公室、家庭环境和第三方地点之间切换。  

这些环境都会产生噪音。开放式办公室噪音更大,部分原因是协作更加频繁。  

你旁边的人正在打电话,或者你自己正在打电话。而且,越来越多的人开始对着 AI 助手大声说话,这又给周围环境增添了一层环境噪音。 

结果是,任何一次会议的背景条件都难以预测,而且往往很差。  

“大家都变得更吵闹了,”Trestain 说。“办公室虽然回来了,但大多数人仍然在多个地点办公。一切都关乎灵活性,而大多数办公环境都很嘈杂。” 

对于依赖清晰音频采集的 AI 工具(例如实时转录、会议摘要、语音搜索)而言,这是一个结构性问题。  

这不是一次性的个案,而是一种持续存在的模式,这种模式每天每次通话都会出现。 

从宽容到苛求

随着技术变革,文化观念也在发生转变。几年前混合办公模式刚兴起时,人们对音质不佳还能宽容以待,但这种宽容期已经过去。

“这种宽容已经不复存在,”Trestain 说。“一旦有人声音断断续续,或者背景有很大噪音,人们就会立刻说:‘听不清。’”

他举了一个贴切的比喻:使用专业耳机,就相当于音频领域的虚拟背景。“我们都知道在视频通话中要设置背景。耳机在某种程度上相当于声音的背景虚化。一旦有噪音渗入,会议就完了。”

这在实践中意味着,音质不佳不再仅仅是舒适度的问题,它关乎信任与公信力。最终,这会对工作效率产生重大影响。“如果你正试图说服他人改变主意,或者需要主持会议,那么音质不佳会让你处于巨大的劣势。”

这种信任危机也蔓延到了人工智能的输出结果上。当会议总结不完整,或者通话中的行动事项有误时,人们对工具的信心就会下降,即使真正的问题出在输入的音频上。 

降噪:不仅仅是一项功能 

专业音频领域最容易被误解的方面之一是降噪技术究竟需要做什么,而这其中包含两个截然不同的方面。 

首先是对外:确保你所说的话清晰地传输,在麦克风信号到达其他参与者或 AI 转录引擎之前,去除麦克风信号中的背景噪音。  

第二点是针对内部环境的:保护听者免受自身环境的干扰,以便他们能够集中精力并跟上对话,而无需大脑过度运转来过滤干扰。 

Trestain 解释说,大多数企业耳机在通话期间不提供主动降噪 (ANC) 功能。  

技术上的挑战在于侧音,也就是你自己的声音自然地反馈到耳朵里,使说话感觉自然。而同时还要阻挡环境噪音,这确实非常困难。 

“我们通过 Jabra Evolve 3 75 和 85 耳机实现了这两点。我们是唯一一款在通话过程中支持主动降噪和侧音功能的耳机。它能让你免受周围噪音的干扰,让你自然地听到自己的声音,也能让对方清晰地听到你的声音。这才是理想的通话体验。”  

对于 AI 会议工具而言,这一点比企业通常意识到的更为重要。  

音频源中的每一层噪声都会降低转录的准确性,从而降低每个下游输出的质量:摘要、操作列表、可搜索记录。  

输入阶段的干净采集对整个 AI 工作流程都有积极的影响。 

IT/UC标准化案例 

阻碍大多数组织解决这个问题的不仅仅是意识不足,还有标准和个人便利性。Trestain 观察到的最常见模式是对个人设备的放任态度:员工自带耳机,通常是通勤时佩戴的消费级耳塞,并且毫不犹豫地用它们进行工作通话。 

“消费类设备的设计初衷并非为了与平台完美兼容。它们的设计目的也不是为了便于IT部门大规模管理。而且,它们在通话降噪方面表现也不尽如人意。因此,通常情况下,你会得到次优的体验。” 

他表示,那些始终取得更好成果的组织都拥有明确的设备标准。“那些严格执行专业音频设备部署的组织往往能取得最大的成功。他们为员工提供耳机,让他们乐于在任何地方使用,而不仅仅是在办公室。” 

音频人工智能就绪度基准 

如果企业希望 AI 协作工具兑现其承诺,那么出发点很明确:将音频质量视为基础设施,而不是个人偏好。 

这意味着要制定基于角色的标准:呼叫中心客服人员、办公室知识工作者和经常出差的商务人士的需求各不相同,但都需要明确的最低标准。  

这意味着选择专为企业环境设计的设备:经过平台认证、可远程管理、专为在不可预测的条件下保证通话质量而打造。  

这意味着要考虑全局:你的员工在哪里工作?噪音环境如何?他们的设备是否能很好地完成两项任务——个人聆听和专业沟通? 

“如果把所有因素简化一下,”特雷斯坦说,“本质上就是舒适度和通话质量。但当在此基础上加上 AI 时,输入就变得至关重要了。” 

原文:https://www.uctoday.com/devices-workspace-tech/your-ai-tools-are-only-as-good-as-your-audio/

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/66933.html

(0)

相关推荐