海外观察
-
Meta公布全新开源AI语音压缩技术:号称比MP3压缩率高10倍
11月6日消息,近日,Meta公布了一项名为“EnCodec”的AI语音压缩技术,该技术号称可以64kbps的速度压缩比MP3格式小10倍的音频,同时还能保证不会损失质量。 Met…
-
FFmpeg现已支持英伟达RTX 40系列AV1编码
11 月 7 日消息,随着英伟达、AMD、英特尔最新独显对 AV1 编码的支持,免版税的 AV1 视频编解码器日益普及,已经由多款流行软件宣布支持 AV1 编码。 现在,流行的视频…
-
Ribbon 的 Google SIP Link 认证扩展了基于云的语音服务
虽然桌面电话对于无数员工和工作场所来说仍然很重要,但它们并不一定是支持混合或移动员工的理想选择。单独考虑移动性要求,这是可以做到的,但是在家里和办公室之间拖着一部桌面电话似乎很麻烦…
-
谷歌会在 CCaaS(呼叫中心服务) 中发力吗?
由于谷歌拥有巨大的资源池,问题不在于:谷歌能否在 CCaaS 中竞争?相反,它是:谷歌会在 CCaaS 中竞争吗?激励真的足以让谷歌全力以赴吗? 是的,空间正在增长。有人认为到 2…
-
受够机器人电话了吗?FCC 呼吁行业克服 STIR/SHAKEN 限制
美国人经常面临一连串的机器人电话——仅在 9 月份就有 42 亿个机器人电话。作为针对机器人呼叫不良行为者的防御策略,联邦通信委员会实施了 STIR/SHAKEN 协议来打击非法欺…
-
Graphcore 开源 Argon Streams AV1 视频解码器验证工具
Graphcore 拥有开源的 Argon Streams AV1,这是一个全面的验证工具,支持下一代视频压缩和网络交付。Argon Streams AV1 现在可通过开放媒体联盟…
-
PS5将支持聊天软件Discord语音集成
The Verge 报道,数据挖掘者 Advaith 发现了 Discord 语音聊天集成将在不久的将来加入 PS5 的证据。可惜的是,除了已经推出的显示正在由玩的游戏功能以外,P…
-
谷歌会议将您置于下一次视频通话的前沿和中心位置
Google刚刚宣布了一个超级光滑的新更新,以便在您下次登录Meet视频通话时保持专注。 从在家工作订单开始两年多了,我们中的许多人仍在努力找出最终的WFH办公桌设置。首先,我们的…
-
Mozilla Firefox 106发布带来WebRTC改进以及Wayland的屏幕共享
Mozilla Firefox 106.0 网页浏览器的最终版本在周二官方公布Firefox 106之前已经发布到官方服务器,这一版本对其PDF浏览器以及WebRTC通信支持进行了…
-
丰田与Google合作,不用连网也能做到语音识别
目前比较先进的语音识别系统几乎都需要连接网络才能使用,这是因为要辨识语音并且转换成特定指令,需要大量运算。而携带式装置运算能力大多数不够,所以需要通过网络使用云服务协助。因此,现在…
-
多家科技公司寻求为残障人士改进语音识别工具
多家大型科技公司正在与高校合作开发语音识别技术,以更好地识别与残障人士相关的语音模式。亚马逊、苹果、谷歌、Meta和微软正在与伊利诺伊大学厄巴纳-香槟分校(University o…
-
谷歌开发音频生成模型,创造似真实声音的AI语音
目前,AI 可以生成多种形式的高质量内容,包括文字(OpenAI 的 GPT 3)、图片(谷歌的 Imagen)、视频(Meta 的 Make-A-Video)等。 各大科技公司在…
-
WhatsApp添加了一键链接以加入通话并测试32人视频聊天
WhatsApp推出了一项新功能,允许用户共享与通话的直接链接,从而更容易与您所爱的人保持联系。“呼叫链接”功能将于本周开始出现在WhatsApp上,您可以通过位于“呼叫”选项卡顶…
-
SoundHound 推出全套边缘和云连接解决方案 提高语音 AI 的准确性和隐私性
盖世汽车讯 据外媒报道,美国音频和语音识别公司 SoundHound AI, Inc.(SoundHound)宣布推出一整套边缘和云连接解决方案,使各品牌几乎可以为任何产品、设备或…
-
ChromeOS 正在复制 macOS 的最佳视频通话功能之一
有报道称,谷歌可能即将升级 ChromeOS 视频通话界面,增加一系列新功能。 自大流行开始以来,随着在家工作的增加,科技巨头甚至鲜为人知的公司都在争相提供最好的视频会议平台,以便…
-
苹果新获得两项音频专利
近日,美国专利商标局正式公布了苹果公司新授予的66项专利,其中两项与音频相关。 第一项音频专利涵盖了一种系统和方法,用于配置和调整扬声器系统输出的波束模式,以响应名为“免提波束模式…
-
语音开黑更爽快!知名聊天软件Discord将登陆PS5
据知名舅舅党Tom Henderson消息,索尼将会为PS5添加语音聊天软件Discord的完整版。Tom Henderson表示:“完整版Discord将被整合在PS5的7.0系…
-
亚马逊计划推出语音操纵游戏功能 目前已支持《死亡岛2》等游戏
亚马逊宣布将推出一款名为 Alexa Game Control 的新工具,旨在让游戏玩家使用日常化语音命令,帮助他们在游戏中执行各种动作。第一款采用该技术的游戏将是充满僵尸的《死亡…
-
日本头部直播平台Mildom与腾讯云达成合作,打造超低延时、智能互动体验
中国云厂商正在引领海外直播行业发展。 8月15日,日本头部直播平台Mildom(日本版斗鱼)宣布与腾讯云达成全面合作,将依托腾讯云遍布全球的云计算基础设施与领先的音视频、数据库、安…
-
USound带来超紧凑型可听设备音频方案
用于可听和可穿戴设备的微机电系统(MEMS)扬声器的供应商USound宣布推出旨在增强TWS和OTC助听器性能的音频模块。 “可听设备制造商现在可以制造出更符合人体工程学和舒适的设…