-
ICASSP 2026 | IQ-LUT:高效图像超分的插值与量化查找表方法
“计算”和“存储”在资源受限设备中始终存在权衡。查找表(LUT)方法通过用存储换计算,实现了极快的推理速度。然而,随着感受野和量化精度的提升,LUT 的存储规模呈指数增长,严重限制…
-
2026 年如何选择最适合您业务的 AI 语音 SDK?
2026 年,AI 语音交互已从”能用”进入”好用”阶段。AI 伴侣、智能客服、语音助手、AI 教育陪练等场景对实时语音 SDK 的…
-
沙特阿拉伯 AI 聊天机器人市场:对话式 AI、客户自动化及增长展望
快速的数字化转型、AI 驱动的客户互动解决方案的日益普及,以及对个性化、多语言和自动化支持服务日益增长的需求,正在推动沙特阿拉伯 AI 聊天机器人市场中对话式 AI、自然语言处理和…
-
WhatsApp聊天记录在macOS和iOS的未加密存储中泄露
安全研究人员对 WhatsApp 在 macOS 和 iOS 上存储用户聊天数据的方式表示担忧,他们发现消息数据库可能以未加密的形式存储在应用程序组容器中,而同一开发者生态系统中的…
-
苹果发布 AI 图像压缩编解码器 PICO,同等画质下数据量可缩至三分之一
苹果公司发布了 PICO,一种利用机器学习的图像压缩编解码器。与 AV1、AV2、VVC、ECM 和 JPEG-AI 相比,PICO 能够以最多三分之一的数据量生成相同质量的图像。…
-
音视频 AI 模型进阶与实践指南
本文分享来自公众号“关键帧Keyframe”的内容,介绍音视频 AI 模型进阶与实践指南。 1、适合初级开发者尝试的 AI 模型分类 新手选择模型的核心原则是:成熟度高、有现成的移…
-
Zoom联络中心持续保持“两位数”高增长,这归功于CCaaS-UCaaS的统一化
Zoom 的 CCaaS 平台 Zoom Contact Center 又一个季度实现了“两位数高增长”。 该供应商表示,其在上一财年也实现了类似的增长,并且没有放缓的迹象。 尽管…
-
从独白到对话:AI虚拟形象如何助力企业打破“第四面墙”
近期涌现的一波高管 AI 虚拟形象,大多被视为一种新奇的尝试。无论是 CEO 以数字分身的形式出现在财报电话会议上,还是创始人推出可供员工直接咨询的虚拟分身,相关评论主要聚焦于这种…
-
2026 年一款优秀的实时音视频 SDK 需要具备的 12 大热门功能
实时音视频(RTC)SDK 的能力清单每年都在扩张。2020 年大家比拼的是能否 1v1 通话秒开,2023 年比的是 4K/超低延迟,到了 2026 年,AI 能力、跨端体验、深…
-
Sway 1.12 正式发布,新增对 Vulkan 渲染器的 HDR 支持及新协议
Sway 1.12 今日发布,这是这款基于 wlroots 库、受 i3 启发的 Wayland 合成器的最新功能版本。 Sway 1.12 在其 Vulkan 渲染器选项下运行时…
-
超越聊天机器人:人工智能如何重塑整个商业模式
在本文中,我们将探讨人工智能如何远远超越聊天机器人,并积极地重塑各行各业的整个商业模式。
-
OpenSIPS 中的最新安全修复(2026年5月)
安全性一直是 OpenSIPS 开发过程中至关重要的环节。作为一款应用于生产 SIP 基础设施的项目,OpenSIPS 需要在各种部署环境中保持稳定、可靠和安全。 近期,我们收到了…
-
从”对口型”到”数字人” 音频驱动虚拟人合成技术全景解析
本文从技术原理出发,系统梳理音频驱动虚拟人领域的发展脉络,并重点解析三篇近年最具代表性的工作:Hallo2、Let Them Talk 与 OmniHuman-1。
-
Salesforce 旗下的 Informatica 实现跨 Google Cloud、Snowflake 和 Databricks 的无头部署
Salesforce 旗下的 Informatica 通过宣布与 Google Cloud、Snowflake 和 Databricks 进行新的集成,在无头架构领域迈出了重要一步…
-
你的 AI 工具好不好,取决于你的音频质量
AI 在工作场所的应用前景十分诱人。 会议摘要、行动记录、智能搜索、能够显示发言内容和达成共识的辅助工具。这些工具已经存在,并且正在加速普及。 但对许多组织而言,这些工具的…
-
AI 伴侣应用将在 2026 年改变在线对话方式
人们对 AI 伴侣应用的看法与一两年前大不相同。起初,大多数人只是把它们当作网络潮流,出于好奇尝试一下,几天后就忘得一干二净。但到了 2026 年,人们使用这些 App 的方式已经…
-
为什么低延迟体育流媒体对直播体育OTT应用至关重要
在 OTT 平台、IPTV 服务和移动流媒体应用上,观众对体育赛事直播的需求迅速增长。如今的观众希望能够实时观看体育赛事,避免缓冲、卡顿或播放延迟。无论是足球、板球、篮球、电子竞技…
-
AI语音机器人被播客、MP3文件和YouTube视频中的“隐藏”声音劫持
安全研究人员展示了一种新型攻击,该攻击利用隐藏的音频信号操纵语音助手,使其在用户不知情的情况下执行未经授权的操作。 在一种理论场景中,一名员工参加了一个 Zoom 会议,会议中播放…
-
微软和 Zoom 拥有相似的愿景,但在战略上有所不同
几乎所有通信服务提供商都宣布了其强大的AI功能,包括智能体工作室。人们很容易得出结论,认为所有这些功能本质上都大同小异。例如,大多数解决方案似乎都利用了 OpenAI 或 Anth…
-
AV2 编解码器似乎将于本周正式发布
多年来,AV2 一直处于开发阶段,旨在取代 AV1这款优秀的开源、免版税视频编解码器。虽然之前曾有消息称AV2 将于 2025 年底发布,但最终未能实现。 不过,最新的迹象表明,A…