行业资讯
-
Discord 开放社交 SDK 通信功能,语音和聊天功能现可直接在游戏中集成
Discord 已正式结束其 Social SDK(社交SDK) 通信功能的封闭测试,为开发人员打开了将 Discord 支持的文本和语音聊天直接嵌入到 PC、游戏机和移动设备上的…
-
Blaize 推出用于实时多模态智能的边缘原生 AI 平台
Blaize 是一家支持人工智能的边缘计算解决方案提供商,近日推出了 Blaize AI 平台,这是一款专门构建的多模式智能边缘原生解决方案,旨在减少关键任务环境中的延迟、成本和复…
-
EBU 发布新的 HTML 图形标准
芬兰科技公司 Media Tailor 和 SPX Graphics 宣布建立合作伙伴关系,以使媒体组织能够尽可能轻松且经济高效地采用新一代 HTML 图形。 此次合作涵盖联合营销…
-
报告:2024 年 GenAI 市场规模将超过 1300 亿美元
根据物联网分析公司 Berg Insight 的研究报告,生成式人工智能 (GenAI) 市场在 2024 年大幅增长,在 GenAI 硬件、基础模型和开发平台三大主要领域均实现了…
-
SailGP 推出适用于 Apple Vision Pro 的 RaceScape XP 应用程序
SailGP 推出了一款全新的混合现实应用程序 SailGP RaceScape XP,让世界各地的帆船爱好者能够比以往更近距离地感受赛事的精彩。这款应用程序专为 Apple Vi…
-
Bitmovin React Native SDK v1.0 发布,包含 Expo SDK 和新架构支持
Bitmovin 宣布为 Bitmovin Player 发布 Bitmovin React Native SDK v1.0。 此次更新引入了对 Expo SDK 和 React …
-
Sangoma 利用 AWS 为下一代云通信提供支持
Sangoma宣布更广泛地采用亚马逊网络服务 (AWS) 来运行其 UCaaS 和联络中心解决方案,该公司表示此举将为客户提供更具可扩展性、安全性和弹性的基于云的通信系统。 San…
-
FFmpeg 8.0 合并 OpenAI Whisper Filter,实现自动语音识别
即将发布的FFmpeg 8.0多媒体库版本几乎每天都会更新。新版本中新增的功能是 Whisper 音频过滤器,它利用 OpenAI 的 Whisper 模型提供自动语音识别/转录功…
-
Google vet 为 Continua 融资 800 万美元,将 AI 代理引入群聊
2023年初,杰出工程师、Google Goggles和 Google Glass 创始人之一的 David Petrou 做出了一个令人惊讶的举动。在公司工作了17年多之后,他选…
-
Elecard 通过积极参与 SVTA 工作组加强行业合作
Elecard 是一家视频编码、流媒体、视频质量监控和分析技术软件解决方案开发商,通过加入流媒体视频技术联盟 (SVTA),不断深化其对流媒体行业的影响力。 随着 DASH-IF …
-
AstroBeam 推出首款采用实时 AI 语音对话的 VR 游戏《Stellar Cafe》
新兴虚拟现实游戏工作室 AstroBeam 推出了其首款游戏《Stellar Cafe》,该游戏展示了玩家与 AI 之间的实时语音对话。 Stellar Cafe 由 Owlche…
-
报告:加拿大视频娱乐市场保持强劲增长势头
加拿大视频娱乐行业持续稳步扩张,2024年价值增长1%,预计2025年消费者总支出将增长3%。这是根据 Futuresource Consulting 最新视频洞察报告得出的结论。…
-
边缘计算:使制造业比以往更智能、更快速、更安全
几个世纪以来,制造商一直在利用工业自动化,而如今,边缘计算和人工智能的引入比以往任何时候都更加深刻地改变了工厂管理者对效率以及如何快速做出盈利决策的思考方式。借助物联网 (IoT)…
-
Netflix 如何自动检测像素错误,以加强质量控制流程并提高创造力
Netflix 开发了一种自动质量控制 (QC) 方法,用于检测视频中的像素级伪影。 该解决方案旨在减少人工审核的需要,它能识别被称为热像素(hot pixels)的亮点,从而在制…
-
Sangoma 利用 AWS 提供灵活、安全的 UCaaS 和联络中心服务
Sangoma Technologies Corporation(简称“Sangoma”),一家值得信赖的行业领导者,为企业提供本地部署、云端或混合云通信即服务 (CaaS) 解决…
-
Zoom 借助 GPT-5 增强 AI 助手功能,重新定义虚拟助手
Zoom 对其 AI Companion 解决方案进行了重大升级,将 GPT-5 集成到其联邦 AI 架构中。 Zoom 迈出的这一步,既关乎战略定位,也关乎其原始能力。与其说是渐…
-
Exotel 推出面向 AI 代理的实时语音流
Exotel 宣布推出可编程语音基础设施,旨在为即插即用的 AI 机器人提供强大功能,进一步巩固其在 AI 驱动的客户互动和体验解决方案领域的领导地位。这款名为 Exotel Ag…
-
Nota AI 推出韩国首个基于 VLM 的商业化实时视频监控解决方案
AI 模型优化技术提供商 Nota AI 今天宣布正式推出 NVA(Nota Vision Agent),这是其实时视频监控解决方案,由尖端生成式 AI(特别是视觉语言模型 (VL…
-
Amarok 3.3.1 音乐播放器发布,改进了脚本支持
Amarok 3.3.1 已发布,这是用 Qt 编写的开源、跨平台、免费、功能丰富的音乐播放器软件Amarok 3.3系列的第一次维护更新。 Amarok 3.3 于上个月发布,是…
-
GPT-5 和 OpenAI 的开放权重模型对 CX/CCaaS 意味着什么?
GPT-5 和 OpenAI 的开放权重模型对 CX/CCaaS 意味着什么:更高的质量、私有部署选项、更清晰的成本以及更好的 RAG 工具调用。