-
美团 LongCat-Video-Avatar 发布,实现开源SOTA级拟真表现
今年 8 月,美团开源的 InfiniteTalk 项目凭借无限长度生成能力与精准的唇形、头部、表情及姿态同步表现,迅速成为语音驱动虚拟人领域的主流工具,吸引全球数十万名开发者的使…
-
Android 集成 ZIM SDK 实现聊天消息置顶的功能
ZEGO 即时通讯 SDK(ZIM SDK)2.25.0 版本新增“消息置顶”功能,用户可以将会话中的消息固定在会话顶部,方便会话中的所有用户快速查看重要消息。 本文将简单介绍如何…
-
数字人动画云端渲染方案
为解决拟我形象在多场景展示中依赖 3D 渲染导致的性能与接入问题,本文提出将形象预先导出为视频或动图资源。对比三种技术路径后,最终选择 Puppeteer + H5 渲染帧 + F…
-
ZainTECH 和 Vortex 强强联手,革新视频压缩和 AI 视觉智能
Zain 集团旗下集成数字解决方案部门 ZainTECH 宣布与 Vortex Global 建立战略合作伙伴关系。Vortex Global 是一家以监控和视觉智能创新而闻名的尖…
-
TOMM | 针对人脸视频的混合编码方案
本文提出一种融合传统编码与生成式压缩的人脸视频混合压缩方案,该方案结合了传统编码的像素级还原能力与深度生成模型的细节生成能力,能够在低码率条件下实时实现高保真人脸视频压缩。
-
Meta AI 眼镜新增 Spotify 集成和语音增强功能
近日,Meta 公司宣布为其 Ray-Ban 及 Oakley 智能眼镜推出 v21 软件更新。这次更新引入了对话增强技术和 AI 驱动的音乐匹配功能,可根据用户的视线做出反应——…
-
Cocos Creator V3.8.8版本正式发布
2025年12月18日,Cocos 官微宣布 Cocos Creator V3.8.8 版本现已正式发布。各位开发者可通过 Cocos Dashboard 下载新版本。让我们一起来…
-
【音视频】滤镜使用与处理
这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍滤镜使用与处理。 ——来自公众号“关键帧Key…
-
NDI与Zoom携手合作,为会议和活动空间带来无缝连接
2025年12月17日,NDI 与 AI 优先的协作平台 Zoom 宣布达成战略合作,将 NDI Advanced 技术集成到 Zoom 的多款产品中。此次合作将助力企业利用灵活、…
-
Netwatch 宣布与 GI Partners 达成收购协议
2025 年 12 月 17 日,全球 AI 安全服务提供商 Netwatch 宣布,公司已签署最终协议,将被 GI Partners 收购。 Netwatch 是全球知名智能安防…
-
英特尔视频处理库新增 AI 辅助视频编码器功能
英特尔视频处理库“libvpl”在圣诞假期前夕发布了新版本。libvpl 2.16 的唯一重大变更在于新增了支持 AI 辅助视频编码功能的实验性 API。 该库作为调度器,可对接英…
-
主流第三方直播SDK对比,第三方直播sdk收费标准
直播业务概述 大家所熟知的直播平台虎牙、斗鱼、快手、抖音、B站,直播功能看似普遍,但从零到一开发却不简单。直播中运用到的技术难点非常之多,音频视频处理/编解码,前后处理,直播分发,…
-
2026 年 WebRTC 五大预测:Tsahi Levent-Levi 谈 AV1、MOQ 以及可能出现的问题
本文分享内容来自 webrtc.ventures 首席执行官 Arin Sime 和 WebRTC 行业资深权威人士、 BlogGeek.me 的 Tsahi Levent-Lev…
-
SIGGRAPH Asia 2025:摩尔线程赢图形顶会3DGS挑战赛大奖,自研LiteGS全面开源
12月17日,在香港举办的全球图形学领域备受瞩目的顶级学术盛会 SIGGRAPH Asia 2025上,摩尔线程在3D Gaussian Splatting Reconstruct…
-
Ai2 推出 Molmo 2 开源视频语言模型
Ai2(艾伦人工智能研究所)周二发布了 Molmo 2,这是一套开源视频语言模型。新增的模型以及训练数据表明了这家非营利机构对开源的持续承诺,这对希望更好地控制模型使用的企业来说是…
-
体育流媒体平台如何推动粉丝互动新时代
流媒体的下一个前沿领域不仅在于内容的传输方式,还在于内容的盈利模式和安全保障。
-
Atombeam 和 Digital Barriers 合作为客户提供端到端的带宽解决方案
数据和人工智能技术公司 Atombeam 昨日宣布已与 Digital Barriers 合作,后者是一家视频技术提供商,致力于为个人、组织和社会提供即时洞察,以做出关键任务决策。…
-
诺基亚:基于 V-DMC 的高效 3D 网格压缩技术
实时 3D 一直存在扩展性问题。每次捕捉的瞬间都会生成一个包含成千上万甚至数百万个顶点的网格,这些顶点在帧与帧之间会不可预测地移动。虽然跟踪网格压缩对于可预测的、类似动画的序列效果…
-
基于音视频分流技术的呼叫中心视频能力升级方案
摘要:随着通信技术的发展和客户需求的提高,传统呼叫中心升级为视频呼叫中心成为必然趋势。探讨了基于音视频分流技术的呼叫中心视频能力升级的有效方案及优势。视频呼叫中心升级能提升客户体验…
-
Vonage 通过 Salesforce 的 Agentforce Voice 集成,深化原生联络中心
2025年12月16日,爱立信旗下公司 Vonage 宣布,Vonage联络中心与Salesforce的Agentforce 360完成全新集成,为企业提供单一的AI驱动平台,…