-
LMM-VSC:基于语义理解的超低比特率视频压缩 | ISCAS 2026
近年来,超低码率视频压缩已成为一个关键的研究领域。然而,现有的视频压缩方法在超低码率下难以保持足够的性能,这通常表现为感知质量下降,包括细节丢失、纹理模糊和图像伪影,以及重建视频与…
-
65% 的联络中心负责人认为AI项目取得了成功,但43%的项目出现了延误或停滞
2026年6月29日, Laivly 发布最新研究,揭示了 AI 领域的一个悖论,这将定义客户服务的下一个阶段。65%的客户体验(CX)负责人认为他们最近的 AI 项目取得了成功。…
-
iOS 26.5.2 修复了近30个安全问题:主要修复 WebKit 和 WebRTC 相关问题
2026年6月29日,苹果发布了最新的iPhone软件更新iOS 26.5.2,修复了近30个安全问题。以下是详细信息。 苹果在 iOS 26.5.2 和 macOS 26.5.2…
-
Five9 重组领导层,任命新的首席技术官、首席销售官和转型与战略执行副总裁
智能客户体验平台 Five9 宣布了几项重要的领导层变动,将于 2026 年 6 月 29 日生效:Nintex 前员工 Niranjan Vijayaragavan 担任 Fiv…
-
国产芯片上跑出的万亿参数模型,美团 LongCat-2.0 正式发布
今天,美团正式发布新一代万亿参数大模型 LongCat-2.0,并将对外开源。 作为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数 1.6 T,平均激活约…
-
为何多画面体育直播已成定局
观众的收视习惯在不断变化,虽然有些趋势来去匆匆,但体育迷们对多画面功能的接受度却越来越高:即在单个视频中同时观看多场直播赛事或多个机位画面。无论是赛事中的并行比赛,还是同一赛事的不…
-
中国信通院启动“算力词元(Token)出海生态计划”
随着生成式人工智能技术加速迭代与规模化产业落地,词元(Token)已从大模型技术体系中的基础计量单位,演进为算力服务价值流通与跨境交付的核心载体。当前全球贸易格局深度调整,我国传统…
-
随着真人约会节目的衰落,流媒体平台转向了剧本式恋爱节目
根据安培分析公司(Ampere Analysis)的最新研究,全球流媒体服务越来越多地委托制作有剧本的爱情剧,而不是真人约会节目,目前超过五分之四的新爱情剧都是有剧本的。 分析师表…
-
nanocosmos 发布了首个来自实时视频部署的商业化 MOQ 性能数据
德国实时视频传输服务提供商 nanocosmos 发布了首个基于商业视频流媒体部署流量的全球 Media over QUIC (MOQ) 传输公开性能数据集。 该数据于2026年6…
-
Wine 11.12 发布,支持 Wayland 分数缩放及其他 Wayland 增强功能
Wine 11.12 打破了原定的双周发布节奏,未能如期在上周五发布,但今天终于发布了。Wine 11.12 为其 Wayland 驱动程序带来了分数缩放支持以及其他多项改进。 W…
-
OpenAPV 0.3 新增 APV RAW 编码/解码支持
OpenAPV 是由 Academy Software Foundation 开发的 OpenAPV 项目,该项目提供高级专业视频 (APV) 编解码器的参考实现。 APV 是领先…
-
模型上新:阿里推出 Fun-ASR-Flash,从“听清楚”走向“听明白”
在标准普通话、清晰录音的条件下,语音识别主流模型的准确率早已相当高。现实中的语音很少是“标准”的。它可能是一口浓重的家乡方言,可能中外夹杂、不时蹦出小语种,也可能藏着需要结合上下文…
-
Arxiv | MagiCodec:高斯噪声注入与多阶段训练实现高保真可建模音频编码
本文提出 MagiCodec,一个单层、流式Transformer音频编解码器,通过多阶段训练 + 高斯噪声注入 + 隐空间正则化,显式提升token的语义表达能力,同时保持高保真重建。
-
《云视频会议系统概念模型》等12项音视频领域行业标准发布
根据《中华人民共和国工业和信息化部公告》(2026年第12号),由全国音频、视频及多媒体系统与设备标准化技术委员会(简称“音视频标委会”)归口的《云视频会议系统概念模型》等12项行…
-
即构 ZIM 重磅推出社群(Community)能力!
社群(Community)是基于 ZEGO IM(ZIM) 新支持的即时通讯能力,可以协助开发者搭建类 Discord 的实时互动社区。满足游戏玩家、兴趣小组、粉丝运营、教育培训等…
-
通过沉浸式 3D 技术,让观看世界杯栩栩如生
TVBEurope 采访了 Immersiv.io 联合创始人 Emmanuelle Roger,了解该公司如何为英国和日本的球迷带来观看 FIFA 世界杯的全新方式。 借助 FI…
-
【音视频】CameraX 预览帧率波动
CameraX 简化了 Android 相机开发,但也埋了不少坑——预览帧率莫名其妙掉到 15fps、分析帧堆积导致 OOM、后台回来画面卡死。本文用 Claude Code 帮你…
-
StreamVX 和 SyncWords 合作开发用于直播和 OTT 的多语言 AI 字幕管道
StreamVX 和 SyncWords 达成技术合作,旨在可靠地集成 DVB-TTML 字幕。 两家公司表示,随着直播主播越来越依赖人工智能字幕来扩大多语言覆盖范围并满足无障碍需…
-
ZoomMate 如何取代 Zoom 的定制 AI 助手
ZoomMate 及其 AI 生产力套件于 6 月初首次亮相,引发了人们对 Zoom 人工智能产品线的疑问,其中最主要的问题是:ZoomMate 与 Zoom 现有的 AI Com…
-
每个成长型企业都应该了解的 VoIP 安全风险
VoIP系统如今已成为日常业务基础设施的一部分。它们通过基于互联网的通话工具连接员工、客户、销售团队、技术支持部门、远程办公人员和供应商。随着使用量的增长,语音安全漏洞会带来欺诈、…