视频技术
-
AI 视频生成器详解:Sora, Grok 等平台背后的技术
你是否曾好奇,为何有些人只需点击几下,就能用文字、图片甚至简单提示生成流畅的视频? 这正是 AI 视频生成器的用武之地。从学生到内容创作者,这些工具让任何人都能将创意转化为视频,无…
-
AnimeColor:基于DiT的动漫视频上色 | ACM MM 2025
动画上色是动画制作中的关键环节,然而现有动画线稿着色模型在保持颜色一致性和稳定性方面仍存在一定挑战。基于此我们提出了一种新颖的线稿视频动画上色模型-ColorAnime。Color…
-
Netflix 如何自动检测像素错误,以加强质量控制流程并提高创造力
Netflix 开发了一种自动质量控制 (QC) 方法,用于检测视频中的像素级伪影。 该解决方案旨在减少人工审核的需要,它能识别被称为热像素(hot pixels)的亮点,从而在制…
-
持续的观看体验质量需要采取积极主动的方法
如今的观众对播放问题的期望很高,但耐心却很少! 体验质量塑造品牌认知。如果视频启动缓慢、播放过程中缓冲或分辨率明显下降,就会迅速损害用户信任,引发负面评价,并最终导致订阅用户流失。…
-
动态 HDR 与视觉区分的未来
媒体公司正在投资高动态范围(HDR)技术,以提升消费者的观看体验,但许多业内人士开始质疑目前的实施是否真正发挥了该格式的潜力。可预测的制作工作流程往往依赖于压缩 HDR 信号的静态…
-
Radial Attention 如何在不牺牲质量的情况下将视频扩散成本降低 4.4 倍
扩散模型在图像合成方面取得了成功,在生成高质量、连贯的视频方面也取得了令人瞩目的进展。然而,处理视频中的额外时间维度大大增加了计算需求,尤其是在自注意力机制难以随序列长度扩展的情况…
-
2025 年体积视频压缩技术市场:受AI编解码器和沉浸式媒体需求驱动,复合年增长率达 28%
2025年体积视频压缩技术市场报告:深入分析增长动力、创新和全球机遇。探索塑造未来五年的关键趋势、预测和竞争洞察。 执行摘要和市场概览 体积视频压缩技术是实现沉浸式媒体体验的前沿技…
-
2025 年应该了解的 10 种最流行的视频格式
本文带您了解 2025 年最流行的 10 种视频格式、了解每种格式的用途,以及如何为您的工作流程选择最佳格式。 10 种最流行的视频格式 1. MP4(.mp4) MP4 仍然统治…
-
流媒体平台和 CDN:颠覆时刻
长期以来,流媒体平台一直依赖内容分发网络(CDN)来确保用户观看其提供的内容,但这种依赖性正开始削弱。流媒体的蓬勃发展重新定义了人们观看视频的方式,而 CDN 则是实现这一目标的中…
-
AVCHD 与 MP4 格式有什么区别?
在 AVCHD 和 MP4 视频格式之间犹豫不决?本文分析了这两种流行格式的主要区别,包括视频质量、文件大小、兼容性和编辑难易程度。了解哪种格式最适合您的需求! 什么是 AVCHD…
-
离线视频-LLM 现可理解实时视频流:苹果研究人员推出 StreamBridge,实现多轮主动视频理解
Video-LLM 可以一次性处理整个预先录制的视频。然而,像机器人技术和自动驾驶这样的应用需要对在线视觉信息进行因果感知和解读。这种根本性的不匹配表明了当前 Video-LLM …
-
Xbox 如何悄然解决 Xbox 云游戏延迟问题
在 GDC 2025 大会上,微软详细介绍了 Xbox 云游戏的发展历程。其中最重要的一点就是性能,特别是延迟。虽然视觉效果和功能经常成为焦点,但延迟一直是 Xbox 关注的重点。…
-
AVI 与 MOV 哪种视频格式更好?
了解 AVI 和 MOV 视频格式的优缺点,找到最符合您需求的选择。探索哪种格式最适合高质量内容、兼容性和文件大小。
-
微帧WZVQA:极致还原人眼感知,精准评估视频画质
随着移动互联网的不断发展以及智能手机的普及,短视频已逐步取代图片和文字,跻身主流媒体形式的前列。短视频平台的兴起,让数十亿用户可以制作,分享并接收彼此的信息,为人们开辟了一条全新的…
-
比特率与分辨率有什么区别(比特率与分辨率的关系)
有多种因素会影响视频流的质量,包括带宽、帧速率、文件大小、比特率、视频编解码器和分辨率。因此,在开始您的流媒体之旅之前,了解这些技术方面以及它们如何影响观看体验至关重要。 比特率和…
-
FAST、AVoD 推动 HDR 技术发展
一位业内专家表示,免费广告支持流媒体 (FAST) 频道和广告支持的视频点播 (AVoD)正在帮助推动行业采用高动态范围 (HDR) 技术。 InterDigital 媒体服务部高…
-
用于多视角视频压缩的显隐混合表达
内容摘要: 随着3D显示和虚拟现实的日益普及,多视角视频成为一种极具前景的格式。然而,其高分辨率和多相机拍摄导致数据量大幅增加,使得存储和传输成为一项具有挑战性的任务。为了解决这些…
-
ControlVideo:单镜头文本驱动的视频编辑 | 清华大学朱军团队
研究意义 文本驱动的视频编辑要求编辑后的视频应忠实地保留源视频的内容,各帧之间保持时间一致性,并且与目标文本以及 (optional) 参考图像对齐。然而,同时满足这三个要求存在很…
-
发展和提升:标准在向更多受众推广沉浸式视频中的作用
InterDigital 视频实验室元视频组主任兼负责人 Philippe Guillotel 评论了标准在为触觉技术和沉浸式视频提供基础方面的关键性。 随着我们的沟通和娱乐模式不…
-
利用 AI 模型提高视频流中手语的无障碍性
流媒体能够连接不同的观众,但让所有人都能观看视频内容仍然是一项挑战。无障碍必须成为优先事项,尤其是对于面临独特障碍的聋哑和听力障碍观众。虽然传统字幕(音频和视频)对某些人有帮助,但…