视频技术认证作者
-
在 OpenCV 中优化 RTSP 视频处理:克服 FPS 差异和缓冲问题
在 OpenCV 中进行视频处理时,开发人员经常会遇到与保持帧速率一致和处理缓冲问题有关的难题。无论是处理本地视频文件,还是处理来自 RTSP 流等远程源的流媒体,确保流畅播放和准…
-
高效视频超分辨率的结构化稀疏学习 | CVPR 2023
视频超分辨率(VSR)模型的高计算成本阻碍了它们在资源有限的设备上的部署,例如智能手机和无人机。现有的 VSR 模型包含大量冗余滤波器,影响了推理效率。为了修剪这些不重要的过滤器,…
-
使用人脸识别 SDK 强化您的项目:开发人员必须具备的 9 个功能
从提高安全性到改变客户体验,人脸识别 SDK 在各种计划中都至关重要。这项突破性技术已迅速进入广泛的应用领域,为各行各业提供了更高的效率、便利性和安全性。人脸识别 SDK 是这一转…
-
短剧平台如何从视频侧节省带宽/分发成本?
前几日,扬帆出海在其短剧社群内发起了一场【快问快答】活动,微帧作为嘉宾就《短剧平台如何从视频侧节省带宽/分发成本》话题做出了分享,以下是主办方收集的短剧行业从业人员较为感兴趣的6个…
-
使用 GPU 进行视频渲染和处理的优势
如今,视频渲染、编辑和处理已司空见惯。尽管企业正在广泛使用视频广播来展示其产品和服务,但它们加入这一行列的时间较晚。内容流和社交媒体服务的普及让人类第一次集体领略到视频编辑和处理的…
-
Reparo:低速网络中通过智能帧恢复的QoE感知实时视频流传输 | MM2023
本文设计了一种新的实时视频流传输方法Reparo,旨在提高用户在低速网络中的QoE。在上传客户端方面,Reparo 丢弃视频帧,使其不会被编码或传输。为了决定应该丢弃哪些帧,我们设…
-
将slowdown作为拥塞控制公平性指标 | HotNets 23
本文介绍了一种新的互联网拥塞控制公平性评估框架,传统的拥塞控制公平性评估主要侧重于流量速率公平性,但这并不总能反映不同用户的实际需求,因为用户更关心的是流完成时间(FCT)。因此,…
-
视频秒播优化方法及实践
视频起播时间,即首帧时间,是视频类应用的一个重要核心指标,也是影响用户观看体验的核心因素之一。如果视频要加载很久才能开始播放,用户放弃播放甚至离开 App 的概率都会增加。 视频秒…
-
隐式视频表征的范式变革:基于条件解码器的通用增强框架
本文介绍本课题组最近一篇隐式视频表征(NeRV, Neural Representations for Videos)领域的工作,《Boosting Neural Represen…
-
通过 5G 网络提供沉浸式 360° 视频 | RTC @scale 2024
5G 和边缘计算正在为沉浸式媒体如 360° 视频等带来新的用户体验。这些内容是实时创建的,同时也使用了上行和下行链路。在本次演讲中,我们展示了使用英特尔 Open WebRTC …
-
如何计算视频会议带宽需求
视频会议现已成为企业协作的主流。在许多情况下,它是员工、合作伙伴和客户参与的主要手段。 Metrigy 对 1400 多家公司进行的 “工作场所协作调查“。 Metri…
-
视频结构化是什么意思?视频结构化可以实现哪些功能
视频结构化是什么意思? 视频结构化是一种技术过程,它涉及将视频内容转换为结构化数据,使得计算机和人类都能更轻松地理解和处理这些信息。在视频结构化过程中,视频内容被分析、识别和提取,…
-
用于实现真实世界时间一致性视频超分的运动引导潜在扩散模型
最近,扩散模型在为图像增强任务中生成逼真细节方面表现出了令人信服的性能。然而,由于扩散过程具有随机性,因此很难控制还原图像的内容。将扩散模型应用于 VSR(Video Super-…
-
如何为visionOS准备和提供视频内容 | WWDC2023
本文将介绍使用 HLS(HTTP Live Streaming) 为 visionOS 准备和交付视频内容的方法。我们将深入了解 HLS 媒体交付流程,并探索如何扩展交付管道以支持…
-
Sora: 作为世界模拟器的视频生成模型
OpenAI新提出了一种功能强大的视频生成大模型,采用tansformer结构处理视频图像的时空块,支持不同长度、不同分辨率和不同长宽比的视频生成。其中最大的Sora模型支持长达一…
-
FLATTEN: 针对文本到视频一致性编辑的光流引导注意力机制
文本到视频编辑任务中的一个主要挑战是确保编辑后视频的帧间一致性。最近的研究致力于将文生图扩散模型应用于视频编辑任务,通过将U-Net中的2D空间注意力机制扩张为3D时空注意力机制。…
-
HiNeRV:基于分层编码神经表示的视频压缩 | NeurIPS 2023
本文提出了一种名为 HiNeRV 的神经表示模型用于视频压缩。HiNeRV 将轻量级层与新颖的分层位置编码相结合,采用深度卷积、MLP 和插值层来构建具有高容量的深而宽的网络架构。…
-
Upscale-A-Video: 实时视频超分辨率的时间一致扩散模型
基于文本的扩散模型在生成和编辑方面取得了显著的成功,显示出利用扩散模型先验生成性增强视觉内容的巨大前景。然而,由于对输出保真度和时间一致性的高要求,将扩散模型应用于视频超分辨率仍具…
-
基于网络5.0技术的网络视频会议系统
摘要:网络视频会议系统是目前网络办公和信息沟通的主要工具,已具备多样化的功能,在业务组织上分为公有云部署、私有云部署、非云化部署等形式。针对大规模部署的需要,网络视频会议构建了分层…
-
TransHuman: 基于Transformer的广义体渲染人体表示
在本文中,作者主要研究可泛化的神经渲染任务,该任务从不同人物的多视图视频中训练条件神经辐射场 (NeRF)。为了处理动态人体运动,以往的方法主要采用基于SparseConvNet …