视频技术
-
AVID: 基于扩散模型的任意长视频修复 | CVPR 2024
这篇文章提出了一种名为AVID(Any-Length Video Inpainting with Diffusion Model)的视频修复方法。AVID能够处理不同长度的视频,并…
-
Android视频开发入门: VideoView、MediaPlayer、 FFmpeg、exoplayer…
现在,视频功能是越来越普遍的需求。本文将提供一个关于Android视频开发的入门指南,帮助读者快速掌握视频播放、录制和处理等基本功能。 作者:陆业聪 1. 概述 在Android平…
-
VideoMAE:掩蔽自编码器是自监督视频预训练的高效数据学习器 | NeurIPS 2022
通常需要在超大规模的数据集上对Vision Transformer(ViT)进行预训练,以在相对较小的数据集上实现更好的性能。在本文中,作者证明了视频掩蔽自编码器(VideoMAE…
-
流媒体大战:端到端质量保证和视频分析让流媒体服务提供商占尽先机
在竞争激烈的流媒体领域,留住用户的战斗不断加剧。要在视频流媒体环境中取得成功,就必须在内容获取和原创制作方面持续投资,同时注重提供卓越的用户体验,并利用数据洞察力在快速变化的环境中…
-
采用 React 前端的 Node.js HLS 服务器,用于自适应比特率流式传输
什么是 HLS? HTTP Live Streaming(HLS)是苹果公司开发的一种协议,用于在互联网上无缝传输音频和视频内容。它的工作原理是将内容分解成小的、可管理的片段,并通…
-
什么是 1440p 分辨率?1440p VS 1080p VS 4K 区别
说到视频分辨率,1080p 和 4K 可能是最常见的术语。不过,还有一种分辨率也越来越受欢迎,那就是 1440p。在本文中,我们将全面介绍 1440p 分辨率。什么是 1440p …
-
从笨拙到出色:改善 Discord 上的视频质量,在 AMD GPU 上上线
Discord 的 Go Live 功能旨在以足够低的延迟带来高质量、高帧率的游戏或应用程序流,让观众可以与流媒体实时对话和互动。点击这里查看我们第一篇关于 Go Live 的博文…
-
在 OpenCV 中优化 RTSP 视频处理:克服 FPS 差异和缓冲问题
在 OpenCV 中进行视频处理时,开发人员经常会遇到与保持帧速率一致和处理缓冲问题有关的难题。无论是处理本地视频文件,还是处理来自 RTSP 流等远程源的流媒体,确保流畅播放和准…
-
高效视频超分辨率的结构化稀疏学习 | CVPR 2023
视频超分辨率(VSR)模型的高计算成本阻碍了它们在资源有限的设备上的部署,例如智能手机和无人机。现有的 VSR 模型包含大量冗余滤波器,影响了推理效率。为了修剪这些不重要的过滤器,…
-
使用人脸识别 SDK 强化您的项目:开发人员必须具备的 9 个功能
从提高安全性到改变客户体验,人脸识别 SDK 在各种计划中都至关重要。这项突破性技术已迅速进入广泛的应用领域,为各行各业提供了更高的效率、便利性和安全性。人脸识别 SDK 是这一转…
-
短剧平台如何从视频侧节省带宽/分发成本?
前几日,扬帆出海在其短剧社群内发起了一场【快问快答】活动,微帧作为嘉宾就《短剧平台如何从视频侧节省带宽/分发成本》话题做出了分享,以下是主办方收集的短剧行业从业人员较为感兴趣的6个…
-
使用 GPU 进行视频渲染和处理的优势
如今,视频渲染、编辑和处理已司空见惯。尽管企业正在广泛使用视频广播来展示其产品和服务,但它们加入这一行列的时间较晚。内容流和社交媒体服务的普及让人类第一次集体领略到视频编辑和处理的…
-
Reparo:低速网络中通过智能帧恢复的QoE感知实时视频流传输 | MM2023
本文设计了一种新的实时视频流传输方法Reparo,旨在提高用户在低速网络中的QoE。在上传客户端方面,Reparo 丢弃视频帧,使其不会被编码或传输。为了决定应该丢弃哪些帧,我们设…
-
将slowdown作为拥塞控制公平性指标 | HotNets 23
本文介绍了一种新的互联网拥塞控制公平性评估框架,传统的拥塞控制公平性评估主要侧重于流量速率公平性,但这并不总能反映不同用户的实际需求,因为用户更关心的是流完成时间(FCT)。因此,…
-
视频秒播优化方法及实践
视频起播时间,即首帧时间,是视频类应用的一个重要核心指标,也是影响用户观看体验的核心因素之一。如果视频要加载很久才能开始播放,用户放弃播放甚至离开 App 的概率都会增加。 视频秒…
-
隐式视频表征的范式变革:基于条件解码器的通用增强框架
本文介绍本课题组最近一篇隐式视频表征(NeRV, Neural Representations for Videos)领域的工作,《Boosting Neural Represen…
-
通过 5G 网络提供沉浸式 360° 视频 | RTC @scale 2024
5G 和边缘计算正在为沉浸式媒体如 360° 视频等带来新的用户体验。这些内容是实时创建的,同时也使用了上行和下行链路。在本次演讲中,我们展示了使用英特尔 Open WebRTC …
-
如何计算视频会议带宽需求
视频会议现已成为企业协作的主流。在许多情况下,它是员工、合作伙伴和客户参与的主要手段。 Metrigy 对 1400 多家公司进行的 “工作场所协作调查“。 Metri…
-
视频结构化是什么意思?视频结构化可以实现哪些功能
视频结构化是什么意思? 视频结构化是一种技术过程,它涉及将视频内容转换为结构化数据,使得计算机和人类都能更轻松地理解和处理这些信息。在视频结构化过程中,视频内容被分析、识别和提取,…
-
用于实现真实世界时间一致性视频超分的运动引导潜在扩散模型
最近,扩散模型在为图像增强任务中生成逼真细节方面表现出了令人信服的性能。然而,由于扩散过程具有随机性,因此很难控制还原图像的内容。将扩散模型应用于 VSR(Video Super-…