按时间归档:2022年
-
ECCV 2022 | PTSEFormer : 针对视频目标检测的渐进式时空增强模型
本工作由上海交通大学宋利教授带领的Medialab实验室成员产出,并被ECCV2022录用。本工作提出了一种基于Transformer的端到端视频目标跟踪算法框架。该框架使用上下文…
-
以兴趣匹配为根基 Soul式虚拟社交为社交元宇宙提供新思路
寻找志趣相投的朋友,获得认同感,是大多数年轻人社交的主要原因。Soul作为深受Z世代青睐的社交平台深刻洞察年轻人社交需求,以兴趣为根基,为年轻人打造一个轻松、畅快、安全的社交元宇宙…
-
元宇宙中的 RTC
主讲人介绍 Sriram Srinivasan:在 Meta 公司研究下一代音频技术(Next Generation Audio, NGA),前微软工程师Cullen Jennin…
-
全球6G产业及政策进展研究
摘要:5G商用开启万物互联的时代,6G将开启“万物智联、数字孪生”的全新时代,实现广泛的人、机、物智能互联。随着6G研究帷幕徐徐拉开,全球主要国家在6G领域战略布局动作频频,通过制…
-
让元宇宙成为线上社交玩法创意的新奇点(元宇宙落地玩法和方案解读)
“元宇宙”作为互联网未来的方向,开启了人们对虚拟世界社交的无限想象。 在探讨元宇宙社交的终极形态之外,或许还有一些问题值得探讨:技术更迭带来的新兴社交形态会以何种方式落地?有哪些已…
-
WebRTC常用架构(webrtc架构图解)
WebRTC虽然是一项主要使用p2p的实时通讯技术,本应该是无中心化节点的,但是在一些大型多人通讯场景,如果都使用端对端直连,端上会遇到很带宽和性能的问题,所以基于Webrtc的音…
-
ECCV 2022|码流信息辅助的压缩视频超分框架
本工作是由上海交通大学宋利教授带领的 Medialab 实验室与华为诺亚实验室合作产出,并被 ECCV2022 录用。该工作提出了一种利用视频的编解码信息来提升压缩视频超分辨率算法…
-
客户端实时超分,提升画质/码率的超级利器(实时互动RTI能力系列篇)
在短视频、直播、社交等并进的互动时代,“得画质者得人心”,超高清成为越来越多用户希望可以享受到的画质核心体验之一。 不管是音视频内容的生产商还是服务商,极致的画质体验已经成为获得用…
-
国内多方通信服务业务,多方音视频行业所需资质详解
多方音视频大致分为以下几类: 1、国内多方电话会议服务业务。是指通过多方通信平台和公用通信网把我国境内两点以上的多点电话终端连接起来,实现多点间实时双向话音通信的会议平台服务。 2…
-
喜马拉雅语音技术相关专利已达20多项,开启全新内容消费体验
作为在音频赛道深耕多年的专业级选手,喜马拉雅近些年一直在尝试用技术为内容生产赋能,平台在现有的“UGC + PGC + PUGC”内容生态之外,通过AIGC探索出了内容生产的新路径…
-
如何使虚拟现实体验更加真实?
本次IEEE VR 2022演讲总共介绍了 5 篇论文,在现有技术的基础上,分别针对不同方面进行了研究和改进,以增加用户在虚拟现实中的互动、感受和认知,以使 VR 体验更加真实。本…
-
OpenGL EGL:OpenGL 与设备的桥梁丨音视频基础
通过《一看就懂的 OpenGL 基础概念》一文,我们介绍了 OpenGL 的角色、渲染架构、状态机、渲染管线等内容,我们接着来看看它如何在设备上实现渲染。 EGL 我们这里只讨论 …
-
苹果新专利 | 基于头部到躯干方向的空间音频重现
近日,美国专利局公布了一份苹果专利申请,题为“基于头到躯干方向的空间音频重现”。Apple的专利涉及一种媒体系统以及一种使用媒体系统根据头到躯干方向重现空间音频的方法。该方法包括,…
-
FFmpeg filter浅析
filterFFmpeg的滤镜模块AVFilter是一种以管道的方式对音视频进行滤镜(filter)操作以添加特效功能的框架(filter翻译为过滤器更为合适,下面统一以“过滤器”…
-
谷歌会议将您置于下一次视频通话的前沿和中心位置
Google刚刚宣布了一个超级光滑的新更新,以便在您下次登录Meet视频通话时保持专注。 从在家工作订单开始两年多了,我们中的许多人仍在努力找出最终的WFH办公桌设置。首先,我们的…
-
火山引擎 RTC (实时音视频)智能驾驶远程车控方案
火山引擎 RTC(实时音视频)智能驾驶远程车控方案基于超低时延、稳定可靠、安全的实时音视频和实时信令服务打造,提供平行驾驶中多路视频实时通信、远程控制指令、视频录制与回看以及车辆与…
-
音视频无缝续播的解决方案
现如今互联网最火的两大领域一个是人工智能,另一个就是以抖音、火山小视频为首的短视频APP。我们在使用这些短视频APP的时候又一个很好的体验就是从一个视频的播放从一个界面跳转到另外一…
-
ijkplayer编译实践(基于MacOS NDKr10e)
众所周知ijkplayer是基于FFmpeg开发的一款开源播放器,既然是开源,我们直接在项目中引用不就完事了么,为什么需要自己编译? 这是因为官方默认的编译做了一些功能上的阉割,比…
-
火山引擎 RTC 自研音频编码器 NICO 实践之路
1. 前言 随着互联网技术的不断发展,越来越多的人开始尝试使用或者依赖实时音视频产品解决团队沟通与协作问题。在通话过程中,我们时常会遇到因为网络波动(如拥塞、丢包、延时和抖动等)而…
-
Mozilla Firefox 106发布带来WebRTC改进以及Wayland的屏幕共享
Mozilla Firefox 106.0 网页浏览器的最终版本在周二官方公布Firefox 106之前已经发布到官方服务器,这一版本对其PDF浏览器以及WebRTC通信支持进行了…