技术文章
-
使用 Solid JS + Node JS + Websockets 创建聊天应用
本文分享如何使用 Solid JS + Node JS + Websockets 创建一个聊天应用程序。 流程: 先处理房间,因为需要它们来进行消息传递。 房间 先给房间取个名字,…
-
比赛精彩呈现的背后:低时延直播
前言:第19届杭州亚运会已经落下帷幕,中国代表团获201金完美收官,创造了新的历史。全球观众通过电视和低时延直播共同见证了新纪录的诞生。通过低时延直播先进技术,让每一个热爱体育的人…
-
OpenVidu:开源的 WebRTC 视频会议实时通信解决方案
什么是 OpenVidu? OpenVidu 是一个开源的 WebRTC 视频会议平台,旨在提供一种简单、高效、可扩展的实时通信解决方案。它基于Java 编写,使用了 W…
-
BVT:高性能多媒体算法推理基座
1 前言 随着人工智能技术的快速发展,B站已经有非常多的AI算法可以用来助力多媒体业务,诸如超分辨率、人脸增强、视频插帧、窄带高清等等。如今,以扩散模型(Stable Diffus…
-
MPEG 标准化路线图
为什么需要标准化路线图? MPEG 已经创建、并仍在制定多媒体标准,这使得庞大的市场得以繁荣。 路线图文档中包含了什么内容? MPEG 是什么?它做了什么? MPEG是一个由100…
-
Zixi 如何为 FuboTV 实现经济高效的超低延迟直播
广播行业正经历着快速的数字化转型阶段,而 IP 技术的应用则推动了许多以技术为先导的发展,事实证明,IP 技术是创新和提高效率的主要推动力。许多以前依赖传统工作流程的公司正在采用基…
-
iOS 不用 libyuv 也能高效实现 RGB/YUV 数据转换丨音视频工业实战
做音视频或图像处理方向的开发同学一般都或多或少接触过 libyuv[1] 这个开源库,我们在音视频开发中处理 YUV、RGB 等格式的数据转换、旋转、缩放时常常用到它。libyuv…
-
一种基于深度学习的啸叫抑制算法
扩声系统用于放大声音,其典型应用包括:多媒体电教室、本地会议系统、助听器和人工耳蜗等,该电声系统至少包括一个传声器、一个放大器以及声重放单元扬声器。当传声器与扬声器处于同一个声学环…
-
DECO:野外环境场景下的 3D 人体-场景的接触估计【ICCV2023】
本文介绍了研究人类如何使用身体接触与世界互动,以实现以人为中心的人工智能的重要性。文中提到,为了建模逼真和物理可行的人与物体互动,推断3D接触至关重要。然而,现有的方法要么专注于2…
-
超高速大容量光传输系统关键技术与产业发展研究
摘要:随着互联网新兴业务的兴起,数据流量迎来了爆炸式增长。围绕超高速大容量光传输系统中的超高速单波技术、扩展波段技术与新型光纤技术,详细介绍了其关键技术、发展现状以及相关产业发展情…
-
python套接字通信(Python适合套接字编程吗)
在本教程中,您将学习如何使用 Python 套接字编程和 Socket API 在客户端和服务器之间交换数据。 稍后,本教程将讨论如何使用托管提供程序在两个或多个 Python 客…
-
视频CDN是什么意思?视频CDN如何用于直播
对视频内容的需求改变了我们消费流媒体内容的方式。互联网的快速扩张推动了视频流媒体行业的发展。内容提供商寻求有效的解决方案来提供高质量的直播流媒体体验。整合视频内容分发网络(CDN)…
-
COMPASS:任意尺度空间可伸缩性的深度图像压缩 | ICCV 2023
近年来,基于神经网络的图像压缩得到了积极的发展,与传统方法相比,其表现出了令人印象深刻的性能。然而,大多数工作都集中在不可扩展的图像压缩上,而空间可扩展图像压缩虽然有很多应用,但却…
-
GB/T28181和SIP的区别
在一些系统融合的项目中,经常会遇到把GB/T28181和SIP混淆的问题,特别在项目实施配置时,视频监控的联网的很多参数都写成SIP,这给现场工程师造成了困扰。 GB/T28181…
-
FFmpeg 中对于 av 开头 API 的约束实现
当我们封装一个库给用户使用时,为了库的安全,通常会选择一定的命名规则提供给调用者使用,而有心的调用者通常也会做一定的猜测然后使用库里面隐藏的接口。FFmpeg 也是如此,有些API…
-
RobustNeRF: 从单张图像生成3D形状 | CVPR2023
简介:神经辐射场(NeRF)学习时数据包含不在图像拍摄期间持续存在的干扰物(如移动物体、光照变化、阴影)时,会出现伪影。为了处理这些干扰物,本工作提出一种用于NeRF训练的鲁棒性估…
-
怎样为ffplay添加硬件解码和渲染
为什么ffplay不支持硬件解码 ffplay是FFmpeg自带的播放器。也许你已经知道,ffplay不支持硬件解码 直接到渲染(支持少量硬件解码 + CPU拷贝再到SDL渲染方式…
-
呼叫中心技术的演变之路
呼叫中心,作为企业与客户互动的重要桥梁,已经经历了数十年的技术革新。从最初的模拟电话系统到今天的数字化、云化和AI驱动的平台,每一个技术进步都旨在更好地服务客户和提高效率。 1. …
-
音视频处理流程【音视频基础知识】
音视频处理流程 音视频通信是指将音频和视频数据从一个端点传输到另一个端点的过程。通常,音视频通信流程包括音视频采集、编码、传输、解码和渲染五个主要环节。 下面是更详细的描述: 音视…
-
FFmpeg直播和低延迟方向的进展
编者按:客户端作为直接面向用户大众的接口,随着技术的发展进化与时俱进,实现更好的服务是十分必要的。FFmpeg作为最受欢迎的视频和图像处理开源软件,被相关行业的大量用户青睐,而随着…