技术文章
-
OBS推流工具介绍及桌面录屏推流功能实现
流媒体开发工程中,我们除了使用ffmpeg等工具辅助调试外,还经常使用OBS采集真实的音视频流,进行相关流媒体的流程模拟和调试,本文主要介绍一下OBS基本使用及使用OBS推送实时桌…
-
音频文件格式 Vorbis 编解码
上一篇介绍了OGG音频文件格式,其中涉及到Vorbis编解码,有网友反馈需要介绍一下,所以就查找了一些资料,本文做一下相关内容介绍。 Vorbis 介绍 Ogg Vorbis 是由…
-
AI 可以为 WebRTC 视频应用程序做什么?
人工智能和机器学习可以为您的 WebRTC 应用程序带来众多优势,增强其功能和用户体验。以下是人工智能可以使您的 WebRTC 应用程序受益的一些方法。 语音识别 AI 驱动的语音…
-
什么是VVC?关于 VVC 架构、工具、性能及部署等
本文整理了 Alan Stein 在 Streaming Media East 2023 关于 VVC 的介绍,包括了架构、工具、性能、部署、流媒体等内容。 什么是VVC? VVC…
-
什么是音频中的动态余量?(录音、混音和母带制作)
动态余量是音频技术中的一个基本概念,在数字录音时代经常被忽视,尤其是对于初学者来说。了解音频的基础知识,包括动态余量的定义,将增强您的知识,并最终增强您处理音频时的技能。 什么是音…
-
屏幕图像超分中的B样条纹理系数估计 | CVPR 2023
随着多媒体应用的快速发展,屏幕内容图像(SCI)已在人们日常生活中频繁出现。但是显示设备和SCI之间经常发生分辨率不匹配,并且,SCI有着边缘薄而锐利等特点,与自然图像很不同。然而…
-
苹果AR专利详细分享扫描对象以生成相应3D模型的解决方案
对于AR,扫描对象以生成相应的3D模型是一个重要的过程。所以在名为”Systems and methods for processing scanned objects“的专利申请…
-
Opengl ES之颜色混合
关于混合,其实我们在之前的文章中也有使用到混合的功能了,例如在 Opengl ES之水印贴图 使用混合实现水印贴图。 什么是颜色混合? 颜色混合就是把两种颜色按某种规则混合起来得到…
-
面向大规模实时视频流的Overlay路由决策算法
实时通信(Real-Time Communication, RTC)是一类为用户提供实时的音视频通信服务的互联网应用,包括视频会议、网络电话、互动直播、云游戏、远程控制等形式,应用…
-
基于混合Transformer-CNN结构的学习图像压缩
大多数现有的学习图像压缩方法是基于 CNN 或基于 Transformer 的,它们具有不同的优势。如何有效的利用这两种方法的不同优势是一个值得探索的方向,而这面临着两个挑战:一是…
-
B站幻星数字人3D渲染技术揭秘
一 幻星数字人简介 幻星数字人是天工制作部联合人工智能平台部虚拟人算法组打造的3D数字人解决方案,主要由工业化数字人智能生成管线+AI驱动的表情与动作捕捉系统两部分构成。如上图所示…
-
使用 Spring Boot 的 WebRTC 信令服务器示例
在本文中,我将介绍如何构建一个用于 WebRTC 聊天应用程序的简单信令服务器。我还没有找到很多关于这个主题的文章,所以希望这篇文章能帮助你对 WebRTC 聊天应用程序中的信令操…
-
什么是MV-HEVC?MV-HEVC有什么新特性
什么是MV-HEVC? 针对3D视频、尤其是多视点拼接3D视频的新特性,JCT-3V标准专家组成立,并在2014年发表了适用于3D多视点视频编码的HEVC编码标准扩展:MV-HEV…
-
为可穿戴设备用户提供空间音频导航系统 | 苹果空间音频新专利
近日,美国专利商标局正式授予苹果一项与空间音频导航相关的专利,该专利将在未来的AirPods、智能眼镜和更轻量级的Vision Pro上使用。该系统通过双耳音频设备播放指向性音频,…
-
使用 Javascript、Python 和 WebRTC 构建远程桌面应用程序
本文分享使用 Javascript、Python 和 WebRTC 构建远程桌面应用程序。 要开发远程桌面应用程序,我们需要Electron,在“Electron”的帮助下,可以使…
-
苹果专利分享针对AR/VR头显体验的空间音频渲染
对于沉浸式体验,生成多通道扬声器驱动信号的空间音频渲染对于提升真实感而言非常重要。例如,一个声音信号可以通过电子处理来产生一个虚拟的点源,并呈现为从听者的右边或左边的给定位置发出,…
-
PCC Priority:基于QUIC的优先级感知带宽分配框架
当前版本的QUIC不允许对多个流进行优先级带宽分配。在这封信中,我们提出了一种新颖的框架,即“面向优先级的拥塞控制优先级”(PCC Priority),以支持对QUIC流的优先级感…
-
重塑和改善直播 OTT 体验
提供高质量的 OTT 直播体验一直是一个有趣的挑战。作为最终用户,我一直渴望获得一流的直播体验,其中包括以下几点: 除此之外,作为 OTT 解决方案提供商,我们始终需要注意随着用户…
-
详解rocketMq通信模块&升级构想
本文从开发者的角度深入解析了基于netty的通信模块, 并通过简易扩展实现微服务化通信工具雏形, 适合于想要了解netty通信框架的使用案例, 想了解中间件通信模块设计, 以及微服…
-
F-LIC:基于FPGA的细粒度管道的学习型图像压缩
本文提出了一种细粒度流水线结构,以实现较高的 DSP 效率。此外,还开发了级联 DSP 和跳零解卷功能,以提高硬件性能。 来源:2022 IEEE Asian Solid-Stat…