技术文章
-
了解 WHIP、WHEP 和 Media Over QUIC:为什么它们在 2024 年很重要?
WHIP、WHEP 和 Media Over QUIC 协议可显著影响实时通信和直播流媒体服务的效率、可靠性和质量。这些协议并不只是流行语,它们代表着我们在处理、交付和体验实时媒体…
-
Vec-Tok-VC+: 双重训练策略下基于渐进式损失约束和残差增强的鲁棒零样本语音转换 | INTERSPEECH2024
零样本语音转换 (zero-shot voice conversion) 旨在保留语言内容的同时,将源说话人语音转换成任意目标说话人的语音。随着深度学习技术的引入,零样本语音转换技…
-
音频技术在虚拟现实及增强现实中的应用
在当今数字化时代,虚拟现实(Virtual Reality,VR)和增强现实(Augmented Reality, AR)技术正迅速成为创新交互体验的前沿。这些技术通过模拟或增强用…
-
Vulkan 交换链
什么是交换链? Vulkan 交换链(Swapchain)是 Vulkan 应用程序与窗口系统之间的一座桥梁,负责将渲染结果呈现给用户。 换个说法,交换链是一种图元绘制结果呈现的机…
-
OvenMediaEngine 直播,LL-HLS 和 WebRTC选项以及 SRT 和 RTMP 采集测试
本文将重点介绍来自 AirenSoft 的开源流媒体服务器 OvenMediaEngine,并探讨其为直播流媒体提供毫秒级延迟的功能。文章还将介绍 OvenMediaEngine …
-
通过 Docker 在 Django 中使用 Celery,Redis 和 WebSocket
在本文中,我将在 Django 的一个非常基本的任务中使用 Celery、Redis 和 WebSocket,并告诉你它们的工作原理和设置方法。 首先,请允许我解释一下我们的简单任…
-
面向不平衡运动:基于部件解耦的视频人像分割方法 | 北航于天舒,夏长群,李甲
研究意义 视频人像分割(Video Portrait Segmentation, VPS)旨在从连续的视频帧序列中发现并分割出所有的显著前景人像。该技术在视频创作领域展现出了广泛的…
-
OpenSIPS 3.6 中的 Amazon DynamoDB 集成
Amazon DynamoDB 是一种 NoSQL 数据库,旨在应对关系数据库的扩展和操作挑战。DynamoDB 旨在为全球应用程序提供高可用性和弹性。DynamoDB 具有自动扩…
-
使用 RecordRTC.js 库流式传输音频
RecordRTC.js 是一个方便的 JavaScript 库,可让您直接从浏览器录制音频和视频。通过使用 WebRTC 技术,它能让捕捉音频、视频甚至屏幕录制等媒体流变得超级简…
-
Vulkan SC 1.0.15 发布:SPIR-V 验证和适用于桌面系统的新 NVIDIA 驱动程序可用
2024 年 6 月 21 日,Khronos® 集团的 Vulkan® SC™ 工作组发布了 Vulkan SC 1.0.15 规范,这是“Vulkan Safety Criti…
-
RK平台H264编码参数调试问题汇总
之前研发童鞋在RK3399平台上调试 MPP编码框架进行1080P分辨率编码传输时,碰到几个问题导致画面有马赛克,主要包括以下几个方面: 问题描述: 针对上面问题,经过查看具体编码…
-
Vulkan 窗口表面(Surface)
窗口表面 Vulkan 是一个平台无关的图形 API ,这意味着它不能直接与特定的窗口系统(如 Windows、Linux 或 macOS 的窗口系统)交互。 为了解决这个问题,V…
-
如何使用 React 和 Node.js 制作视频通话应用程序
视频通话已成为许多应用程序的基本功能,可实现个人和专业用途的实时通信。在本文中,我们将使用 React 作为前端、Node.js 和 Socket.io 作为后端来创建一个视频通话…
-
在 Kotlin 中使用 WebRTC 和 Firebase 构建视频通话应用程序
项目概述 本文分享的视频通话应用程序由两个主要部分组成: 我们将使用 Hilt 进行依赖注入,Kotlin 协程进行异步编程,并采用简洁的架构方法来保持代码的模块化和可维护性。 设…
-
mipi协议:Low Level Protocol(1)
大家好,由于之前不是有讲解sensor底层驱动的内容不,但是对mipi传输数据是如何进行的,不太清楚,所以,今天这篇文章来开始翻译的官方mipi_CSI-2_specificati…
-
MPEG 将 glTF 2.0 扩展并集成到 MPEG-I 场景描述 ISO/IEC 23090 中
标准开发是标准开发组织 ( SDO ) 内部,和跨组织高度协作的工作。我们积极参与 3GPP 和 MPEG 工作组,我们为 3GPP 在移动应用方面所做的工作,激励我们应对 MPE…
-
Vulkan 图像视图 VkImageView
众所周知,Vulkan 编程的代码量相对于 OpenGL 多了一个数量级(不用害怕,后面Vulkan封装一下,用起来也会非常简洁),本文避免一上去就讲一大堆代码,奉行概念先行。 概…
-
HarmonyOS 音视频之音频采集实战
背景 应用开发过程中很多场景都有音频采集需求,比如聊天功能的发送语音功能,实时语音转文本功能,实时语音通话,实时视频通话等。在Android和iOS端,系统提供了两种形式: 系统还…
-
小程序即时通讯(ZIM) 2.17.0 版本发布:新增内容审核、会话标记等功能
8月初,ZEGO 小程序即时通讯 SDK 发布了 2.17.0 版本。 小程序即时通讯 SDK 新增功能: 1. 内容审核 无需额外开发,即可实现对消息的安全审核。 详情请参考 内…
-
保护 WebRTC:确保实时通信的隐私和安全
在前面的文章中,我们探讨了 WebRTC 的核心组件,包括 RTCPeerConnection 和 RTCDataChannel。现在,让我们把重点转向 WebRTC 中安全和隐私…