技术文章
-
深度分层视频压缩 | AAAI 2024
最近,直接对连续帧中潜在特征的条件分布进行建模以消除时间冗余的概率预测编码已经产生了有希望的结果。使用单尺度 VAE 的现有方法必须设计复杂的网络来进行潜在空间中的条件概率估计,而…
-
实时传输协议 (RTP)的两大基础设计理念-应用层帧框架和端对端原则,麻省理工两篇论文奠定了RTP的基础
我们讨论RTP传输协议时,首先需要了解此传输规范当初的设计理念或者时间思想,这是任何技术知识框架的基石。针对RTP传输协议,我们需要先了解其两大设计理念,在这个设计理念的基础上,我…
-
FFmpeg音视频解复用+解码
音视频的解复用(Demultiplexing)是一个将单个输入媒体文件分离成不同音频、视频和其他数据流(如果有的话)的过程。这些单独的流之后可以被独立地读取、解码或处理。 FFmp…
-
关于图像过曝问题的排查思路
1、问题背景 读者提问,图像在室外遇到过曝的问题,有什么排查思路和改善方法。 2、问题分析 1)先检查一下sensor驱动,对照 sensor datasheet 确认下最小曝光行…
-
2024年全球互联网通信云(IM+RTC)行业研究报告
全球互联网通信云(IM+RTC)丨研究报告 核心摘要: 最新动态 从应用场景上看:社交娱乐场景融合加速,游戏和社交是场景融合的主要阵地。 从开发者需求上看:1)开发者出海加速,面临…
-
实现 WebRTC 的可观测性
WebRTC 解决方案中经常被低估的一个方面是媒体质量监控。我们需要记住,我们构建实时解决方案不仅仅是为了进行音频和视频通信,而是为了提供尽可能好的体验。为了确保做到这一点,我们需…
-
视频黑屏是什么原因?视频黑屏的解决方法
视频黑屏是音视频应用中一个表示视频无法正常播放或显示的现象。视频黑屏也是实时音视频开发中的一个常见问题。本文将专注于 “视频黑屏” 这一问题,详细分析可能导致此问题的原因,并为开发…
-
10 分钟了解 WebSocket
什么是 WebSocket WebSocket 是一种通信协议,允许客户端和服务器之间通过单个 TCP 连接进行实时数据传输。 WebSocket 就好比您与好友之间畅通的电话线。…
-
FunASR 升级第三代热词方案
在使用语音识别服务进行语音转文字的过程中,大多数情况下模型能正确地预测高频词汇,但是对诸如人名地名、命名实体等词频较低或与用户强相关的词汇,模型往往会识别为一个发音相近的其他结果,…
-
如何克服现场制作中的 5G 容量和延迟问题
将 5G 用于现场制作的主要考虑因素是什么?DPP 的技术专家战略家 David Thompson 为您介绍采用 5G 时的关键要点和潜在隐患。 5G 和向无线制作的过渡被誉为有可…
-
使用 C++ 和 OpenGL 创建 3D 渲染引擎的分步指南
在计算机图形世界中,3D 渲染引擎发挥着至关重要的作用,让虚拟世界栩栩如生。如果您是一名崭露头角的游戏开发人员或图形爱好者,希望深入了解三维渲染世界,那么创建自己的渲染引擎将是一次…
-
实时传输协议 (RTP)收发流程概览-1
因为现在主流的IP网络部署使用SIP协议比较多,因此RTP和SIP应用相对比较紧密。很多时候,我们花费大量时间讨论SIP协议和传输等问题,没有太多关注RTP流的处理。这里,我们单纯…
-
什么是音画不同步?音画不同步怎么处理
音画不同步是许多开发者经常遇到的一个棘手问题。当音频和视频数据不完全同步时,使视频播放显得非常不自然,观众会有很差的观看体验。因此,了解其原因并掌握相应的解决策略显得尤为重要。 什…
-
音频开发中常见的音频卡顿/杂音类型
在音视频开发的世界中,音频卡顿/杂音是一个常见而又棘手的问题。当我们追求高品质的音频流、实时通信或音乐应用时,这个问题就会频繁出现。 杂音是主观体验的概念,技术上常称为音频卡顿,“…
-
使用 Golang、Fiber/Websockets 实现简单的群聊功能
本文基于 Golang + WebSocket 实现简单 “群组 “聊天功能,许多其他文章都使用一个简单的聊天示例来探讨 WebSocket。但是,有时一个…
-
使用 OpenSIPS 3.5 构建 IMS – S-CSCF(第 1 部分)
OpenSIPS 3.5 开发计划的主要重点是促进和提供所需的工具,以构建稳健、可投入生产的行业级 IMS 解决方案。为此,我们一直在开发 OpenSIPS 3.5 的新特性和功能…
-
ViT-Adapter: 密集预测任务的ViT适配器
本项研究为 Vision Transformer(ViT)设计了一种简单但功能强大的密集预测任务适配器。与最近将视觉特定感应偏差纳入其架构的先进变体不同,普通 ViT 由于先验假设…
-
HQoS和QoS是什么?HQoS和QoS的区别
作为网络从业者或者学习者,大家对QoS肯定不陌生,但是HQoS,您有听过吗?本文,就带大家了解一下HQoS,分析一下HQoS和QoS区别。 HQoS和QoS的基本概念 QoS(Qu…
-
如何混音?音频混音入门指南
混音是一个在音乐行业之外鲜为人知的过程。即使是音乐超级爱好者,他们往往知道自己喜爱的唱片制作人的名字,却很少知道是谁混音的。那么,这个过程到底是什么呢?你能自己完成吗?从哪里开始?…
-
AV1 终于在 WebRTC 上起飞了?
AV1 在 Chrome 浏览器中可用已有几年,但还没有任何大型 WebRTC 服务使用它。几个月前,我们还在 Google Meet 中看到了一些 AV1 实验的迹象,但看起来还…