技术文章
-
AI音质修复 | 人工智能与声学
随着耳机、车载等音频平台迅猛发展,各厂商除在ANC, ENC, KWS, SV, ASR, TTS等常规功能开展竞争之外,在音质方面也逐步提高标准。无损音乐经编码、蓝牙传输后,如何…
-
如何打造音视频极致消费体验
在观看视频时,用户最看重的是什么呢?清晰度?流畅度?还是播放时的稳定性?作为视频厂商,不仅要考虑到常见的指标,一些关乎用户体验的隐藏性指标也需要重点关注。如何持续升级优化代码并在成…
-
音视频问题汇总–SDP和编码参数
问题背景 研发端小伙伴提报一个问题,在RTSP监控一台IPC时候,无法正常显示视频,一直处于黑屏中,需要协助一下。 为了快速确认问题所在,我们尝试了多个平台进行交叉验证,包括And…
-
WebGPU:下一代 Web 图形和计算 API
WebGPU 是一种新兴的 Web 标准,旨在为现代图形和计算应用提供高性能、低功耗的 API。本文将介绍 WebGPU 的背景、特点、用途以及和 WebGL 的对比。 WebGP…
-
浅谈GPU的Web化—WebGPU
Labs 导读 2023年4月6日,历经6年的标准制定与开发,chrome浏览器在其113版本正式发布了WebGPU,标志着Web端正式进入GPU的新时代,旨在提供“现代3D图形和…
-
自适应帧率的高质量实时通信 | NDSI 2023
新兴的高质量实时通信(RTC)应用传输超高清晰度(UHD)高帧速(HFR)视频流。在传输过程中使用边缘计算传输高带宽和低延迟流。我们从一个最大的游戏公司的云游戏平台进行测量,结果表…
-
Python 图像分析:两个圆圈的故事
在本文中,我们将使用 Python、OpenCV 和 matplotlib 进行图像分析。 我们的任务是探索包含两个不同大小的神秘圆圈的有趣图像,并深入研究量化和可视化它们之间差异…
-
微软AR/VR专利探索光通信技术改善RF通信的通信干扰问题
头显设备通常结合用户的周围环境向用户的眼睛投射或以其他方式提供虚拟图像。为了需要提供这样的功能,头显必须确定自己的位置、用户的位置、附近有什么物体以及用户在看什么。作为响应,头显可…
-
突破kamailio/OpenSIPS性能瓶颈的8个方向
呼叫系统系统性能决定呼叫处理的cps,当然cps决定系统效率,决定公司营收。尽管kamalio处理性能已经非常强大,但是在实际生产中仍然需要面对性能瓶颈的问题。如果从比较高层的li…
-
Web3和DAO:研究和教育领域的发展和实施可能性概述
Web3 带来了一组支持技术,有可能彻底重塑许多不同领域,包括研究和教育。今天,我们面临着监管、数据安全和隐私以及治理和官僚主义等方面的挑战——仅举几例。随着 Web3 在全球范围…
-
浅析主动降噪技术——给世界装上静音键
4月26日是国际噪音意识日(Noise Awareness Day),在这一天,Apple公布了和密歇根大学合作展开的听力研究进展。自2019年开始,Apple就有意识地…
-
增强WebRTC视频流: 添加文本、图像和二维码
在《使用可插入流去除视频会议背景》文章中,我们向您展示了如何使用 MediaTrack API 的可插入流和WebCodecs API 的 VideoFrame 接口执行背景删除,…
-
HLS 播放列表中的 EXT-X-KEY 是什么?
在HLS 播放列表文件中,EXT-X-KEY标签指定用于解密媒体片段的方法。它告诉视频播放器如何检索必要的解密密钥来解锁加密的媒体片段并播放它们。 请注意,如果 HLS 媒体播放列…
-
车联网消息通信的关键变革:一文了解 QUIC 协议
什么是 QUIC 协议 QUIC(Quick UDP Internet Connections)是由谷歌公司开发的一种基于用户数据报协议(UDP)的传输层协议,旨在提高网络连接的速…
-
OpenGL Shader 颜色混合模式(Blend Mode)
在之前的文章中提及了 Shader 中的颜色计算,介绍了一些基本的颜色混合计算,然而在实际的 Shader 滤镜中,简单到加减乘除并不能很好地还原出我们想要的效果,mix()也只是…
-
uniapp如何设置视频分辨率、帧率、码率等配置(uniapp音视频开发系列4)
本文分享即构 Uniapp 实时音视频 SDK 视频配置功能。 功能简介 在视频通话或直播时,开发者可以根据需要指定推流和拉流视频相关配置,如视频采集分辨率、视频编码输出分辨率、视…
-
5G网络能力开放安全架构和流程研究
5G网络能力开放的业务需求随着5G网络的规模商用正不断涌现,对网络能力开放的安全保障也逐渐成为运营商重点关注的问题,基于此,对5G网络能力开放的安全架构和流程进行了研究。首先,介绍…
-
WebRTC 之 FEC、RED、PLC、RTX和其他缩写所起的作用
WebRTC media resilience 如何工作?什么是FEC、RED、PLC、RTX,以及为什么需要它们来提高实时通信的媒体质量。 网络本质上是挑剔的,媒体编解码器更是如…
-
连续可变码率的非对称增益深度图像压缩 | CVPR 2021
本文提出了一个连续码率可调的深度学习图像编码框架,即非对称增益变分自动编码器(AG-VAE)。AG-VAE利用一对增益单元在一个单一的模型中实现离散可变码率,其额外的运算量可以忽略…
-
使用 OpenCV 的 SIFT 图像特征提取和匹配
图像特征提取和匹配是计算机视觉和图像处理中的重要任务。它们在图像识别、目标检测和图像拼接等各种应用中发挥着至关重要的作用。 一种流行的特征提取算法是尺度不变特征变换 (SIFT),…