技术文章
-
百度iOS端长连接组件建设及应用实践
在过去的十年里,移动端技术飞速发展,移动应用逐渐成为主要的便捷访问和使用互联网的方式,承接了越来越多的业务和功能,这也意味着对移动端和服务器之间的通信效率和稳定性提出了更高的要求。…
-
使用基于 CNN 的定位器进行对象定位
对象定位是指精确识别和定位图像中感兴趣的对象的任务。它在计算机视觉应用中发挥着至关重要的作用,可实现对象检测、跟踪和分割等任务。在基于 CNN 的定位器中,对象定位涉及训练卷积神经…
-
虚拟语聊房Demo及示例源码运行指引
虚拟语聊房是元宇宙场景里一种新颖的语聊玩法,通过虚拟形象代替真人出镜,进行互动连麦语聊。在延续真人神秘感的同时,增加麦上用户之间的互动性,支持表情随动、声音驱动等多种 AI 驱动模…
-
视频会议应用中的人工智能集成架构
随着机器学习(ML)技术的最新改进,特别是生成算法和大型语言模型的改进,越来越多的会议应用正在将这些功能添加到其产品中。 这种ML技术可在两个不同层面应用于会议应用:基础设施层面,…
-
学习 WebRTC 的正确姿势?“碰碰运气”的方法不适用于 WebRTC 应用
WebRTC 如今可能无处不在,但使用它进行构建仍然很难。许多人试图依赖 Stack Overflow 中的代码片段,而不了解 WebRTC 的基本理论和流程。这可能是一种冒险的尝…
-
基于 QUIC 的 HTTP 自适应流媒体的可扩展高效视频编码 | EPIQ 2020
HTTP/2已经被广泛研究用于自适应视频流传输,但仍然存在由于TCP引起的先行阻塞和三次握手延迟的问题。与此同时,运行在UDP之上的QUIC可以解决这些问题。此外,尽管已经提出了许…
-
分布式UUID的生成策略及应用场景浅析
UUID是国际标准化组织(ISO)提出的一个概念。UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识。本文将从UUID的构成方式、现行版本、生成策略、应用案例等方面作介绍…
-
FFmpeg 中 Libavutil 和 libavcodec库的方法和功能
ffmpeg还提供一系列的库,能提供开发者进行编码开发。其中 libavutil 是一个包含用于简化变成的函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。l…
-
基于真实环境的元宇宙场景搭建关键技术发展态势研究
摘要:基于真实物理环境构建的元宇宙场景是连接物理世界与数字世界的重要桥梁,也是实现数字孪生到虚实共生的重要途径。围绕三维重建、渲染等元宇宙场景搭建关键环节,总结了当前主流技术路径与…
-
WebRTC联播:谁决定在接收端选择哪一层?
在 WebRTC 中,接收端选择哪一层的决定通常由 WebRTC 实现和底层媒体堆栈来处理。适当层的选择取决于各种因素,例如网络条件、可用带宽和接收器的能力。 层的选择通常使用反馈…
-
利用WebRTC实现无缝实时通信
朋友们好,今天我们来谈谈WebRTC。首先,我将简要解释一下什么是WebRTC,然后我们将看看WebRTC的应用领域,以及我们为什么要选择WebRTC。 什么是WebRTC? We…
-
视频编解码器与视频容器的区别和用例
视频编解码器和视频容器在多媒体和流媒体中发挥着至关重要的作用。了解这些术语的区别有助于您在处理和分发视频内容时做出明智的决策。 本文将深入介绍视频编解码器和容器的基础知识,探讨它们…
-
深度学习在语音增强中的应用
随着科学技术的发展,语音作为新一代人机交互方式,成为人和智能设备、语音助手交流的重要接口,然而在真实环境中,语音信号不可避免的被各种噪声所干扰,除了各种环境噪声,声波在封闭空间中的…
-
在OpenCV中进行图像预处理
今天,我们进一步深入,并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。 什么是形态学操作? 形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处…
-
相机APP 如何选择合适的分辨率?
影响相机画面效果的因素有很多,分辨率就是其中一个因素,1080p和720p的效果对比,画面清晰度等差别还是挺大的。 这篇文章主要分下面几点展开: 做camera效果tuning调试…
-
OpenGL ES 3.0 怎样将着色器程序二进制化
之前有位 VIP 读者提问:C++ 如何将 OpenGL ES 的着色器程序二进制(保存),然后在其他地方加载使用?现在写篇文章介绍下。 将着色器程序二进制化(Shader Pro…
-
音视频工具–Onvif设备管理器
ONVIF 设备管理器 (ODM) 是一款免费的开源软件实用程序,旨在管理符合 ONVIF 标准的网络视频设备,例如 IP 摄像机、视频编码器和网络录像机 (NVR)。ONVIF …
-
WebRTC NetEQ分析:架构和核心模块
1.NetEQ简介 NetEQ 本质上就是一个音频的 JitterBuffer(抖动缓冲器),全称是 Network Equalizer(网络均衡器), GIPS 语音引擎的两大核…
-
多模态算法在AIGC视频生成中的应用
随着抖音、快手、B站等视频平台的崛起,视频内容正占据着用户越来越多的时间。对于各个平台来说,内容视频化趋势明显。对于之家来说,也需要尽快完成在该赛道的技术工作。对于AIGC视频生成…
-
音视频领域强大的辅助工具-ffmpeg常用操作介绍
前段时间老是有人问我,有没有其他格式的视频或音频提供,愿意有偿获取,如果其对ffmpeg比较熟悉,就不会那么麻烦。经常从事流媒体领域开发和研究工作的人,ffmpeg应该是我们最常用…