技术文章
-
什么是Dash协议?Dash协议解析
什么是Dash DASH,又叫MPEG DASH,DASH:Dynamic Adaptive Streaming over HTTP ,是由MPEG和ISO批准的独立于供应商的国际…
-
GeNVS:基于3D扩散先验的生成式新视角合成
本工作提出了一种基于扩散的3D-aware生成式新视角合成模型,即使只有一张输入图像,本模型也能够从可能的渲染分布中采样,生成与输入一致的多样化且真实的新视角。本方法利用现有的2D…
-
2023年全球即时通讯(IM)PaaS 市场洞察白皮书
核心摘要: IM PaaS是基于互联网通信原理的即时通讯平台服务。《2023年全球即时通讯(IM)PaaS市场洞察白皮书》针对IM PaaS行业的发展历程、核心价值、主要功能及商业…
-
使用 FFmpeg 提取帧的综合指南
作为一个在研究或咨询项目中使用 FFmpeg 的人,我曾面临过从视频中提取帧的需求。无论您是需要抓取第一帧、提取所有帧,还是获取带有特定时间戳的精确帧,FFmpeg 都能满足您的需…
-
什么是路由?Kamailio中的路由
路由这个词,一般人可能既熟悉又陌生。熟悉的是,基本上家家都有个路由器;陌生的是这个路由器跟我们这里说的路由是一个东西吗? 路由,对应的英文是Route,即选路的意思。家用的路由器也…
-
相机标定是什么?相机标定有什么意义
相机标定含义(解决什么是相机标定) 在图像测量过程以及机器视觉应用中,为确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,必须建立相机成像的几何模型,这些几何模型…
-
深度学习语音分离算法
语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。 它的主要目标是从带噪语音中提取尽可能纯净的原始语音,提高语音质量…
-
webrtc 的TaskQueue任务队列实现
分享webrtc中任务队列的实现,见文件:rtc_base\task_queue.h。 TaskQueue 定义 具体实现: 创建一个 TaskQueue 具体过程: TaskQu…
-
轻松实现实时通信:如何使用 Django 创建基于 WebSockets 的自定义 API
还记得《老友记》里钱德勒和乔伊在网上打游戏,却一直被罗斯和瑞秋打断的那一集吗?如果他们有一个实时聊天应用程序就好了,他们就可以互相交谈,而不是隔着公寓大喊大叫。 在深入了解 Dja…
-
用于VOD的VVC编码 | Streaming Meida East 2023
本演讲对 VVC 编解码的工作原理、目前的优化方向以及已有工作的发展情况进行了介绍。此外,还将 VVC 与其他编解码方式进行了细致的比较。 来源:Streaming Meida E…
-
如何使用 FFmpeg 循环播放视频 – 分步教程
FFmpeg 是迄今为止视频和音频处理领域最重要的视频、图像和音频处理和操作工具。这款功能强大的开源软件套件可以完成媒体行业所需的基本任务,无论多么复杂或简单。其中一项任务就是循环…
-
IoT 通信和系统管理
智能零售货柜是一种结合了物联网、人工智能和大数据技术的现代化零售设备。它具有自动售货、库存管理、支付结算、数据分析等功能,能够提供更便捷、高效的购物体验。 1 网络 上述是IoT平…
-
直播+X——直播行业新趋势
编者按:人类对感受与体验的不断追求,趋势音视频技术迅猛发展,音视频服务以前所未有之势被各行业强烈需要。如今,直播已然是一个所有人耳熟能详的名词,直播业务和生态,以及关键支撑技术,都…
-
算力网络应用中的广域局域网技术探讨
算力网络可看作是云计算和网络深度融合的高阶2.0版本,旨在打造“一点接入、即取即用”算力服务,让算力如水、电、暖、燃气一样流入千家万户,成为人们日常生活的第五种必备生产资料。算力网…
-
基于即构Flutter直播sdk快速实现直播功能
前文我们介绍了Flutter直播sdk集成指引,在此基础上,本文将介绍如何基于ZEGO Flutter直播sdk快速实现一个简单的直播功能。 Flutter直播相关概念解释 Flu…
-
在 C# 应用程序中使用 SignalR 进行实时通信:初学者指南
SignalR 是一个用于 ASP.NET 和 .NET 的开源库,它通过 Web 套接字协议提供服务器和客户端之间的双向通信,从而简化了实时 Web 应用程序。SignalR 使…
-
如何使用 WebRTC 和 Firebase 在 React Native 上实现视频通话应用程序
欢迎阅读本综合指南,了解如何使用 WebRTC 和 Firebase 在 React Native 上轻松创建视频通话应用程序。在本教程中,我将一步步带您开发自己的实时视频通信平台…
-
基于极大熵准则的鲁棒信道估计 | 胡正阳, 薛江等
研究背景 信道估计是信号处理中重要且基础的问题之一,尤其是考虑到未来无线通信系统中更高精度的要求。传统的信道估计算法研究主要基于噪声白高斯假设,这限制了传统算法在真实无线通信场景下…
-
CN-Celeb-AV: 多场景视听多模态数据集发布
近日,清华大学语音和语言技术团队联合北京邮电大学发布了中国明星多场景音视频多模态数据集 (CN-Celeb-AV),供音视频多模态身份识别 (AVPR) 等领域的研究者使…
-
心理声学声掩蔽效应及应用
一、声掩蔽效应的定义 由于某个声音的存在而使人耳对别的声音听觉灵敏度降低的现象,称为“声掩蔽效应”。当人耳在倾听一个声音的同时,如果存在另一个声音,就会影…